[글로벌 팩트6] 기계가 팩트체크를 시작했다

#팩트체크, '희망봉'을 찾아서
△ 뉴스래빗 '글로벌 팩트6' 참관기

▽ "팩트체킹 로봇, 지금 일하고 있다"
▽ 자동화 도전하는 풀팩트·체케아도
▽ AI 기계는 도울 뿐, 핵심은 '데이터'
남아프리카공화국 최남단 '희망봉'의 전경. 사진= 뉴스래빗
[편집자 주] 희망봉(Cape of Good Hope)은 과거 유럽인들이 아시아로 가기 위해 거치는 항로의 중간 지점이었다. 탐험가 바르톨로뮤 디아스가 1488년 처음 존재를 알렸다. 이후 새로운 경로를 개척하기 전까지 유럽과 아시아를 잇는 이정표 역할을 했다.

흔히 '가짜 뉴스(fake news)'로 통칭되는 '허위정보(disinformation)', '오정보(misinformation)' 등이 사회 문제가 됐다. 이에 따라 팩트체크가 중요한 과제로 떠올랐다. 언론, 기업, 정부, 개인까지 너나할 것 없이 팩트체크에 나서지만 깊이, 신뢰 모두 부족한 경우가 다반사다. 국내의 팩트체크 현실은 가짜 뉴스의 그것만큼이나 혼란하다.팩트체크에도 '희망봉'이 있을까. 뉴스래빗이 팩트체크의 미래를 찾는 탐험가가 되어 희망봉의 도시 남아프리카공화국 케이프타운으로 향했다.



"(팩트체킹) 로봇은 공상과학(sci-fi)이 아니다. 바로 지금, 매일 일하고 있다" (파블로 페르난데즈 체케아도 디렉터)


2019년 6월 남아프리카공화국 케이프타운에서 열린 글로벌 팩트체크 서밋 '글로벌팩트6(Global Fact 6)'의 주요 화두 중 하나는 '기술'이었습니다. 행사장이 위치한 케이프타운대학은 AI, 데이터 등 자동화 기술을 어떻게 팩트체크에 접목할지에 대한 고민으로 가득 찼습니다.
글로벌 팩트체크 서밋 '글로벌팩트6(Global Fact 6)'. 포인터재단 제공
기계의 팩트체크는 필수적입니다. 허위 정보가 쏟아지는 만큼 팩트체크 수요도 기하급수적으로 늘고 있기 때문입니다. 실시간으로 쏟아지는 뉴스나 발언을 전방위적으로, 적시에 팩트체크하는 건 인력만으론 어려운 일입니다. 팩트체크의 신뢰성도 문제입니다. 사람이 한 팩트체크라면 검증이 필요하겠지만, 기계가 했다면 편향성이나 정확성 등에 대한 의구심이 아무래도 비교적 덜하겠죠.

그래서 팩트체크와 기술의 결합은 '팩트체크 자동화(automated fact check)'로 대표됩니다. 팩트체크를 보다 실시간에 가깝게 하고, 결과의 신뢰성을 높이기 위해서입니다. 글로벌팩트6에 모인 전 세계 팩트체커들은 저마다 시도한 팩트체크 자동화 사례를 발표했습니다.
영국 풀팩트,
팩트체크 자동화로 구글 펀딩까지


영국의 팩트체크 전문 비영리단체 '풀팩트(Full Fact)'는 기술적 팩트체크를 지속 시도하고 있는 대표적인 기관입니다.
메반 바바카 풀팩트(Full Fact) 팩트체크 자동화 담당자. 사진=강종구 기자
영국의 비영리단체 풀팩트가 개발 중인 자동 팩트체크 도구. 구글 AI 임팩트 챌린지에서 20억원 상당을 지원받아 제작 중이다. 풀팩트 제공
풀팩트는 글로벌팩트6에서 직접 개발하고 있는 팩트체킹 도구를 선보였습니다. 신문, TV, 사회연결망서비스(SNS) 등에 제기된 주장(claim) 중 데이터베이스에 있는 경우를 빠르게 찾아줍니다. 단순 참·거짓 여부 뿐만 아니라 이를 뒷받침하는 통계 자료 등도 제시합니다.

메반 바바카 풀팩트 팩트체크 자동화 담당자는 "음성 인식 기술(speech-to-text)로 변환한 주장들을 실시간 스트리밍하고, 이미 팩트체크한 결과가 데이터베이스에 있으면 결과를 바로 표시해준다"고 설명했습니다.
풀팩트가 정리한 팩트체크 프로세스. 풀팩트는 이미 팩트체크한 적이 있는 주장(claim)에 강점이 있다. 메반 바바카 풀팩트 팩트체크 자동화 담당자는 "새로 제기된 주장도 실시간으로 자동 팩트체크하는 게 목표"라고 밝혔다. 풀팩트 제공
바바카는 "팩트체크 과정에서 어려움을 겪는 경우는 크게 두 가지"라며 "첫 번째는 가장 중요한 주장을 추출하는 것, 두 번째는 반복되는 주장을 팩트체크하는 것"이라고 말합니다.

매일같이 가장 중요한 주장을 골라내는 일과, 중복되는 내용을 매번 반복적으로 체크해야만 하는 일이 팩트체크 과정의 큰 부분을 차지한다는 뜻입니다. 바바카는 "풀팩트는 방대하고 질 높은 팩트체크 아카이브를 가지고 있어 기존에 이미 팩트체크한 경우 자동화하기 쉽다"면서도 "이미 데이터베이스에 있는 내용 뿐 아니라 새로 제기된 주장에 대해서도 실시간으로 팩트체크하는 게 이 도구의 목표"라고 설명했습니다.
아르헨티나 체케아도,
로봇 도움으로 실시간 팩트체크


바바카가 말한 어려움을 해결하려는 곳이 '체케아도(Chequeado)'입니다. 체케아도는 아르헨티나의 팩트체크 기관입니다. 스페인어로 '검증된(checked)'이라는 뜻입니다. 라틴아메리카의 팩트체크 대표 주자로 꼽힙니다.
파블로 페르난데즈 체케아도(Chequeado) 디렉터. 사진=강종구 기자
체케아도 역시 실시간 팩트체크 자동화 도구를 만듭니다. 풀팩트와 방향을 같이합니다. 풀팩트의 강점이 질 높은 팩트체크 데이터베이스인 한편, 체케아도는 주장을 추출하고 관련성을 판단하는 데 초점을 맞추고 있습니다.
트위터 상에 구현된 체케아도의 팩트체크 로봇 '체케아봇(chequeabot)'. 마우리시오 마크리 아르헨티나 대통령의 인플레이션 관련 발언을 팩트체크해달라는 한 이용자의 요청에 자동으로 답하고 있다. 체케아도 제공
체케아도는 직접 만든 팩트체킹 로봇 '체케아봇'을 '도우미'로 정의합니다. 파블로 페르난데즈 체케아도 디렉터는 "팩트체크는 시간과 비용이 많이 드는 과정"이라며 "팩트체크 로봇이 반복적인 작업을 도움으로서, 사람이 복잡한 맥락을 검증(debunk)하는 일에 집중할 수 있다"고 설명합니다.
기계는 도울 뿐,
핵심은 '데이터'


이 두 기관은 함께 구글 AI 임팩트 챌린지에 선정됐습니다. 풀팩트와 체케아도는 구글로부터 20억원 상당을 지원받아 새로운 팩트체킹 툴을 수개월 내에 선보일 예정입니다. 풀팩트의 강점인 팩트체크 데이터베이스와, 체케아도의 강점인 실시간 기술을 결합해 강력한 팩트체킹 도구를 만드는 게 목표입니다. 바바카는 "기계 학습(machine learning) 기술을 활용해 팩트체크 기록이 없는, 새로 제기된 주장도 실시간 팩트체크할 것"라고 밝혔습니다.

풀팩트와 체케아도엔 공통점이 있습니다. 두 곳 모두 충분한 데이터가 받쳐줘야 실현 가능한 기술을 추구하고 있단 점입니다. 기계 학습 기반의 로봇은 데이터를 바탕으로 고도화되기 때문입니다. 데이터가 질 높은 자동화를 위한 핵심 재료인 셈입니다.
글로벌 팩트체크 서밋 '글로벌팩트6'가 열린 남아프리카공화국 케이프타운대학 전경. 사진=강종구 기자
희망봉의 도시, 케이프타운에서 국내 팩트체크의 현실을 돌아봅니다. 가짜 뉴스와 허위 정보가 온·오프라인을 막론하고 등장하는 시대입니다. 카카오톡, 유튜브 등이 확산을 가속화시키고 있기도 하죠. 한국 역시 글로벌팩트6에 모인 국가들 못지 않게 팩트체크가 절실한 곳입니다.

언론, 기업, 정부, 개인까지 너나할 것 없이 팩트체크에 나서고 있습니다. 최근 몇 년 새 '팩트체크'란 단어가 많이 일상화했지만 질적 발전은 요원해 보입니다. 가짜 뉴스나 허위 정보의 양이 인력으로 소화 가능한 수준보다 훨씬 많기도 합니다.

자동화가 팩트체크의 '희망봉'일까요. 전 세계 팩트체커들은 고심 끝에 '그렇다'고 답했습니다. 하지만 전제 조건이 있습니다. 탄탄한 팩트체크엔 풍부한 데이터가 필수라는 점입니다. 풀팩트가 만들고 있는 도구, 체케아도가 만든 로봇은 그들이 오랜 시간 공들여 쌓아온 데이터가 있었기에 가능했습니다.

로봇이나 자동화 도구 같은 결과물보다 먼저, 재료가 될 데이터에 주목해야 할 때입니다.
※ 이 취재는 한국언론학회와 서울대 언론정보연구소 산하 SNU팩트체크센터의 지원을 받아 진행했습니다.
# 래빗GO? 뉴스래빗의 시각과 평가가 담긴 리뷰, 체험, 인터뷰, 비디오, 오디오 등을 통해 독자가 현장감을 간접 체험할 수 있도록 도와드립니다. 뉴스래빗이 네 발로 뛰겠습니다 !.!

케이프타운=강종구 한경닷컴 기자 jonggu@hankyung.com
뉴스래빗 페이스북 facebook.com/newslabit
기사제보 및 보도자료 newslab@hankyung.com