[DJ 래빗] 촛불 64일‥'최순실'이라 쓰고, '박근혜'라 읽었다

뉴스래빗 데이터저널리즘 'DJ래빗' 10회
[#오늘의 최순실] 22만4522건 기사 분석

#1. 주인공은 '박근혜'…'최순실'의 3배
#2. '박근혜' 10대 연관 키워드 추출
#3. '의혹'의 아수라…'박근혜' 25일 연속 1위
#4. 거짓말 거짓말 거짓말..폭발한 '퇴진' 민심
#5. '박근혜' 연관어 1위 역시 '탄핵', 2위 '퇴진'
#6. 거짓말, 속이는 자에 대한 인간적 처벌
[편집자 주] [오늘의 #최순실]. 뉴스래빗이 지난 11월부터 선보인 데이터 큐레이션(curation) 시리즈입니다. 하루 단위로 '최순실 게이트' 이슈 키워드를 일목요연하게 정리하죠. △ '최순실' △'박근혜(박근혜·朴 포함)' △ '검찰(검찰·檢 포함)' △ '촛불(촛불·민심 포함)'을 '4대 키워드'로 선정해 점유율 추이를 계속 살폈습니다. 하루치 데이터에서 두각을 보인 키워드를 '라이징 이슈(Rising Issue)'로 함께 선정했죠.

지난해 11월 2일부터 12월 21일까지 [오늘의 #최순실] 17건을 출고했습니다. 사실 포털 네이버의 정치 기사 데이터 수집·분석은 지난해 10월 29일부터 12월 31일까지 계속했습니다. 매일 [#오늘의 최순실]을 기사화하진 않아도 64일 동안 데이터 수집은 이어졌죠. 그렇게 24만4522건 네이버 정치 기사 제목이 데이터로 쌓였습니다.이제 뉴스래빗은 보다 긴 호흡으로 '최순실 게이트' 데이터를 정리합니다. 바로 뉴스래빗의 대표 데이터저널리즘 [DJ 래빗]으로 말입니다. 64일 간 모은 24만4522건의 정치 뉴스를 다시 분석하고, 걸러냈습니다. 그렇게 64일치, 24만4522건 정치 기사 제목 속 주인공과 10대 키워드를 확인했습니다. 결론부터 말씀드리면 주인공은 '최순실'이 아닌 '박근혜'였습니다. '최순실'로 표현된 수많은 의혹과 쟁점은 '박근혜'로 향하고 있음을 데이터적으로 확인한 성과입니다. '티끌 모아 태산' 데이터 형태소 분석으로 찾아낸 이 결론 속으로 들어가시죠 !.!
◆ 이렇게 분석했습니다 전날 낮 12시부터 다음날 낮 12시까지 매일 포털사이트 네이버 정치 섹션 뉴스 제목을 전수 수집했습니다. 기사 제목은 주제를 가장 함축한 짧은 문장입니다. 비문이나 속어가 거의 없고 중복 단어도 없어 형태소 추출 정확도가 높습니다.
#1. 주인공은 '박근혜'…'최순실'의 3배

▼ 터치하세요 !.! 24만4522건 정치 기사, 가장 많이 등장한 단어는


64일 간 모은 네이버 정치 뉴스 섹션 24만4522건 기사 중 가장 많이 등장한 키워드는 단연 '박근혜'였습니다. 5만 843회, 20.8% 비중입니다. '최순실 게이트' 관련 기사 5건 중 1건에 이름이 올랐습니다. '민간인 국정농단', '비선실세' 최순실이 주인공인 줄 알았습니다. 하지만 최순실 기사가 가장 주목한 인물은 박 대통령이었습니다. 20.8%는 그나마 보수적으로 잡은 수치입니다. 지난해 12월 9일 국회에서 박 대통령 탄핵소추안이 가결된 다음 날부터 '대통령'은 '박근혜' 키워드에 포함치 않았습니다. 황교안 국무총리가 대통령 권한대행에 나서면서 '대통령' 제목 키워드가 박 대통령만을 뜻하진 않게 됐기 때문입니다.'박근혜' 다음으로 많이 등장한 키워드는 '탄핵'이었습니다. 2만 3683회로 9.7%를 차지합니다. 이어 3위가 비로소 '최순실'입니다. 2만3288회로 9.5% 점유율. 주인공으로 여겼던 '최순실' 점유율은 '박근혜'의 3분의 1에 불과했습니다. '최순실 게이트' 아래 고구마 줄기처럼 얽히고 설킨 의혹과 인물들, 진실과 거짓 논란, 이해 관계 등을 보도한 기사들은 '최순실' 아닌 '박근혜'에게 이목을 집중했다는 뜻입니다. 특히 2위 '탄핵' 키워드 대부분은 '박근혜 탄핵'처럼 박 대통령을 지칭합니다. 최순실을 향한 거대한 국민적 분노가 박 대통령 탄핵을 향하고 있었다는 점을 데이터 분석으로 확인한 셈입니다.

#2. '박근혜' 10대 연관 키워드 추출

뉴스래빗은 최다 키워드 '박근혜'의 연관어를 추출했습니다. '박근혜' 키워드가 어떤 단어와 함께 기사 제목에 자주 등장했는지 파악하기 위해서입니다. 빈도가 높은 연관어를 추출해내면 키워드-키워드 간 맥락을 파악할 수 있습니다. '박근혜'-'박정희' 연관어가 부녀지간을 뜻하듯 말입니다.24만4522건 정치 기사 중 박 대통령을 지칭하는 단어(박근혜·朴·박대통령·朴대통령)를 포함한 제목에 함께 쓰인 명사를 셌습니다. 빈도가 높은 명사 중 의미가 큰 연관어만 추렸습니다. 이를 통해 '박근혜 10대 연관 키워드'를 선정했습니다.

과연 여론은 '최순실 게이트' 속 '박근혜'를 논하며 어떤 키워드를 함께 썼을까요?
▼ 터치하세요 !.! [오늘의 #최순실] 64일, '4대 키워드' 점유율 변화 한 눈에 보기


뉴스래빗이 [오늘의 #최순실] 시리즈를 시작한 10월 말 당시만 해도 '최순실'은 4대 키워드 중 점유율이 가장 높았습니다. 10월 30일 41.7%, 31일 26.4%, 11월 1일 37.5%를 기록할만큼 압도적이었습니다. '최순실 게이트'의 주인공은 그야말로 최순실이었습니다.
그러나 '최순실'(3534회)은 단지 박 대통령을 향한 이슈 폭발 시작점에 불과했습니다. 뉴스래빗 데이터가 말해준 결론이죠. 분석 결과 지난해 11월 2일 '박근혜(27.6%)'가 '최순실(21.9%)'을 처음 앞섰습니다. '박근혜'는 전날만 해도 17.7%에 불과했죠. '최순실(37.5%)'과 무려 20%p 차. 점유율을 단숨에 뒤집었습니다. 이후 '박근혜'는 25일 연속 일별 최고 점유율을 유지합니다. 일거수 일투족이 언론의 주목을 받는 대통령임을 감안하더라도 '박근혜' 키워드 비중은 시종일관 압도적이었습니다. 25일동안 점유율 30%를 넘은 고공행진이 13일, 절반 이상입니다. 그 가운데 점유율 40%대가 4일, 무려 50%를 넘는 날이 이틀이나 됩니다.

최순실이 구치소로 사라진 이후 [오늘의 #최순실]은 명실상부 [오늘의 #박근혜]였습니다.

#3. '의혹'의 아수라…'박근혜' 25일 연속 1위

[오늘의 #최순실]은 처참한 국정 농단의 기록이었습니다. 최순실이 온갖 국정에 개입했다는 비선 실세 의혹은 정치·경제·사회 전반으로 급속히 퍼졌습니다. 속속 드러난 박근혜 정부의 민낯은 가히 충격적이었습니다. 의혹은 끊없는 의혹을 낳고, 거짓말은 더 새빨간 거짓말로 악독해졌습니다. 매일 매일 터져나온 메가톤급 비리 의혹은 국민은 아연실색케 했습니다. 정치 경제 사회 거물급 인사의 이해관계가 거미줄처럼 엮인 '의혹의 아수라'는 대한민국 정부의 권능과 국정을 급기야 마비시켰습니다.
'박근혜' 10대 연관어 중 '의혹(698회)'이 꼽힌 건 그래서 필연입니다. '박근혜' 키워드 점유율이 '최순실'을 역전해 1위 자리를 지킨 25일동안 언론과 여론은 모든 의혹의 배후 혹은 몸통으로 박 대통령을 주목했습니다. 게이트 비화 초기 박 대통령은 최순실 인사 청와대 무단 출입, 대통령 전용기 동승, 청와대 인사의 최순실 경호 등을 허용하며 사실상 비선 실세가 국정을 마음껏 농단하도록 동조했다는 논란에 휩싸였습니다.

최순실 딸, 정유라에 꼭 맞는 승마지원 사업을 정부가 벌이고, 이화여대는 정유라에게 부정 입학 및 편법 학사 관리 종합선물세트를 안겼습니다. 장시호 등 최순실 일가가 평창동계올림픽 관련 이권사업에 개입한 정황이 속속 드러났습니다. 기업에 창조경제·문화융성 광고를 강요하고, 내로라하는 국내 재벌 총수들과 독대하며 미르재단·K스포츠재단 설립기금 모금을 박 대통령과 최순실이 공범 성격으로 주도했다는 검찰 발표까지 나왔습니다. 심지어 최순실이 정부 장차관 인사를 좌지우지했고, 민정수석 행정관 등 청와대 핵심 인사까지 꽂아넣었다는 믿기 힘든 JTBC와 한겨레, TV조선 등의 단독 보도가 줄을 이었습니다. 여타 박 대통령과 최순실 측의 직권남용 공모 의혹은 모두 열거조차 힘들만큼 많습니다.

결정적으로 여론을 들끓게 한 건 박 대통령을 둘러싼 '시술(335회) 의혹'입니다. 시작은 '길라임(109회)'이었습니다. 박 대통령이 드라마 '시크릿 가든' 여주인공 이름인 '길라임'을 가명으로 차병원그룹 계열 노화 방지 전문 의원인 '차움'을 이용했단 의혹이 제기됐는데요.

지난해 11월 9일 JTBC는 단독 보도를 통해 최 씨 일가의 단골 의원인 차움이 지난 5월 보건복지부로부터 체세포 복제배아연구 조건부 승인을 받는 등 특혜까지 받았다고 주장했습니다. 이 보도를 계기로 차움 출신 의사 김모씨와 최 씨 단골 성형외과 김영재 원장 등 '비선 의료진'의 정체가 속속 밝혀졌죠. '청와대 의료 시스템 농단' 논란은 결국 '세월호(970회·10대 키워드) 7시간' 의혹 규명의 핵심 단초가 됩니다.

# 4. 거짓말 거짓말 거짓말..폭발한 '퇴진' 민심

각종 정·관계 비리 개입 의혹에 '세월호 7시간' 의혹까지 더해져 여론의 분노는 극에 달합니다. 진상 규명을 촉구하는 목소리는 커지는데 어느 누구도 속시원한 해명을 내놓지 못했습니다.

이 와중 박 대통령의 3차례 대국민 담화는 들끓는 분노 여론에 기름을 붓는 격이었습니다. 지난해 10월 25일 1차 담화, 10일 만인 11월 4일 2차 담화, 25일 뒤인 11월 29일 다시 3차 담화에 나섰습니다. 녹화방송으로 공개된 1차 담화 때 박 대통령은 "청와대 보좌체계가 완비된 이후에는 최순실은 개입 그만뒀다"고 말했습니다. 하지만 며칠 못 가 거짓임이 밝혀졌습니다. 언론 보도를 통해 최근까지 최순실이 국정에 개입했다는 증거가 속속 드러났습니다.

2차 담화 때 "이러려고 대통령 했나 자괴감마저 든다"던 박 대통령의 안일한 태도에 국민 실망감은 더 컸습니다. 국정농단 사태가 자신과는 전혀 무관하다는 식의 발언이 국민을 더 화나게 했습니다. "검찰 수사에 임하겠다"던 2차 담화 약속도 결국 거짓말이었습니다.

3차 담화는 "국회의 방안에 따라 퇴진하겠다"을 약속했습니다. 하지만 퇴진 시기나 절차를 언급하지 않았습니다. 국회로 공을 다시 떠넘겼습니다. "퇴진하지 않겠다"는 뜻으로 국민은 받아들였습니다. 진정성 없는 태도에 국민은 다시 분노했습니다. 세차례에 걸친 대국민담화는 거짓말과 진정성 없는 반성의 연속이었습니다.
최고권력자의 거짓말에 분노한 시민들은 광장에 쏟아져나왔습니다. 그리고 '촛불(1224회·10대 키워드)'을 들었습니다. '세월호 7시간' 등 온갖 의혹에 거짓성 해명을 내놓는 권력자들의 태도를 더 이상 지켜만 볼 수는 없다는 외침이었습니다. 속인 자, 속이고 있는자, 속이려는 자를 향한 거대한 국민적 경고였습니다.
10차에 걸친 촛불집회에 전국적으로 1000만 명 시민이 참가합니다. 시종일관 최순실이 아닌 박 대통령의 책임을 주장했습니다. 뉴스래빗은 '촛불' 키워드의 빈도 추이를 통해 분노의 상승세를 감지했습니다. '촛불'이 일별 점유율 1위를 처음 기록한 지난해 11월 12일 3차 촛불집회 당일을 계기로 4대 키워드에 '촛불'을 추가했죠. 이후로도 '촛불'은 집회가 열린 매주 토요일마다 두각을 보입니다. 150만 명(주최 측 추산)이 모인 지난해 11월 26일 32.3%, 탄핵안 표결 직전인 12월 3일 30.1%를 기록하며 집회 당일마다 일별 점유율 1위를 차지했습니다.

# 5. 박근혜' 연관어 1위 역시 '탄핵', 2위 '퇴진'
'박근혜' 관련 10대 키워드 데이터 상 '촛불'은 이내 '박근혜 퇴진'으로 활활 타오릅니다. '촛불' 민심은 '탄핵(8270회·10대 키워드)'에서 마침내 폭발했습니다. '탄핵'은 '박근혜'를 중심으로 뽑은 연관어 가운데 가장 높은 빈도를 기록했습니다. 10대 키워드 중에서도 단연 압도적이죠. '최순실 게이트'를 논할 때 언론과 여론은 '박근혜'에 가장 집중했고, '박근혜'가 언급될 때 동시에 가장 자주 등장한 단어가 '탄핵'이란 뜻입니다. 바로 '박근혜 탄핵'이죠. 여론은 박 대통령의 탄핵을 '최순실 게이트' 핵심 해결방안으로 봤다는 뜻입니다.

'탄핵'을 이은 2위가 '퇴진·하야 (6156회·10대 키워드)'라는 점이 이를 뒷받침합니다. '퇴진'과 '하야'는 '탄핵'보다 먼저 지난 11월부터 꾸준히 '박근혜'와 함께 등장한 키워드입니다. 국회가 탄핵안을 본격화한 지난해 12월 이전까진 박근혜 연관어 중 '퇴진' 점유율이 1위였습니다. '퇴진'이 '탄핵'보다 '박근혜'와 함께 더 많이 등장했다는 뜻입니다. 1·2·3차 대국민 담화를 통해 박 대통령이 퇴진을 사실상 거부하자, 남은 적법 절차인 '탄핵'으로 여론이 옮겨붙은 겁니다.

'퇴진'이 아닌 '탄핵' 여론대로 지난해 12월 9일 박 대통령 탄핵소추안이 국회를 통과합니다. 찬성 234표, 반대 56표, 무효 7표, 기권 1표. 모두의 예상을 깬 '압도적 가결'이었습니다. '친박(친 박근혜계)'의 안방인 새누리당조차 의원 과반이 넘는 70여명이 찬성했다는 뜻이니까요. 새누리당 분열, 개혁보수신당 독립은 이 때부터 피할 수 없는 운명이었습니다.

#6. 거짓말, 속이는 자에 대한 인간적 처벌

박 대통령은 지금도 "최순실 개인이 저지른 일"이라며 "(많은 의혹에 나를) 완전히 엮은 것"이라고 주장합니다. 직무가 정지된 박 대통령은 지난 1월 1일 갑자기 신년 간담회를 자청했습니다. '세월호 7시간'을 둘러싼 각종 의혹에 대해 "(사고 당일) 관저에서 보고를 충실히 받고 고민했다"고 원론적 해명을 되풀이했습니다. 2014년 4월 16일 세월호 사고 날짜에 대해 "작년인가, 재작년인가요? 그때 세월호 참사가 벌어졌는데"라고 말해 빈축을 사기도 했습니다.

국민들은 여전히 답답합니다. 국정조사특별위원회가 국내 재벌 총수, 김기춘 전 청와대 비서실장, 우병우 전 청와대 민정수석, 최순실 조카 장시호, '문화계 황태자' 차은택, 조여옥 전 청와대 간호장교 등을 불러내 5차례 청문회까지 벌였습니다. 하지만 속시원한 해명과 책임 인정, 반성 및 사죄는 들을 수 없었습니다. 끝까지 모르쇠로 일관하는 권력자들의 민낯에 더 경악했습니다.

'왜 인간인가' 책 표지.
뇌과학과 진화심리학의 석학, 마이클 가자니가(Michael Gazzaniga) 미국 샌타바버라 캘리포니아대 교수는 '왜 인간인가'라는 저서에서 "인간은 도덕적 윤리적 문제를 처리할 어떤 직관적 개념이 있기 때문에 함께 어울려 살아가는 사회를 만들 수 있었다"고 진단했습니다. 인간이 여타 동물과 달리 거대한 사회적 관계를 맺을 수 있는 원동력은 뇌에 새겨진 도덕 윤리적 개념에서 나온다고 설명합니다.

가자니가 교수는 그 사회적 상호 관계의 필수 조건으로 '속이는 자를 가려내야 한다', '속이는 자를 처벌해야 한다' 2가지 개념을 제시합니다. "속이는 자는 적은 노력으로 정직한 자의 우위를 점하니까”, "속이는 자가 우세해지면 상호 관계가 무너지니까”를 그 이유로 듭니다. '상호 교환 시 속이는 자를 처벌하는 능력'은 현재까지 과학계가 밝힌 몇 안되는 인간 고유의 특성이라고 가자니가 교수는 강조합니다.

오리무중이던 탄핵소추안이 압도적인 가결로 통과된 건 거짓말을 일삼는 자, 속이려는 자를 처벌하려는 인간의 오랜 본능이자 공감대라고 뉴스래빗도 분석합니다. 뉴스래빗이 64일간 분석한 [#오늘의 최순실] 데이터는 시민 여론이 거스를 수 없는 탄핵 상황으로 치닫는 과정을 증명하는 하나의 객관적 근거입니다. '탄핵'은 이제 국민의 손을 떠났습니다. 이제 남은 건 '탄핵' 이전부터 여론이 '박근혜' 대통령과 함께 요구한 '퇴진'입니다 !.!
▼ 아래 인터랙티브 타임라인은 크롬(Chrome), 파이어폭스(Firefox), 사파리(Safari) 브라우저에 최적화돼 있습니다.
▼▼ 4대 키워드 및 #라이징_이슈 관련 기사 164개, 타임라인(TIMELINE JS)
# DJ 래빗 ? 뉴스래빗이 고민하는 '데이터 저널리즘(Data Journalism)' 뉴스 콘텐츠입니다. 어렵고 난해한 데이터 저널리즘을 줄임말, 'DJ'로 씁니다. 서로 다른 음악을 디제잉(DJing)하듯 도처에 숨은 데이터를 분석하고, 발견한 의미들을 신나게 엮여보려고 합니다. '뉴스래빗'의 데이터저널리즘을 만나보세요 !.!

책임= 김민성, 연구= 강종구 한경닷컴 기자 jonggu@hankyung.com
뉴스래빗 페이스북 facebook.com/newslabit
기사제보 및 보도자료 newslab@hankyung.com