표 뒤의 '감정' 읽지 못한 구글…대선 예측 처음으로 틀렸다 [신현보의 딥데이터]
-
기사 스크랩
-
공유
-
댓글
-
클린뷰
-
프린트
[신현보의 딥데이터 21]
미국 대선 구글 검색량 & 여론조사 결과 분석
구글 트렌드, 사상 첫 대선 예측 실패
트럼프, 검색량서 내내 바이든 앞서
논란 끊이질 않아 부정적 관심까지 반영
여론조사 '바이든 승리' 맞췄지만 정확도↓
미국 대선 구글 검색량 & 여론조사 결과 분석
구글 트렌드, 사상 첫 대선 예측 실패
트럼프, 검색량서 내내 바이든 앞서
논란 끊이질 않아 부정적 관심까지 반영
여론조사 '바이든 승리' 맞췄지만 정확도↓
지난 4번의 미국 대선 승자를 모두 맞췄던 구글이 처음으로 오답을 냈다. 대선 경선 내내 구글 검색량에서 도널드 트럼프 대통령이 줄곧 앞선 모습을 보였지만, 막상 뚜껑을 열어보니 바이든 민주당 후보가 트럼프 대통령을 백악관에서 밀어내게 된 것이다.
지난 대선에서는 구글이 트럼프 대통령 당선을 맞추며 신뢰를 높이고, 여론조사 기관은 힐러리 클린턴 전 국무장관의 승리를 예측하며 불신을 샀다. 올해 구글은 트럼프 대통령의 재선을 점치고 여론조사는 대부분 바이든 후보의 당선을 예상하면서 이번에는 여론조사가 승자를 알아맞췄다.
승자를 맞추면서 명예가 다소 회복된 듯 싶었으나, 올해 여론조사는 바이든 후보의 낙승을 예측하는 등 정확도가 크게 떨어지면서 '반쪽짜리 명예회복'이라는 비판을 받고 있다.
구글 트렌드 첫 패배
'부정적 관심' 거르지 못했다
9일 한경닷컴 뉴스랩이 단어 검색량을 나타내는 구글 트렌드를 분석한 결과, 미국 대선 투표 당일인 3일 트럼프 대통령의 검색량은 49%로 조 바이든 당선인(29%)에 비해 20%나 높았다. 대선 후보가 확정된 8월부터 3개월간 평균 검색량도 21%대 8%로 트럼프 대통령이 3배 가량 압도적으로 많았다. 구글 트렌드는 가장 검색량이 많은 날을 100% 기준으로 놓고 상대적인 검색량 추이를 보여주는 지표다.트럼프 대통령은 그동안 구글 트렌드에서는 대체로 2배, 많을 때는 6배 넘게 바이든 당선인에 비해 더 많은 관심을 받은 것으로 나타났다. 대선 레이스가 본격화된 후 두 후보의 TV토론이 이뤄졌던 9월 30일과 10월 23일에 4%P 차이까지 바이든 당선인이 추격하기도 했지만, 이밖에는 트럼프 대통령은 압도적인 우위를 점해왔다. 하지만 실제 세계에서는 바이든 당선인이 근소한 차이로 승리를 거머쥐게 됐다. 8일 당선을 확정지은 바이든 당선자의 득표율은 50.6%로 트럼프 대통령(47.7%)을 2.9%P 앞섰다.
2004년부터 검색량 집계를 시작 이래 이번 대선 전까지 총 4번의 대선에서 구글 트렌드에서 우위를 점했던 후보는 백악관에 입성했다. 2004년 대선 당시 구글 검색량에서 조지 W. 부시 전 대통령은 존 케리 전 국무장관을 37%대 27%로 이겼다. 버락 오마바 전 대통령은 2008년 대선에서는 고(故) 존 매케인 상원의원을 27%대 10%로, 2012년에는 밋 롬니 상원의원을 22%대 18%로 눌렀다. 트럼프 대통령은 2016년 클린턴 전 국무장관과의 경선 당시 30%대 15%로 2배 높은 수치를 기록했다. 통상 대선 후보가 결정되는 8월부터 선거인 11월 초까지 3개월 간 후보간 평균치를 분석해본 결과 이같이 나타난 것이다.
하지만 이번에는 처음으로 구글 트렌드 결과와 실제 투표 결과는 달랐다. 구글 트렌드는 검색자가 검색하는 정보를 긍정과 부정으로 구분하지 않고 전체 검색량만을 보여준다. 이러한 이유로 후보에 대한 부정적인 이슈가 있다 하더라도 모두 관심도로 나타나기 때문에 이를 인기로 간주하기 어려울 때도 발생한다.
따라서 학계에서는 구글 트렌드로 선거 결과를 예측하는 것에는 한계가 있다는 지적이 나오곤 했다. 에니 무스타파라지 미국 웰즐리대 컴퓨터과학과 교수는 '검색량 활동을 통한 미국 선거 예측'라는 연구를 통해 "선거결과에서 어떤 경우에는 검색이 많은 후보가 우위를 가지지만, 특히 경쟁이 심한 경우에는 사람들은 부정적인 정보를 위해 후보자를 검색할 수 있어 구글 검색 결과가 맞지 않는 경우도 있다"고 지적했다.
이처럼 트럼프 대통령은 여러 논란 중심에 서 대중의 관심을 받았기에 예년과 달리 구글 트렌드와 대선 결과가 엇나가는 '이상 현상'을 보인 것으로 분석된다. 트럼프 대통령은 8월부터 우편투표 확대가 부정선거로 이어질 수 있다는 의혹을 제기하며 줄곧 논란을 키워왔다. 9월에는 언론인 밥 우드워드가 출판을 통해 트럼프 대통령이 신종 코로나바이러스 감염증(코로나19)의 치명성을 은폐했다고 폭로하며 언론과 여론의 집중포화를 받기도 했다. 또 대선 유세 과정에서 마스크 착용과 사회적 거리 두기 등을 거부하다 10월 코로나19에 걸렸다. 트럼프 대통령 코로나19 확정 판정을 받은 날, 그의 검색량은 1년간 최대치를 찍었고 바이든 보다 6배 넘는 관심을 받았다.
바이든 낙승 점친 여론조사에
외신 "신뢰회복? 수십년 걸릴 것"
적중률이 높았던 구글 트렌드가 대선 결과 예측에 실패하고, 바이든 후보의 당선을 점쳤던 여론조사 기관들은 여론조사가 현실이 되면서 안도의 한숨을 쉬었다. 2016년 8월부터 대선 전까지 실시된 여론조사 264건 중 82.2%(217건)가 힐러리 전 장관의 승리를 예상했다. 하지만 그해 백악관의 주인은 트럼프 대통령이었다. 이로 인해 여론조사의 신뢰는 바닥으로 추락했고, 올해도 내내 신뢰 논란이 제기됐다. 선거 당일에도 트럼프 대통령은 바이든의 승리를 예상한 각종 여론조사를 두고 "가짜(fake) 여론조사를 봤다"며 "우리가 어쨌든 이길 것"이라고 밝혔다.올해 미국에서 10월 이후 발표된 여론조사 147건 중 트럼프 대통령의 재선을 전망한 여론조사는 2건에 불과했다. 대체로 여론조사 결과가 맞아떨어진 것이다. 하지만 바이든의 승리를 예상했던 여론조사 145건에서 바이든은 평균 9.2%P 차이로 트럼프를 앞서왔다. 많게는 18%P까지 트럼프 대통령을 앞설 것으로 내다봤다. 실제 결과는 여론조사 예상과 달리 초박빙의 승부였다. 또 당초 민주당이 상하원을 장악하리라는 예상도 들어맞지 않았다.
이에 4일 디애틀랜틱은 "여론조사는 이번 선거에서 명백한 패자"라고 비꼬았다. 이 매체는 "미국 민주주의에 여론조사 위기는 재앙이다"며 "여론조사는 조 바이든의 낙승, 민주당의 상원 장악 등을 예측했지만 결과는 달랐다"고 비판했다.
8일 더힐도 "여론조사 기관은 바이든과 민주당에 대한 국민의 지지를 과대평가했다"면서 "한심한 일이며, 이들이 신뢰를 다시 얻는 데는 수십년은 걸릴 것"이라고 보도했다. 같은 날 영국 가디언지도 "이번 미국 선거에서 얻은 교훈은 여론조사를 통해서는 유권자를 절대 이해할 수 없다는 것"이라면서 "너무나 많은 공화당 지지자들이 자신의 정치 성향을 드러내지 않았고, 여론조사는 경합지의 결과, 국회에서의 민주당 손실 등을 예측하지 못했다"고 전했다.
신현보 한경닷컴 기자 greaterfool@hankyung.com