![]() |
지난 9일 트럼프의 미국 45대 대통령 당선이 확정되자 우종필 세종대 경영학과 교수의 전화는 잠시도 쉴 새가 없었다. 지인들은 물론 언론사까지 그가 마치 대선에서 이긴 것처럼 축하인사를 건넸기 때문이다.
“미국 CNN과 뉴욕타임즈 등이 실시한 여론 조사는 모두 빗나갔습니다. 거의 모든 기관이 힐러리의 낙승을 예측했고, 선거 당일 모 언론사는 그의 당선확률을 91%까지 예상했습니다.”
우 교수는 이미 지난 여름 트럼프 당선 예측을 매일경제 인터뷰를 통해 공개하면서 한국도 이에 대비해야 한다는 목소리를 냈다.
미국 대선 결과가 나오자 마자 우 교수 연구실을 방문했다. 지친 얼굴로 세수를 하고 돌아온 그는 지난 3일 미국 대선 예측 결과를 올려놓은 자신의 홈페이지 게시 글부터 보여줬다.
내용은 다음과 같았다.
‘당선자: 도널드 트럼프, 유권자들 중 득표율: 트럼프 54~52%, 선거인단 수, 트럼프 285~275...이번 예측은 빅데이터 분석만으로 나온 결과이며, 정치적 성향은 완전히 배제했습니다. 개인적으로는 한국 국익에도 도움이 되는 후보가 되었으면 하는 바람입니다.’
미국에서 가장 유명한 대선 예측 전문가 네이트 실버의 예측과는 정반대였다. 네이트 실버는 파이브써티에잇(FiveThirtyEight) 블로그에서 힐러리 클린턴의 승률을 79.1%, 트럼프의 승률을 20.8%로 예측했다.
뚜껑을 열어보니 우 교수의 예측이 적중했다. 우 교수 분석이 더욱 놀라운 것은 선거인단 수까지 오차율 5% 이내로 들어왔다는 것이다. 선거인단 수 예측은 우 교수가 지난 한국의 대선을 통해 얻은 알고리즘을 이용한 것으로, 본인 스스로도 높은 정확성에 놀랐다.
“빅데이터로는 그 어느 곳에서도 힐러리가 당선이 될 만한 수학적 또는 과학적 근거가 없었어요. 이 그래프를 보세요. 데이터 상으로는 힐러리가 단 한 번도 트럼프를 이겨본 적이 없잖아요.”
우 교수는 올 한 해 구글 빅데이터를 분석한 그래프를 보여줬다. 트럼프를 상징하는 빨간색 그래프는 힐러리를 상징하는 파란색 그래프보다 늘 높은 수치였고, 우상향 추이를 보여줬다.
“현재 미국 여론조사는 유권자들의 0.00001%를 조사하는 것입니다. 표본이 너무 적기도 하지만, 실제 조사에 들어가면 그들은 절대 속마음을 드러내지 않습니다. 특히 윤리적이거나 도덕적인 이슈와 관련해서는 더욱 그런 성향이 강해집니다.”
우 교수는 여론조사와는 달리 인터넷이나 모바일 상에서는 유권자들이 자신의 속내를 솔직히 드러내기 때문에 표심의 정확성을 읽을 수 있다고 말했다.
“TV토론이 끝난 후 전문가들은 힐러리에게 높은 점수를 줬고 사람들도 그녀가 토론을 더 잘했다고 했습니다. 하지만 그것은 겉으로 드러난 모습일 뿐입니다. 유권자들은 1·2·3차 토론 후에도 여전히 트럼프를 검색했습니다. 지지 후보에 대해 훨씬 많은 검색어를 넣은 것이죠. 이 때도 빅데이터로는 모두 트럼프의 승리였습니다.”
우 교수에게 한국인이 많이 사용하는 네이버 검색어를 이용해서도 이런 결과를 얻을 수 있냐고 물어보자 절대로 아니라고 말했다.
“구글은 바탕화면에 아무것도 존재하지 않습니다. 이용자의 검색어에 영향을 미칠 것이 없지요. 하지만 네이버에는 이미 검색어와기사 제목 등 많은 정보들이 떠 있어, 이용자의 검색어는 외부 영향을 받게 됩니다. 유권자 성향을 알기 위해서는 외부요인이 전혀 없어야 합니다.”
우 교수는 이번 미국 대선뿐만 아니라 한국의 4·13총선과 영국 브렉시트까지 빅데이터를 통해 정확한 결과를 예측했다. 자연스럽게 질문이 한국 대선으로 넘어갔다. 우 교수에게 이미 작업을 시작했는지 물어보니 “아니다”라는 답변이 돌아왔다.
“괜히 정치에 연루되고
[이윤재 기자]
[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]