[사이언스] 다음 선거에서 누가 이길까? 위키는 알고 있다

2017년 02월 05일 18:00

 

사이언스 제공
사이언스 제공

2016년 11월 8일 미국 대통령 선거. 각 매체는 저마다의 여론 조사를 바탕으로 민주당 힐러리 클린턴 후보의 당선이 유력하다는 뉴스를 내보냈다. 하지만 결과는 대반전. 45대 미국 대통령 자리는 도널드 트럼프 후보에게 돌아갔다. 왜 여론조사는 결과 예측에 실패했을까?

 

사이언스 제공
사이언스 제공

학술지 ‘사이언스’는 사회현상 예측을 위한 과학기술을 주제로 특별 섹션을 마련하고, 이를 표지에 실었다.

 

선거 여론조사는 전화, 대면 조사를 통해 보통 1000여개의 의견을 수렴한다. 이에 소요되는 비용만 180억 달러(약 20조6000억 원)로 막대하며 데이터 역시 제한적이라는 한계가 존재한다.

 

헤르난 막세 미국 뉴욕대 연구원 1초에 2~3개씩 글이 올라오는 트위터 등 소셜네트워크서비스(SNS)를 이용하면 추가 비용 없이 막대한 양의 데이터를 수렴할 수 있어 예측의 정확도를 높일 수 있을 것이라고 예상했다.

 

선거 당일 저녁. 연구진의 트위터 기반 알고리즘은 클린턴이 55.5%의 득표율로 우세할 것이라 예측했다. 여타 매체와 마찬가지로 결과와 상반되는 예측을 한 것이다. 오후 8시가 돼서야 트럼프의 당선확률은 20%에서 95%로 반전됐지만, 그때는 선거의 판도가 이미 판가름된 후였다.

 

그렇다면 인터넷은 정확한 선거예측의 도구로 적합하지 않다는 것일까? 데이빗 레이저 노스이스턴대 교수는 그래도 아직까진 기존 여론조사가 가장 정확한 도구라고 설명한다. 하지만 SNS의 익명성, 글을 작성한 동기 등을 해석하는 알고리즘까지 개발된다면 정확도를 90%까지 높인 예측도구 개발 가능성이 존재한다.

 

연구진은 현재까지 이 알고리즘을 개발하기 위해 86개국 500여개의 선거 데이터를 입력하며 데이터를 구축했다. 알고리즘은 국가의 경제적 번영, 민주주의적 자유, 정치 점수 등이 포함된다. 2007년부터 128개의 선거를 알고리즘을 활용해 예측해본 결과 당선자를 맞춘 확률이 80~90%로 높게 나타났다.

 

분석을 통해 연구진은 현직에 있는 사람이 다음 선거에 나온다면 재선 확률이 높지만, 현직자가 출마하지 않을 경우 해당 정당에 유리하게 작용하지 않는다는 경향을 발견했다. 또 미국과 우호적인 관계를 맺고 있는 후보자일수록 당선 확률이 높다는 경향도 확인했다.

 

또 연구진은 위키피디어 방문자 수를 보면 선거에서 어떤 정당이 우세할지 점칠 수 있다고 설명한다. 한 후보자에게 관심이 생기면 위키피디어를 통해 인물검색을 하고, 그 트래픽이 당선자 개인에겐 영향을 미치지 않지만 정당 자체에는 유의미한 영향을 미친다는 것이다. 각 선거 1주일 전 위키피디어 방문자 수는 가장 높게 나타났다.

 

레이저 교수는 “눈에 보이지 않는 기체 입자 하나의 움직임을 예측하긴 힘들지만 물리학자들은 기체 전체의 유동을 통해 한 개 기체 입자의 움직임을 추론해낸다”며 “이처럼 여론을 바탕으로 사회 구성원들 각각의 생각을 이해하고, 결과를 예견해내기 위한 각종 방법론을 만들어가는 중”이라고 설명했다.

 

연재표지로 읽는 과학더보기

메일로 더 많은 기사를 받아보세요!

관련기사

인기기사

댓글

댓글쓰기

지금
이기사
관련 태그 뉴스