관리 메뉴

ScienceBooks

포퓰리즘 시대의 복잡계 정치학 본문

완결된 연재/(휴재) 이효석의 과학 페퍼민트

포퓰리즘 시대의 복잡계 정치학

Editor! 2016. 12. 8. 17:47

「이효석의 과학 페퍼민트」 일곱 번째 이야기


사이언스북스에서는 외신 큐레이션 서비스의 대표 주자 뉴스페퍼민트와 콜라보레이션을 시작합니다. 2016년 7월부터 매주 뉴스페퍼민트와 사이언스북스의 블로그에서 뉴스페퍼민트가 엄선한 최신 과학 정보를 만나 보실 수 있습니다. 그리고 월 1회 사이언스북스의 블로그에서 뉴스페퍼민트 대표 이효석 박사님의 「이효석의 과학 페퍼민트」를 만나 보실 수 있습니다. 톡톡 튀는 과학 기술 관련 통찰을 만끽하시기 바랍니다.


「이효석의 과학 페퍼민트」 일곱 번째 이야기에서는 마크 뷰캐넌의 『내일의 경제』와 『사회적 원자』로 복잡계 과학을 살펴봅니다.



마크 뷰캐넌의 『내일의 경제』, 『사회적 원자』로 읽는

트럼프, 브렉시트 이후의 세계 정치


도널드 트럼프의 미국 대선 승리는 많은 이들에게 충격을 안겼다. 그가 처음 공화당 경선에 등장했을 때만 해도 사람들은 그의 인기를 하나의 해프닝쯤으로 취급했다. 그랬던 트럼프가 공화당 당내 경선에서 승리하자 사람들은 제도의 허점을 이야기할지언정, 그가 힐러리의 상대가 될 것이라고는 생각하지 않았다. 대선 캠페인 기간 중 다수의 언론과 지식인이 그의 무지와 몰상식을 지적하며 잇따라 입장을 밝혔고, 그를 지지하지 않는 이들은 그가 절대 대통령이 될 수 없다는 확신을 가졌다. 대선 기간 내내 높은 확률로 클린턴의 승리를 예측했던 대부분의 여론 조사 역시, 결국은 사람들이 더 큰 충격을 받게 된 이유 중의 하나였다.



대선 이후, 다양한 해석이 뒤따랐다. 진보와 보수, 인종, 학력이라는 전통적 대립에 더해서, 도시와 농촌, 러스트 벨트 등으로 대표되는 세계화가 초래한 중하류층 백인들의 피해 의식, 정치적 올바름에 대한 거부감 내지는 피로감이라는 사회적 이슈 등이 원인으로 지목되었고, 최근의 브렉시트와 함께 고립주의라는 이름으로 트럼프의 당선을 설명하려는 시도도 있었다. 이와 함께 이번 대선이 기성 정치에 대한 반발이라는 대중의 요구였다는 점에서 미국식 민주주의의 긍정적인 측면을 보여 주었다는 의견도 있었다. 그러나 과학자의 관점에서 이런 정치적 관점 못지않게 관심을 끈 것은, 바로 여론 조사의 명백한 실패이다.


특히 흥미로운 점은, 소위 ‘샤이 트럼프(shy trump)’라 불리는 현상이다. 우선 트럼프를 지지한다는 사실을 유권자들이  부끄러운 일로 생각하게 만들었던 어떤 분위기가, 결과적으로 사람들로 하여금 솔직한 마음을 밝히지 않게 만들어서 여론 조사의 신뢰도를 떨어뜨리는 한 요인으로 작용했다. 그 결과 대선 당일 사람들에게 더 큰 충격을 안겨 주었다는 것이다. 예를 들면 선거 당일까지도 뉴욕타임스의 85퍼센트를 비롯해 대부분의 언론사와 여론 조사 기관은 90퍼센트 이상의 확률로 힐러리의 당선을 예측했다. 과거 오바마의 승리를 정확하게 맞춰서 사람들의 주목을 받은 네이트 실버가, 선거 전 트럼프의 당선 확률을 30퍼센트대로 올린 것이 오히려 편향적인 예측이라고 비난받을 정도였다.


여론 조사의 실패는 이번만이 아니다. 영국의 브렉시트와 올해 있었던 한국의 20대 총선에서도 여론 조사는 실제 결과와 상이한 숫자를 제시했었다. 모두가 컴퓨터를 손안에 들고 다니며 하루가 다르게 새로운 기술이 등장해서 사람들을 놀라게 하는 21세기에, 그리고 가장 첨단의 기술과 고도의 지성이 자신들의 능력을 최대한 활용해 자웅을 겨룬 미국 대선에서 이런 오류가 생겼을까? 그리고 빅 데이터와 인공 지능으로 세상에 존재하는 모든 정보를 활용할 수 있게 된 지금 이 시대에 어떻게 이런 오류를 보완하거나 개선할 수 있을까?


비록 정치학의 영문명이 ‘political science’이기는 해도 정치를 엄밀한 의미에서 과학의 영역이라고 생각하는 이들은 많지 않을 것이다. 하지만 10여 년 전 『사회적 원자』로 사회 물리학의 등장을 국내에 알린 마크 뷰캐넌은 인문학의 영역으로 여겨졌던 사회적․정치적 현상 역시, 이 사회를 구성하는 인간들을 각각 하나의 원자로 가정하고 그 핵심적인 특징만을 고려하는 과학적 접근 방법을 이용해서 이 현상들의 다양한 측면을 설명할 수 있음을 보였다.




여론 조사는 사회의 정보를 추출하는 측정의 문제

특히 여러 정치적 상황 중 대선과 같이 결과가 확실하며 그 결과를 예측하는 다양한 방식의 데이터가 존재하는 경우, 우리는 보다 쉽게 과학적 도구를 사용할 수 있다. 여론 조사는 사회 시스템이 가진 정보를 추출하는 ‘측정’의 문제로 생각할 수 있다. 또한 기본적으로 여론 조사는 현재 상태의 파악만이 목적인데 비해, 만약 우리가 이런 시스템을 더욱 정교하게 모델링한다면 가상적인 여러 정치적 행위가 실제로 어떤 결과(예를 들어 지지율의 변화)를 가져올지, 곧 시스템이 어떻게 변할지를 알려주는 ‘예측’의 문제가 된다.



물론 여론 조사는 이미 통계학이라는 훌륭한 과학적 방법론이 바탕이다. 여론 조사의 기반이 되는 표본 추출(sampling)은 몇 가지 조건이 충족될 경우에, 전체 집단의 일부만을 조사함으로써 전체 집단의 특성을 파악할 수 있는 매우 강력한 방법이다. 한국 4000만 유권자의 특정 사안에 대한 선호를, 95퍼센트의 신뢰도와 2퍼센트의 오차로 파악하기 위해 필요한 표본의 수는 단 2,400여 명에 불과하다. (신뢰도와 오차의 의미는 어떤 후보의 지지도가 이 2,400여 명 표본 안에서 30퍼센트였다면, 그의 실제 지지도가 숫자 30에 오차 2를 빼고 더한 28퍼센트에서 32퍼센트 범위 내에 존재할 가능성이 95퍼센트라는 뜻이다.) 


그러나 이렇게 강력한 도구가 제대로 작동하려면 몇 가지 조건이 필요하다.  그 조건을 한 마디로 표현하자면, 추출된 표본이 전체 집단을 잘 대표해야 한다는 것이다. 만약 우리가 이상적인 표본 추출, 곧 전체 유권자들을 완전히 임의로(random) 뽑을 수 있다면 해결되는 문제다. 그러나 이런 이상적인 방법은 불가능하다. 우리가 전체 집단의 구성원을 똑같은 확률로 선택할 수 있는 마땅한 방법이 없기 때문이다. 예를 들어 집 전화를 이용한다면, 우리는 전체 사회 구성원이 아닌, 집에서 전화를 받는 특징을 가진 사람들의 의견을 모으게 된다. 토요일 오후의 시내 중심가를 지나가는 사람들이 전체 집단을 대표하지 못하는 것도 마찬가지다.


이 때문에 우리는 소위 말하는 후보정, 곧 각 집단을 고르게 반영하기 위한 조작을 시행한다. 예를 들면 집 전화를 받는 이들에게 출신 지역이나 소득, 성별, 학력 등을 물어보는 것이다. 그러나 최근의 여러 여론 조사에서 드러났듯이 이렇게 집단의 대표성을 정밀화하는 것만으로는 문제가 해결되지 않는다. 바로 위에서 이야기한 ‘샤이 트럼프’ 효과가 이 사실을 증명한다. 이 효과는 영국에서 보수적인 토리당을 지지한다는 사실을 밝히지 않은 ‘샤이 토리’나 1982년 미국 캘리포니아 주의 주지사 선거에서 상당수 백인이 인종주의 혐의를 피하기 위해 민주당 후보인 흑인 톰 브래들리를 지지하겠다고 말한 데서 나온 ‘브래들리 효과’와 동일하다. 즉 사람들은 자신의 속내를 어떤 이유로든 솔직하게 밝히지 않는다.




의견 너머의 본심을 알아내기

따라서 여론 조사, 곧 측정은 단순히 누군가에게 의견을 묻는 것을 넘어서 그의 현재 속마음을 알아내는 단계로 나아가야 한다는 사실을 알 수 있다. 그럼 어떻게 하면 그가 부끄럼 없이 자신의 속마음을 드러내게 할 수 있을까?


먼저 첫 번째 방법으로, 경제학과를 졸업한 한 지인의 학부 졸업 논문을 소개하려 한다. 아주 간단한 수학을 이용해서 실험에 참여하는 사람이 자신의 속내를 변호할 수 있게 만든 방법이다. 상대방에게 동전 하나를 스스로 던지게 한 후 앞면이 나오면 진실을, 뒷면이 나오면 진실과 무관한 임의의 대답을 하는 것이다. 그가 이 말을 그대로 따를 경우에, 우리는 이 실험의 결과와 실제 지지율 사이에서 다음과 같은 관계식을 얻는다.


만약 모든 참가자가 힐러리를 지지한다면, 이 실험에서 힐러리는 75퍼센트의 지지율을 얻을 것이다. 동전 앞면이 나온 절반의 참가자는 힐러리를 지지한다고 말할 것이며, 동전 뒷면이 나온 절반의 참가자 중 다시 절반이 힐러리를 지지한다고 말할 것이기 때문이다. 같은 방식으로 만약 절반의 참가자가 힐리러를 지지한다면, 이 실험에서도 힐러리의 지지율은 50%로 나타난다. 모든 참가자가 트럼프를 지지한다면 힐러리의 지지율은 25퍼센트로 나타난다. 따라서 이 실험의 결과 값과 실제 지지율 사이에는 간단한 선형적 관계가 성립한다.



물론 몇 가지 문제는 있다. 우선, 설문조사에 응한 이는 자신의 본심을 완벽하게 숨기지 못한다. 만약 그가 트럼프라는 답을 할 경우, 나는 그가 실제로도 트럼프를 지지하는 사람일 가능성이 여전히 75퍼센트임을 알 수 있다. 물론 확신과 확률 사이에는 차이가 엄청나므로 여전히 이 방법은 유효하다. 한편 현장에서 혹은 수화기 너머로 동전을 던지게 하는 것은 여러 번거로움을 동반한다. 하지만 이 문제는 응답자만이 아는 (동시에 확률 분포가 알려진) 정보로 해결할 수 있다. 예를 들어 우리는 응답자의 나이를 묻지 않으면서, 본인의 나이가 짝수냐 홀수냐에 따라 진심 혹은 임의의 답을 하게 만들 수 있다. 한편 이 방법의 또 다른 명백한 단점은 통계적으로 같은 오차를 얻기 위해서는, 더 많은 표본을 조사해야 한다는 것이다.


본인의 속내를 묻지 않으면서 정보의 측면에서도 더 많은 양의 정보를 얻을 수 있는 또 다른 방법으로, 주변 예측(peer prediction)이 있다. 이는 응답자에게 ‘누구를 지지하는지’ 묻는 것이 아니라, 자신의 친구와 이웃 등 주변인들을 볼 때 ‘누가 될 것 같은지’를 묻는 것이다. 그가 정확하게만 대답한다면, 이 방법이 더 많은 정보를 이끌어 낸다는 것은 명백해 보인다. 통계적으로는 표본의 수를 늘이는 것과 비슷한 효과가 난다. 물론 이런 질문에 대해서도 본인의 의견에 더 많은 비중을 두어 대답할 가능성이 있으며, 이것을 막기 위해 일반적인 설문조사에서는 다수의 최종적 의견을 맞출 경우에 일정한 보상을 주는 등의 인센티브를 설계하기도 한다. 한편 비슷한 성향의 사람들이 뭉치는 끼리끼리 효과가 이 방법의 장점을 상쇄하는 문제도 있다.




인공지능으로 여론을 분석하는 미래의 정치

여론 조사의 또 다른 한계 중에는, 마지막 순간에 마음을 바꿀지 모르는 유권자의 결정을 파악할 수 없다는 것이다. 기표소 내부는 21세기에는 드물게도 사생활이 완벽하게 보호되는 장소다. 사람들은 그 순간까지 드러내지 못했던 본인의 마음을, 어쩌면 자신도 모르게 드러낼지 모른다. 오늘날 의식과 무의식에 대한 다양한 연구들은 특정 주제에 대한 한 사람의 무의식적 편향을 측정할 수 있는 도구를 만들어 냈다. 바로 ‘내재적 연관성 검사(IAT)’이다. 시험자는 특정 개념에 대한 응답자의 반응 속도를 측정함으로써, 개념들 사이의 연관성을 측정해서 때로는 응답자 본인도 알지 못하는 무의식을 파악할 수 있다.


예를 들어, 긍정적 혹은 부정적 개념들과 힐러리와 트럼프에 사이의 연관성을 알아봄으로써 응답자의 속마음을 파악할 수 있을 것이다. 이 검사에 앞서 누구를 지지하는지 묻고, 이 결과와 서로 다르다면 더욱 흥미로울 것이다. 이것을 검사하기 위해 특정한 기계는 필요하지 않다. 데스크탑뿐 아니라 스마트폰만으로도 반응 속도를 밀리세컨드 단위로 측정해, 지구 반대편 응답자의 무의식도 알아낼 수 있다. 실로 21세기에 어울리는 방식이다.


하지만, 이런 모든 방법들은 커다란 단점이 존재하는데, 바로 한 사람의 의향을 알기 위해서 조사 대상이 되는 사람과 그를 조사하는 조사원의 상당한 시간과 주의가 필요하다는 것이다. 설사 조사원을 자동화하더라도 피조사원을 자동화하는 것은 불가능하며, 이것은 결국 비용으로 돌아온다. 하지만 다양한 종류의 센서가 온갖 종류의 빅데이터를 만들어 내고, 그 데이터를 해석하는 인공 지능이 존재하는 이 시대에 좀 더 나은 방법은 없을까? 과학적으로 말하면, 측정되는 대상의 상태 변화를 최소화하는 그런 측정 방법이 없을까?


당장 떠오르는 것은 페이스북, 트위터 등의 SNS이다. 솔직히 말해서 SNS에는 너무 많은 정보가 존재한다. 누군가 묻지 않아도 사람들은 자신의 의견을 드러내기에 여념이 없다. ‘사람들이 왜 자신의 의견을 드러내고 싶어 하는가?’는, ‘사람들이 왜 다른 사람의 의견을 알고 싶어 하는가?’만큼이나 흥미로운 문제지만, 여기에서 다루기에는 적절하지 않을 것이다. 한편 많은 이들이 다른 사람을 설득하거나, 자신의 편을 확인하려는 의도를 가지기 때문에, 이것은 허위 계정과 함께 데이터를 해석하는 데 노이즈로 작용한다. 그러나 여러 다양한 정보들, 예를 들어 어떤 이의 지지 후보가 바뀌는 경우라든지, 해당 계정이 SNS에 소비하는 시간 등의 데이터를 알게 된다면 보다 유의미한 정보를 끄집어 낼 수 있을 것이다. 물론 이 방법의 큰 단점은 소리 없는 다수의 의견은 알 수 없다는 것이다.


최근의 인공 지능 기술을 이용해, 소리 없는 다수의 의향을 파악하는 간단한 방법을 생각할 수 있다. 예를 들어 지하철 출입구 같은 곳에 특정 후보들의 광고 혹은 이미지를 번갈아 틀어 놓고 지나가는 사람들의 표정, 혹은 반응을 살피면 어떨까? 최근 MIT는 영상 속 사람들의 표정을 상당히 정확한 확률로 구분하는 인공 지능 기술을 선보였다. 그 차이가 미미하더라도, 하루 수만 명이 오가는 장소에서 사람들의 반응 차이를 파악할 수 있다면 유의미한 정보가 나올 수 있다. 아니, 굳이 표정을 추적하지 않더라도 그저 광고를 보기 위해 멈춰 서는 이들의 수만 따져도 여론을 파악할 수 있을 것이다.




트럼프를 지지한 데이터 기업, 팔란티어

사실 지금까지 이야기한 방법들은 사람들의 관계를 모델링하지 않았다는 점에서, 엄밀히 말해 사회 물리학이라 하기는 힘들 것 같다. 하지만 이런 모델링을 만들기 위한 데이터의 역할은 할 수 있다. 사회 물리학은 보다 야심찬 목표를 내세운다. 앞서 이야기한 『사회적 원자』의 저자 마크 뷰캐넌은 후속 저서인 『내일의 경제』에서 보다 대담한 제안을 한다. 바로 ‘세계 금융 예측 센터’와 같은 것을 만들어 모든 금융 주체들 사이의 대출과 지분, 레버리지 등을 포함하는, 거대한 시뮬레이션을 시행해서 세계 경제의 미래를 예측하고 위험을 막자는 것이다. 물론 그 역시 이런 방법으로도 어떤 특정한 사건이 언제 일어날지를 예측할 수 있다고는 생각하지 않는다. 그러나 정책에 따라서 어떤 종류의 사고 확률을 높아질지는 이 시뮬레이션으로 알아낼 수 있음을 보였다.


마크 뷰캐넌, 『사회적 원자』


마크 뷰캐넌, 『내일의 경제』


정치에서도 이런 종류의 시뮬레이션을 하지 못할 이유가 있을까? 사람들이 누군가를 지지하는 데는 다양한 이유가 존재하지만, 그것들이 전혀 상상할 수 없을 정도로 독특하지는 않다. 특히 한국 같은 경우에 거주지, 출신 지역(혹은 부모님의 출신 지역), 연령대 정도의 정보만으로 그가 어느 당을 지지할지 꽤 높은 확률로 예측 가능할 것이다. 학력과 소득 수준, 그리고 친구 관계를 파악한다면 이 확률은 더 높아질 것이다. 그리고 사람들을 데이터로 더 자세히 분류할 수 있다. 안보와 인권, 시장 경제와 복지, 또 자유와 평등 중 무엇을 중시하는지 등의 기준에 따른 각각의 비율과 또 그 안의 여러 세부 주제들에 따라서도 이 분류는 다시 나뉠 것이다. 즉 적절한 ‘여론 예측 모델’이 만들어 질 경우에, 어떤 정치적 행위가 어떤 결과에 이를지를 예측할 수 있게 된다.


사람들의 이런 세부적인 성향에 대한 데이터를 구하는 손쉬운 방법이 있다. 종종 SNS에서는 사람들에게 본인의 정치적 성향을 알려 주겠다고 선전하는 웹사이트가 뜬다. 그 사이트들이 사람들의 성향을 알려 주는 동시에, 그들의 성향을 파악한다는 것은 거의 명백하다. 물론 이 성향이 전체 유권자를 대변하지는 않는다. SNS를 즐기며, 자신의 정치적 성향에 관심이 있고, 또 이것을 드러내기를 부끄러워하지 않는 이들의 성향이다. 또한 약간의 시간적 여유가 있는 이들일 것이다. 안타깝게도 그런 웹사이트는 나처럼 의심 많은 사람의 정치적 성향까지는 수집하지 못한다. 하지만 인간이 스스로가 어떤 사람인지를 얼마나 궁금해 하는지는 이미 잘 알려져 있으며(마치 거울이 눈에 띌 때마다 거울을 보는 것처럼, 사람들은 자신이 누구인지 알려주는 테스트가 눈에 띌 때마다 이를 시도하는 것 같다.), 그 덕분에 이런 웹사이트는 늘 충분한 양의 데이터를 수집하고 있다. 이 시점에서 미국의 데이터 기업 팔란티어의 회장인 피터 틸이 트럼프를 지지했다는 사실이 떠오르는 것은 왜일까?





민주주의는 공학의 문제가 될 것이다

이 외에도 시대에 따라 바뀌는 수많은 변수들이 있다. 올림픽이나 월드컵 같은 스포츠는 국가주의에 영향을 미쳐서 특정 정치 세력에 유리할 수 있다. 자연 재해나 경제적 사건은 물론이고, 인터넷과 스마트폰 같은 기술도 다양한 방법으로 사람들을 진보적, 혹은 보수적으로 바꾼다. 앞에서 살핀 다양한 부류의 사람들이 다시 어떤 요소에 더 민감하게 반응하는지에 이르면, 이제 인간의 본성과 심리학이 등장해야 할 것이다. 이런 데이터들을 이용해서 예측 모델은 점점 더 정교해질 수 있다. 그리고 A/B 테스트처럼, 능동적으로 데이터를 축적하는 것도 가능하다. 일부 지역에만 특정 정책을 발표하고 그 결과를 실시간으로 수집해서 정책의 내용을 조절할 수도 있다. 이런 과정을 수행하는 데도 인공 지능은 상당한 역할을 맡을 것이다.


결국 정치, 혹은 민주주의는 공학의 문제가 될 것이다. 어떤 세력이 더 정확한 모델을 가졌는지가 정치에서 중요한 요소가 될 것이다. 이상과 설득보다 데이터와 숫자가 우선할 것이다. 그러나 우리는 걱정할 필요가 없다. 만약 우리 사회의 교육 수준이 충분히 상승한다면, 그 결과 사람들이 자신의 행복을 현명하게 원할 수 있게 된다면, 궁극적인 ‘여론 예측 모델’은 그대로 ‘사회 행복 모델’로 쉽게 바뀔 수 있다. 즉 더 정확한 모델이란 많은 사람들이 원하는, 혹은 많은 사람들의 이익이 더 정확히 반영되는 모델일 것이다. 이것은 기술에 대한 믿음이자, 인간에 대한 믿음이기도 하다. 결국 기술은 과거 인류의 꿈에 그쳤던 진정한 공리주의를 실현하도록 만들어 줄 것이다.


이효석

KAIST 물리학과를 졸업하고 동 대학원에서 양자 광학으로 이학박사 학위를 받았다. 전자통신연구소(ETRI)에서 연구원으로 LTE 표준화에 참여했고, 미국 하버드 대학 전자과에서 연구원으로 근무했다. 현재 의료재활기기 벤처회사인 (주)네오펙트에서 CAO로 데이터 사이언스팀을 맡고 있다. 옮긴책으로 『내일의 경제』가 있으며, 2012년 외신 번역 큐레이션 사이트인 뉴스페퍼민트를 만들어 현재 대표로 있다.

뉴스페퍼민트 [바로가기]