본문 바로가기

부패 → 사드, 좌파 → 서민, 미래 → 계파패권 … 강조어가 변했다

중앙일보 2017.05.08 02:15 종합 3면 지면보기
전국의 유세 현장에서 문재인 더불어민주당 후보는 ‘부패 기득권 세력’, 홍준표 자유한국당 후보는 ‘문재인 후보’, 안철수 국민의당 후보는 ‘계파 패권주의’를 가장 많이 언급한 것으로 나타났다.
 

‘유세 때 가장 많이 한 말’ 분석
문, 1강 굳어지자 대결보다 안보로
홍, 문재인 비판서 감성적 호소로
안, 지지율 하락 뒤 ‘문 패권’ 공격
선거 판도 따라 중점 둔 말 바뀌어

중앙일보와 데이터 저널리즘 기관인 서울대 폴랩(pollab)의 한규섭 교수팀이 공식 선거운동이 시작된 지난달 17일부터 이달 4일까지 세 후보의 공식 유세문 46만여 개 글자를 분석한 결과다. 특히 선거운동 초반(4월 17~22일), 중반(23~28일), 후반(29일~5월 4일)으로 시기를 나눠 세 후보가 쓴 단어를 비교한 결과, 시기별 선거 판도에 따라 특정 단어의 이용 빈도가 달라졌다. 이하 ( ) 안의 숫자는 사용 횟수.
 
유세문 분석은 개별 단어보다 자주 붙어다니는 두세 개의 단어를 묶어 하나의 ‘키워드’로 분석하는 ‘엔그램(N-gram)’ 방식을 토대로 했다. 자료 : 데이터 저널리즘 기관 서울대 폴랩(pollab)의 한규섭 교수팀

유세문 분석은 개별 단어보다 자주 붙어다니는 두세 개의 단어를 묶어 하나의 ‘키워드’로 분석하는 ‘엔그램(N-gram)’ 방식을 토대로 했다. 자료 : 데이터 저널리즘 기관 서울대 폴랩(pollab)의 한규섭 교수팀

◆문재인, 심판에서 안보로=문 후보가 유세 중 가장 많이 사용한 단어는 ‘부패 기득권 세력’(35), ‘사드 배치’(31), ‘국민통합 대통령’(30)이었다. 시기별로 편차가 컸다. ‘부패 기득권 세력’은 초·중반 빈도수 1위를 기록하다 후반엔 14위로 떨어졌다. 또한 초·중반에 여러차례 언급했던 ‘정경유착’(15), ‘정권연장’(14)은 후반엔 한 번도 거론되지 않았다.
 
반면 후반엔 ‘사드(THAAD·고고도미사일방어 체계) 배치’(31)의 빈도가 가장 높았고, ‘정상회담’(23), ‘색깔론’(14), ‘북핵위기’(12) 등 안보 관련 단어가 크게 늘어났다. 한규섭 교수는 “정권 심판과 관련된 단어의 빈도가 높았던 문 후보는 1강 2중 구도로 바뀌자 대결성 어휘를 줄이고 안정적인 국정 운영에 방점을 뒀다”고 분석했다.
 
유세문 분석은 개별 단어보다 자주 붙어다니는 두세 개의 단어를 묶어 하나의 ‘키워드’로 분석하는 ‘엔그램(N-gram)’ 방식을 토대로 했다. 자료 : 데이터 저널리즘 기관 서울대 폴랩(pollab)의 한규섭 교수팀

유세문 분석은 개별 단어보다 자주 붙어다니는 두세 개의 단어를 묶어 하나의 ‘키워드’로 분석하는 ‘엔그램(N-gram)’ 방식을 토대로 했다. 자료 : 데이터 저널리즘 기관 서울대 폴랩(pollab)의 한규섭 교수팀

◆홍준표, 보혁 대결에서 서민 부각으로=홍 후보가 가장 많이 언급한 말은 ‘문재인 후보’였다. 무려 156회였다. 시기별로는 초기(78), 중기(52), 후기(26)에 차이가 있었으나 꾸준히 입에 올린 표현이었다. 이 밖에 ‘여론조사’(108), ‘좌파 정권’(100), ‘강단과 결기’(80), ‘종북좌파’(74), ‘강성 귀족노조’(72), ‘핵시설’(72)도 사용 빈도가 상위권이었다.
 
큰 틀에선 보수와 진보의 이념 대결로 끌고 가려는 전략이었지만 홍 후보도 시기별 변화가 있었다. 지난달 29일 이후 가장 많이 쓴 단어 1, 2위는 ‘경비원 아들도 대통령’(35)과 ‘서민 자녀’(32)였다. ‘문재인 후보’(26), ‘종북좌파’(19)는 줄었다. 초기에 ‘문재인=좌파’를 반복하며 지지층 결집에 주력하다, 후반으로 가면서 감성적인 수사(修辭)를 곁들이며 중도 확장에도 나선 것이라는 분석이다.
유세문 분석은 개별 단어보다 자주 붙어다니는 두세 개의 단어를 묶어 하나의 ‘키워드’로 분석하는 ‘엔그램(N-gram)’ 방식을 토대로 했다. 자료 : 데이터 저널리즘 기관 서울대 폴랩(pollab)의 한규섭 교수팀

유세문 분석은 개별 단어보다 자주 붙어다니는 두세 개의 단어를 묶어 하나의 ‘키워드’로 분석하는 ‘엔그램(N-gram)’ 방식을 토대로 했다. 자료 : 데이터 저널리즘 기관 서울대 폴랩(pollab)의 한규섭 교수팀

 
◆안철수, 강점 부각하다 공격 전환=안 후보가 가장 많이 언급한 단어는 ‘계파 패권주의’(60), ‘기득권’(40), ‘국민을 적폐’(33), ‘4차 산업혁명’(33), ‘글로벌 혁신 국가’(24) 등이었다. 선거운동 초반 안 후보 유세엔 대결형 단어가 많이 등장하지 않았다. ‘대한민국의 미래’(15) 같은 단어를 많이 썼다.
 
하지만 중반부터 달라져 ‘계파 패권주의’ 등을 사용하는 빈도가 급격히 증가했다. 안 후보가 양강 구도를 형성하고 있던 시기엔 ‘자강론’에 바탕을 둔 채 자신의 강점 부각에 치중했지만, 지지율 하락 추세를 보이자 친문 패권주의를 강조하는 공격형 유세로 전환했기 때문이다.
 
◆세 후보 키워드는=유세문 ‘의미망 분석’(Semantic Network Analysis)도 실시해 ‘연결 중앙성’(centrality)를 따져봤다. 연결 중앙성이란 단순한 등장 빈도가 아니라 다른 어휘들과 어떤식으로 관계를 맺는지를 통해 특정 단어의 실질적 가치를 보여주는 지표다. 분석 결과 문 후보는 ‘정권’(0.272), ‘교체’(0.255), 홍 후보는 ‘북한’(0.210), ‘서민’(0.207), 안 후보는 ‘미래’(0.386), ‘개혁’(0.183)의 연결 중앙성이 높았다.
 
최민우 기자 minwoo@joongang.co.kr
공유하기
광고 닫기