본문 바로가기

고전과 소설 속에 숨어 있는 깨알을 찾아라

중앙선데이 2014.12.13 03:06 405호 21면 지면보기
이 교수가 구글의 ‘ngram viewer’의 창을 열었다. 오색선의 곡선이 파도를 만든다. “대체 이게 뭐죠?”

이어령과 떠나는 知의 최전선 <14> 구글의 빅 데이터

대답 대신 검색창에 ‘cat’이라고 친다. 또 고양이 일곱 마리(이 교수의 컴퓨터) 이야기인가 싶어 시큰둥했는데, 곧 이어 ‘dog’이라고 치자 창에 두 줄의 곡선이 생겼다. 왼쪽에는 1800년 오른쪽에는 1980년이라는 연대숫자가 보인다. 통계 곡선 그래프가 분명한데 무슨 뜻인지 모르겠다.

“잘 봐요. 구글 클래식 알고 있지요. 아이비리그의 대학 도서관에서 시작해 그동안 중요 도서관의 책들을 통째로 스캔해 만든 자료인데 그 책들에서 사용된 문자들을 검색하면 이런 통계곡선이 생겨.”

“여기 곡선이 아래로 확쳐진 것이 개야. 1930년경이지. 그때 나온 책들 속에서 개라는 단어가 줄어든 것은 세계를 휩쓴 대공황기를 보여줘. 개는 사람과 똑같은 식량을 소비하니까 못 키우는 것이지. 그런데 이 곡선의 고양이는 반대로 올라가고 있잖아. 관심이 개에서 고양이로 옮겨갔다는 증거야. 이게 바로 빅 데이터의 위력이거든. 대공황이 개와 고양이에게 미치는 영향을 한 눈에 볼 수 있지.”

그리고 이번에는 직접 ‘KOREA’ ‘JAPAN’ ‘CHINA’라는 단어를 차례로 집어넣었다. 19세기 때만 해도 중국의 곡선은 하늘에 있고, 일본은 중턱에 그리고 한국은 거의 땅 위에 깔려 있다. 세계의 책 속에서 한국이란 국명이 거론되지 않았음을 알 수 있다.

그러나 1950년부터 갑자기 한국의 곡선이 올라간다. 한국전쟁 경제성장 IT붐이 일어나면 곡선은 치솟는다. 세계인들이 동아시아 삼국에 대한 관심을 일목요연하게 읽을 수 있는 것이다. 우리가 지금 세계의 어디에 있는지 어휘 검색으로 단 1초만에 볼 수 있다. 이것이 바로 이 교수의 데이터 사냥을 도와주는 도깨비 방망이구나-. 헌데 그것도 다가 아니었다.

“그런데 진짜 데이터는 책 속 어휘가 아니라 유명 소설 작품 속에 숨어 있어. 소설 자체가 실은 역사의 빅 데이터거든. 소설의 소자가 작을 소(小)잖아. 자잘한 데이터들이 가득 차 있거든. 빅토르 위고의 『레미제라블』의 경우 사람들은 보통 장발장, 빵 훔친 것, 은촛대, 코제트 정도를 떠올리잖아. 그런데 소설의 큰 줄거리가 아니라 작은 부스러기들에 눈을 돌려봐. 놀라운 자료들이 숨어 있어. 그래서 소설은 대설이 아니라 소설인거야.”

“그럼 『레미제라블』에서 뭘 찾아내셨는데요?”

“소설을 보면 나폴레옹 군대가 제일 두려워한 것은 영국 웰링턴 장군의 정예부대가 아니라 급조된 켐트 장군 사단의 신병들이라고 씌여 있어. 어느 역사책에서도 나오지 않는 자료거든. 갑자기 투입된 그 신병들은 훈련도 제대로 한 적이 없어서 닥치는 대로 각자 알아서 싸운거야. 뿐만 아니라 나폴레옹 군대가 얼마나 무서운 지도 하룻강아지들이라 몰랐으니 무식하게 싸웠을 수 밖에. 그야말로 요즘 같은 게릴라전, 비대칭전이잖아. 여기서 나는 근대 전쟁, 현대 경영학의 효시를 찾아낸 거지. 명령 하나로만 움직이는 부대가 아니라 개개인이 살아있는 조직이 대 나폴레옹을 이겼다는.”

“워털루 전투가 1815년이니 19세기 초반에 이미 근대의 조짐이 생겨났다는 의미군요.”

“그런데 문제는 웰링턴 장군이 그들의 승리를 보고도 달갑지 않게 여겼다는 거야. 새로운 전법, 새 시대가 오고 있음을 몰랐지. 우리 주변에도 얼마나 많은 웰링턴 장군이 있나? 훌륭한 지휘관이란 명성을 얻는 순간 벌써 그는 낡은 구식 장군이 됐음을 이 작은 데이터로 알 수 있어.”

호메로스의 『일리아드』는 단순한 문학 작품이 아니라 3000년 전 희랍 문화의 백과사전이라고 했다. 무슨 옷을 입고 무기는 어떻게 생겼고 당시 왕들의 커넥션은 어떻고 등등 모든 것이 들어있는. 여기서 찾아낼 수 있는 보물이 무궁무진하다고 했다.

“내가 이런저런 얘기를 하면 ‘도대체 그런 자료는 어디서 얻느냐’고 묻는 경우가 많아. 데이터가 아무리 많아도 유효한 것을 끌어내려면 항상 촉을 세우고 있어야 해. 그래서 빅 데이터 연구에 인문학이 중요한 것이지. 관심이 많아야 하고 또 잡(雜)스러워야 돼. 잡담이니 잡학이니 하는 것처럼 사람이 약간 잡스러워야 남들이 생각하지 못했던 것과 접할 수 있어.”

독수리의 눈과 개미의 눈을 동시에 가지라던 말이 또다시 머리에 떠올랐다.


글 정형모 기자

선데이 배너

공유하기
광고 닫기