본문 바로가기

[조성준의 미래를 묻다] 통찰력을 갖고 싶은가, 빅데이터를 들여다 보라

중앙일보 2020.03.16 00:11 종합 20면 지면보기

빅데이터 시대 CEO의 조건 

조성준의 미래를 묻다_빅데이터 시대 CEO의 조건

조성준의 미래를 묻다_빅데이터 시대 CEO의 조건

취업 면접관은 여러 가지를 살핀다. 그중 하나가 금세 조직을 박차고 나갈 사람은 아닌지 하는 것이다. 100% 정확할 수는 없겠지만, 기업의 임원들은 오랜 경험을 통해 조기 퇴사할 것 같은 사람을 가려내는 눈을 갖추게 된다. 그럴 때 주변에선 이렇게 평가한다. “그는 사람을 가려내는 통찰력이 있다.”
 

숨겨진 소비자 불만 들추는 지혜
조기 퇴사자 미리 짚어내는 안목
빅데이터 활용해 얻을 수 있어
‘시민 데이터 과학자’ 소양 가꿔야

그런데 통찰력, 그러니까 인사이트는 경험을 통해서만 얻을 수 있는 것일까. 빅데이터를 통해서도 가능하다. 경험에 빅데이터를 더하면 한층 강한 인사이트를 얻을 수도 있다. 복사기로 알려진 제록스사는 콜센터 상담사의 조기 퇴사 문제를 빅데이터로 해결했다. 그간 쌓인 이력서와 심리검사 결과로부터 조기 퇴사자의 특징을 도출하고, 그런 특성을 가진 지원자를 아예 고용하지 않음으로써 조기 퇴사율을 20% 줄였다. 빅데이터에서 인사이트(조기 퇴사자의 특징)를 뽑아낸 사례다.
  
직관적·주관적 아닌 객관적 인사이트
 
빅데이터가 넘치는 세상이다. 우리는 10~20년 전과 완전히 다른 세상에서 살게 됐다. 이젠 빅데이터를 어떻게 활용할까를 고민하는 시대다. 빅데이터를 잘 활용해 인사이트를 뽑아내는 것이 성공의 가늠자다. 사례는 차고 넘친다. 주력 사업에서 얻은 빅데이터를 이용해 주력 사업보다 더 큰 신사업을 일구기도 한다.
 
항공기 엔진을 만드는 미국 GE가 그랬다. 비행기 엔진에서 발생하는 진동과 소음을 센서로 데이터화한 뒤 분석해 주요 부품의 고장 확률을 계산했다. 6개월이면 무조건 교체하던 부품을 ‘고장 확률이 높다’는 신호가 나올 때만 교체했다. 위험 신호를 감지하면 4개월밖에 안 됐어도 부품을 바꿔줌으로써 고장과 사고를 줄였다. 그 결과 엔진은 고장이 덜 났고, 불필요하게 부품을 자주 바꾸는 비용은 줄게 됐다.
 
GE가 개발해 판매한 이런 ‘예측 보전 서비스’는 몇 년 만에 엔진 매출을 넘어섰다. 데이터를 활용해 신사업을 만들어 매출을 2배 이상 늘린 셈이다. 통찰력 있는 부품 수리공이 소리만 듣고 어디가 잘못됐는지 알아내듯, 진동과 소음 데이터로부터 ‘부품의 고장 확률’이란 인사이트를 얻어 올린 성과다.
 
GE가 활용한 진동·소음 데이터는 사용 연수가 동일한 엔진이라도 전부 다르다. 또 24시간 내내 고장 확률을 전해줄 수 있다. ‘빅데이터 인사이트’의 특징인 ‘개별화’와 ‘쉼 없음’이 바로 이것이다.
 
소셜미디어 역시 빅데이터 인사이트의 원천이다. 어느 오븐 제조업체는 소셜미디어를 분석해 감춰져 있던 소비자 불만을 찾아냈다. ‘레시피대로 조리했는데 실패하는 일이 많다’는 것이었다. 소비자 불만의 원인에 대한 일종의 인사이트다. 추가 분석을 통해 원인이 브랜드마다 예열 온도와 시간이 달라야 한다는 데 있다는 것을 알아냈다. 어느 브랜드에든 통용되는 공통 레시피는 존재할 수 없었다. 이 회사는 결국 자기 제품에 맞는 레시피를 공개해 매출을 늘렸다.
 
영민한 직원이라면 직관적으로 혹시 브랜드마다 레시피가 달라야 하는 건 아닐까 하는 아이디어를 낼 수도 있다. 하지만 그건 어디까지나 주관적인 의견일 뿐이다. 반면 수십만 소비자의 글을 분석해 얻은 소셜미디어 인사이트는 객관적이다. 이런 객관성 또한 빅데이터에서 뽑아내는 인사이트의 특징이다.
 
이젠 너도나도 빅데이터에서 인사이트를 뽑아내려 한다. 가치 창출을 위해서다. 경영학적 표현을 동원했지만, 가치 창출이란 쉽게 말해 기업의 매출과 수익, 고객 만족 증대 등이다. 정부나 공공기관이라면 국민의 안전, 행복, 자부심일 것이다. 인사이트는 이런 가치를 만들어내는 데 필요한 새로운 지식이나 통찰력이다. 일반적으로 이는 해당 분야의 전문 지식과 오랜 실무 경험에서 얻었다. 이젠 여기에 더해 빅데이터를 분석함으로써 인사이트를 한층 확대 강화할 수 있다.
 
하지만 이건 거저 얻어지는 게 아니다. 기업이든, 공공기관이든, 의사 결정자가 빅데이터를 알아야 한다. 데이터과학자에게 무조건 “인사이트를 내놓으라”고 하는 건 어불성설이다. 고객과 식당 셰프 간의 관계를 생각해보자. 당연히 주문하는 고객이 의사결정자다. 당신은 요즘 스트레스가 심하다. 음식으로 그걸 풀고 싶다. 즉, 당신이 원하는 가치가 ‘스트레스 해소’다. 마침 어딘가에서 ‘매운 음식이 스트레스 해소 효과가 있다’는 기사를 읽은 적이 있다. 식당에서 당신은 매운 음식(인사이트에 해당한다)을 주문한다. 그러지 않고 셰프를 불러 다짜고짜 ‘스트레스 해소할 메뉴를 달라’고 하면, 아마 셰프는 당황해 쩔쩔맬 것이다.
 
빅데이터 인사이트도 이와 같다. 의사결정자가 데이터 과학자(셰프)에게 ‘매운 음식을 달라’는 식으로 보다 구체적인 주문을 해야 한다. 그러려면 의사결정자가 최소한 빅데이터 기초를 학습하는 게 필요하다. 스스로 데이터 과학자가 되라는 것이 아니다. 빅데이터 시대에 의사결정자는 적어도 아마추어 수준의, 이른바 ‘시민 데이터 과학자’가 돼야 한다.
  
‘데이터 주권’이 필요하다
 
빅데이터는 세상을 바꾸기 시작했다. 인공지능(AI)의 중요한 재료로, 또 기업과 공공기관의 의사결정에 중요한 요소로 자리 잡아 가고 있다. 관심을 가지고 배워야 하는 이유다. 문과든 이과든 빅데이터를 잘 다루면 취업이 잘 되고, 폭발적으로 늘어가는 공공데이터를 활용한 창업 기회도 많다.
 
빅데이터를 알아야 하는 이유는 또 있다. 우리가 만든 데이터에 대해 정부·국회·기업·시민단체가 주인 노릇을 한다는 점이다. 이들은 이념에 따라 “데이터를 완전히 자유롭게 쓸 수 있어야 한다”부터 “프라이버시 침해는 절대 안 된다”에 이르기까지 다양한 주장을 한다. 정작 데이터를 생성한 우리들의 의견은 묻지 않는다. 내가 주고 싶어도 못 준다. 그러나 내 데이터는 저작권을 현재 누가 가졌는지에 관계없이, 쓰고 싶어하는 주체가 내 허락을 받고 써야 하지 않을까. 사용 허락 여부는 데이터 생성자의 몫이어야 한다.
 
인생이란 … 데이터 생성의 연속
빅데이터는 어디서 오는가. 사람과 기계로부터다. 현대인은 삶 자체가 데이터 생성의 연속이다. 우리는 태어날 때와 세상을 뜰 때 출생신고와 사망신고를 통해 정부에 데이터를 만든다. 집 밖에 나가면 CCTV와 차량 블랙박스가 내 모습을 이미지 데이터로 바꾼다. 교통카드에 나의 족적이 남고, 운전하면 내비게이션이 나의 동선을 데이터화한다.
 
사무실에서 만드는 자료와 보고서 등은 문서로, 콜센터 상담원과 통화한 내용은 음성 파일로 저장된다. 신용카드 사용과 은행 입·출금 및 송금 내용도, 온라인 쇼핑도 모두 데이터가 된다. 스마트TV로 어떤 프로그램을 언제 봤는지, 냉장고 속 계란과 우유는 얼마나 남았는지도 데이터로 바뀌는 세상이 됐다.
 
아파서 병원에 가면 내 증상을 의사가 문서로 만든다. 혈액검사 결과나 X-레이 영상도 데이터다. 신종 코로나바이러스 감염증(코로나19)에 걸리면 최근 며칠간 언제 어디서 누구를 만났는지가 데이터로 공개된다. 물론 우리는 자발적으로 남들에게 보여주기 위해 일상을 페이스북과 인스타그램에, 생각을 트위터에, 이력서를 링크트인에 올리기도 한다.
 
문자메시지나 카톡은 주고받는 사람들 간의 관계를 매우 정량적으로 보여준다. 메시지가 오가는 때가 주말인지 주중인지, 근무시간인지 퇴근 후 저녁인지, 그리고 횟수와 내용까지 데이터화된다. 사실 잠을 잘 때도 스마트워치가 나의 수면의 양과 질을, 예를 들어 REM 수면(잠자는 도중 눈동자가 빠르게 움직이는 상태)은 얼마나 하는지를 측정한다.
 
다른 한편의 데이터 소스는 사물인터넷(IoT)이다. 공장 내 기계나 장비, 자동차·항공기·지하철역·도로·다리·논밭·공중에 센서를 설치해 온도·습도·풍량·풍속·진동·소음·일산화탄소·황산화물·미세먼지·초미세먼지를 24시간 내내 측정하고 데이터화한다.
 
이렇게 얻은 데이터는 유·무선 인터넷을 통해 한 곳에 다 모을 수 있다. 센서 기술, 인터넷 기술, 데이터 저장·관리·분석 기술, 그리고 컴퓨터의 계산 속도의 획기적인 발전이 이 모든 것을 가능케 했다. 스마트폰이 바로 이런 기술들의 총집합이요, 빅데이터 생성의 1등 공신이다.
◆조성준 교수
서울대 산업공학과 교수 겸 데이터마이닝센터장이다. 공공데이터에 관한 범정부 콘트롤 타워인 공공데이터전략위원회 위원장을 맡고 있다. 빅데이터 활용과 관련해 삼성전자·현대자동차·한국은행·건강보험심사평가원 등 대기업과 공공기관들을 자문했다.

 
조성준 서울대 산업공학과 교수 겸 데이터마이닝센터장

공유하기
광고 닫기