본문 바로가기

길안내 데이터엔 사람들 생생한 삶이 녹아있다

중앙선데이 2018.09.29 00:30 603호 11면 지면보기
길안내 빅데이터 분석 <하> 한국인 일상
유승일 카카오모빌리티 데이터랩장. [김경빈 기자]

유승일 카카오모빌리티 데이터랩장. [김경빈 기자]

“내비게이션이 ‘아직도 2차선이야. 3차선으로 가세요’라고 안내하면 멋지지 않을까요.”

‘카카오 모빌’ 데이터랩장 유승일 박사
갑자기 방문 몰리는 ‘핫스팟’ 주목
사람들 생활·욕망의 변화 알려줘
최적 차선까지 안내 방법 연구 중

 
카카오내비·카카오택시 등의 서비스를 운영하는 카카오 모빌리티 데이터랩장 유승일(33·사진) 박사가 말하는 길안내의 미래다.
 
유 박사는 인공지능(AI)의 한 분야인 머신러닝 전문가다. 2014년부터 4년 간 구글 리서치(현 구글 AI)에서 소프트웨어 엔지니어로 일하다 지난 2월 카카오 모빌리티에 합류했다. 유  박사를 지난 18일 경기 성남시 판교 본사에서 만났다.
 
카카오 길안내 데이터가 교통량에 관한 공공데이터와 어떤 차이가 있나.
“고속도로에 드문드문 설치된 적외선 속도 센서로 측정하는 속도보다 GPS 기반의 내비게이션 데이터가 정확할 수밖에 없다. 하지만 GPS 데이터에도 노이즈가 많다. 예를 들어 휴게소에서 많은 차량이 서 있으면, 휴게소 옆길에선 차들이 시속 100㎞로 달리고 있어도 평균 속도가 떨어진다. ‘맵 매칭(map matching)’ 기술로 두 가지 흐름이 합산되지 않도록 데이터를 처리한다.”
 
방대한 데이터를 어떻게 관리·가공하나.
“전국의 모든 도로를 몇 미터 단위 600만 개 정도로 잘라서 구간별 속도를 1분 정도의 시간마다 업데이트한다. 속도 센서는 그 지점에서의 속도만 알 수 있지만 우리는 경로별 속도를 파악할 수 있다. 누적된 데이터를 AI 기반의 예측 모델로 처리해 미래의 소요 시간을 예측한다. ‘내일 아침 8시에 출발하면 평창까지 얼마나 걸릴까’를 미리 알려줄 수 있다.”
 
내비게이션 데이터의 핵심은.
“POI(Point of Interest: 목적지 상호명) 데이터다. 코엑스에 가려는 사람은 내비에 ‘코엑스’라고 찍지 ‘강남구 삼성동 영동대로 513’이라는 주소나 위도·경도를 입력하진 않는다. 빠르게 변화하는 한국 사회에서 목적지 상호명을 얼마나 빠르고 정확하게 업데이트하느냐가 길안내의 경쟁력을 좌우한다.”
 
핫스팟 분석의 의미는.
“길안내 건수로는 전국에서 사람이 몰리는 인천국제공항이 항상 1등일 수밖에 없다. 우리는 특정한 시점에 갑자기 길안내 건수가 증가하는 지점(핫스팟)들에 주목한다. 언제 왜 특정 장소에 사람이 몰리는지에서 사람들의 생활과 욕망을 읽을 수 있다. 지도 검색과 달리 실제 이동 여부를 알 수 있기 때문이다. 찾아본 맛집과 가본 맛집 정보의 가치는 질적으로 다르다.”
 
이용자들의 성향이 데이터 성격에 영향을 미칠 것 같다.
“주말에 이용자가 집중되는 게 가장 큰 한계다. 많은 사람들이 주기적으로 이용해야 데이터가 정확해질 수 있기 때문이다. 길 안내 도중 휴대전화가 오는 등의 이유로 도착 전에 안내를 종료하는 경우도 많다. 하지만 처음에 목적지를 찍어 예측 경로를 알기 때문에 소요 시간 등을 파악하는 데 문제는 없다. 길안내를 무시하고 자기 원하는 길로만 다니는 사람들의 ‘경로 이탈’도 유의미한 수준으로 누적되면 새로운 경로가 된다. 통계적으로 내비의 안내를 따른 사용자들의 이동 시간이 짧았다.”
 
길안내의 미래는.
“나는 운전을 잘 못해 큰 길을 선호하지만 운전을 잘하는 아버지는 좁아도 빠른 길을 선호한다. 이런 개인의 취향까지 반영되면 보다 만족도 높은 추천 경로를 제시할 수 있을 것 같다. 어떤 도로를 어떤 속도로 달리고 있는지는 알 수 있지만 아직 몇 차선에서 달리는지는 알 수 없다. 차선별 이동 속도와 이용자의 현재 차선을 확인해 최적 차선을 안내하는 방법을 연구중이다.”
 
탐사보도팀=임장혁·박민제·이유정 기자
김나윤 인턴(성신여대 화학4) deeper@joongang.co.kr
관련기사

선데이 배너

공유하기
광고 닫기