본문 바로가기

IS

기사 제목에 마우스 올려놓자 “낚시성 기사일 확률 88%”

중앙일보 2018.05.08 01:06 종합 10면 지면보기
박건우 박사가 만든 프로그램을 적용하자 ‘낚시성 기사일 확률 88%’라는 문구가 나타났다.

박건우 박사가 만든 프로그램을 적용하자 ‘낚시성 기사일 확률 88%’라는 문구가 나타났다.

인터넷 사이트에서 기사 제목에 마우스를 올려놓으면 ‘낚시성 기사일 확률 00%’라는 표시가 뜬다. 확률은 0에서 100까지 표시된다. 100에 가까울수록 낚시성 기사(click bait)일 가능성이 크다는 뜻이다. 한국과학기술원(KAIST) 전산학부 박건우(34) 박사팀이 개발한 ‘낚시성 기사 판독 프로그램’이다. 그는 이 프로그램 개발에 딥 러닝 인공지능(AI) 기술을 활용했다. 2016년 1월부터 2017년 12월까지 2년간 네이버와 다음에 올라온 기사 200여만 건을 인공지능으로 분석했다.
 

KAIST팀 판독프로그램 개발
딥러닝 AI로 기사 200만건 학습
정확도 89% … 석달 뒤 무료 배포

박건우

박건우

분석은 단어를 숫자로 바꾸어 인공지능이 학습하도록 하는 방식으로 이뤄졌다. 제목과 본문에 나오는 단어가 같거나 의미가 유사하면 근사치의 숫자를 적용했다. 예컨대 ‘좋다’라는 단어의 숫자에 0.1의 값을 주면 ‘행복하다’는 단어에는 0.09의 값을 매기는 식이다. 이를 통해 제목과 본문의 단어를 숫자로 계산해 낚시성 기사와 일반 기사의 언어 패턴을 학습하도록 했다. 지난 4일 카이스트 연구실에서 만난 박 박사는 “인공지능이 기사의 제목과 본문의 수많은 패턴을 경험적으로 학습하도록 한 것”이라고 설명했다.
 
이 프로그램은 독자가 기사에 마우스를 올려놓으면 해당 기사의 인터넷주소(URL)가 서버로 자동 연결된다. 서버에서 작동하는 인공지능은 기사의 제목과 본문을 판독해 낚시성 가능성을 확률로 표시한다. 예를들어 ‘얼굴 반쪽 돼 ‘리즈’ 갱신한 엄지가 말한 다이어트 비법’이란 한 인터넷 기사에 이 프로그램을 적용했더니 낚시성 기사일 확률은 88%였다. 기사 본문을 읽어보니 다이어트 비법은 소개되지 않았다. ‘몸무게 54㎏에 55사이즈 유지 중인 올해 ‘52세’ 슈퍼 동안 김성령’이란 제목의 기사도 낚시성 기사일 확률이 88%였다. 이 기사의 본문은 김성령씨가 방송에 출연해 다이어트 비법을 소개한다는 것으로 제목과는 연관성이 별로 없었다.
 
박 박사 팀이 개발한 프로그램은 정확성이 높은 것으로 나타났다. 지난해 12월 8일 경기도 판교 경기창조경제혁신센터에서 열린 ‘인공지능 연구개발 R&D 챌린지’ 대회에서 기사 400건을 대상으로 실험한 결과 낚시성 기사 판단 여부 정확도가 89%였다. 정확도 89%는 당시 대회에 참가한 전문가들의 판정이다. 전문가들이 낚시성 기사로 판정한 기사와 이 프로그램에 낚시성으로 판단한 기사 일치도가 89%라는 의미다. 박 박사팀은 보완작업을 거쳐 3개월 뒤 이 프로그램을 특허 출원하고, 일반에 무료로 보급할 계획이다. 박 박사는 “이 프로그램을 인터넷에서 내려받아 누구나 활용할 수 있도록 할 예정”이라며 “휴대폰 애플리케이션도 개발할 계획”이라고 말했다.  
 
대전=김방현 기자 kim.banghyun@joongang.co.kr
공유하기
광고 닫기