본문 바로가기

[단독] 기보 없이 스스로 바둑 실력 키워 … 더 똑똑해진 ‘알파고 2.0’ 나왔다

중앙일보 2017.01.26 02:30 종합 13면 지면보기
구글 딥마인드가 개발한 인공지능(AI) 바둑 프로그램 ‘알파고’의 두 번째 버전이 나왔다. 새로운 알파고는 인간의 기보 없이 강화학습만으로 스스로 성장해 한계를 찾는다는 점이 특징이다.
데미스 허사비스(사진) 구글 딥마인드 최고경영자(CEO)는 지난 17일 독일 뮌헨에서 열린 ‘2017 디지털·라이프·디자인(DLD) 콘퍼런스’에서 “알파고가 새로운 한계를 시험하고 있다”며 “두 번째 단계로 ‘알파고’에 기보를 입력하지 않고 처음부터 자체적인 강화 학습만으로 기력을 향상시키는 시험을 하고 있다”고 밝혔다. 허사비스는 이 밖에 도전 과제로 “알파고의 수법을 이해하고 강화 학습의 한계를 찾아 바둑에서 신의 경지에 도달하는 것”이라고 밝혔다.
관련 기사
이는 알파고의 수준을 한층 더 업그레이드하기 위한 고안으로 풀이된다. 이제까지 구글 딥마인드는 알파고에 10만 개의 기보를 입력해 강화 학습을 반복하는 방식으로 기력을 향상시켜 왔다. 감동근 아주대 전자공학과 교수는 “기보 입력으로는 알파고가 인간 수준을 크게 뛰어넘기 얻기 어렵다고 판단, 새 접근법으로 돌파구를 찾으려는 듯하다”며 “자체 강화 학습만으로 훨씬 더 수준 높은 AI 바둑 프로그램이 나올지, 아니면 기존의 한계에 수렴할지 등은 지켜봐야 한다”고 말했다.

인간 기보로는 큰 도약 어려워져
구글, 새 접근법으로 돌파구 모색

구글 딥마인드뿐 아니라 중국의 텐센트그룹도 같은 시도를 하고 있는 것으로 알려졌다. 지난해 3월부터 AI 바둑 프로그램 ‘싱톈(刑天)’을 개발 중인 텐센트그룹은 최근 또 다른 AI 바둑 프로그램 ‘리룽(驪龍)’을 내놓았다. 리룽 역시 기보 입력 없이 강화 학습만으로 기력을 향상시키고 있는 것으로 전해진다. 리룽은 현재 글로벌 바둑 사이트 ‘한큐 바둑’에서 세계 최고수를 상대로 80%대 승률을 거두고 있다. 아직 싱톈(90%)보다 승률이 떨어지지만 기풍이 매우 특이하다. 리룽과 대국한 한 프로기사는 “기풍이 매우 공격적이고 변칙적인 수를 많이 둔다”고 평했다.

중국 텐센트도 비슷한 방법 시도 중

한편 데미스 허사비스는 이날 DLD 콘퍼런스에서 알파고가 구글의 전력 소비를 줄였다고 밝혀 주목을 끌었다. 허사비스는 “구글의 데이터센터가 평소 어마어마한 전력을 소비하는데 알파고의 알고리즘을 바둑 두는 데 쓰는 대신 데이터센터의 냉각 장치를 최적화하는 데 활용해봤다”며 “냉각 장치에 쓰이는 에너지가 40% 감소했고, 결과적으로 데이터센터 전체의 전력 소비가 15% 감소했다”고 밝혔다.

허사비스는 또 “AI는 인간의 독창성을 증가시키고 진정한 잠재력을 발휘할 수 있는 놀라운 도구”라며 “인간과 AI가 힘을 합치면 엄청난 것들을 이뤄낼 수 있다”고 전망했다. 구글 공동 창업자인 세르게이 브린은 20일 스위스에서 열린 ‘2017 다보스포럼’에서 “AI는 그 한계와 영향력을 예측하기 어렵다”면서도 “사람들은 AI를 통해 더욱 창의적이고 의미 있는 곳에 시간을 쓸 수 있게 될 것”이라고 밝혔다.

정아람 기자 aa@joongang.co.kr
공유하기

중앙일보 뉴스레터를 신청하세요!