본문 바로가기

데이터메이커, 데이터 레이블링 기술로 사람 얼굴 이미지 2억개 처리

중앙일보 2021.03.02 10:54
데이터메이커 수행 누적 데이터 수량

데이터메이커 수행 누적 데이터 수량

최근 종영된 SBS 신년특집 ‘세기의 대결! AI vs 인간’은 모창, 골프, 주식 등 다양한 분야에서의 전문가와 AI의 대결을 그리며 다양한 분야에서 활용되는 AI를 선보였다. 5부작으로 방영된 해당 프로그램은 최고 7.4%의 시청률을 기록하는 등 인공지능 산업 분야에 대한 높은 관심도를 보여줬다.
 
이처럼 디지털 뉴딜 정책 이후 빠르게 성장하는 인공지능 산업분야에서 가장 주목받고 있는 데이터 레이블링 기술은 일반적인 상식을 뛰어넘는 데이터의 수량과 종류로 AI 기술 고도화에 가장 필요한 핵심요소로 손꼽힌다.
 
데이터 가공 전문 기업인 ㈜ 데이터메이커(대표이사 이에녹)는 최근 작년 한 해 동안 수행한 데이터 누적 수량을 공개했는데, 데이터메이커 플랫폼에서 비식별화 처리한 인물 안면 이미지는 약 2억개의 객체로 한반도와 일본에 있는 모든 인구의 총합에 가까운 수량이다.
 
이외에도 자율주행 AI 개발을 위해 차량, 보행자, 차선 등을 라벨링한 거리는 약 50,000km로 지구 둘레를 한바퀴 돌고도 10,000km가 남는 거리이며, AI 음성 인식에 활용되는 가공 음성은 총 6,000시간으로 뉴스 앵커가 하루 2시간씩 8년내내 쉬지 않고 말하는 시간과 같다.
 
데이터 댐을 방불케 하는 방대한 양의 데이터 처리가 가능한 바탕에는 AI 전처리 엔진과 고도화된 프로세스가 있다.
 
데이터메이커 오석일 이사는 “작업자 투입 전에 AI-assist 엔진으로 auto 라벨링을 수행하고 그 후에 작업자들이 간단한 수정 위주의 작업을 함으로써 하루 최대 10만장의 이미지를 처리할 수 있다”며 “많은 양의 데이터 가공에 소요되는 일정을 최대한 효율적으로 관리하는 운영 프로세스도 중요하다”고 전했다.
 
 
온라인 중앙일보
 
공유하기

중앙일보 뉴스레터를 신청하세요!