"AI는 노동집약적 산업…데이터 수집은 사람 몫"

율촌·한경 주최 '아시아 미래 AI 포럼'

AI는 방대한 데이터 기반으로
최적의 의사결정 돕는 조수
딥러닝으로 똑똑하게 만들어야
최대우 한국외국어대 교수가 지난 15일 서울 삼성동 법무법인 율촌에서 열린 ‘아시아 미래 AI포럼’에서 인공지능산업의 특징을 설명하고 있다. /신경훈 기자 khshin@hankyung.com
“인공지능(AI)은 노동집약적인 산업이에요. 의외로 사람 손이 많이 갑니다.”

최대우 한국외국어대 교수는 지난 15일 서울 삼성동 파르나스타워에서 열린 ‘아시아 미래 AI포럼’에서 AI산업의 속성을 이렇게 설명했다. 빅데이터 전문가인 최 교수는 AI 스타트업(신생 벤처기업)인 애자일소다 대표를 맡고 있다. 애자일소다는 AI 분석업체다. 자동차 사고 현장 사진을 AI로 분석해 자동으로 보험료 견적을 뽑는다.데이터의 양과 질이 AI 역량 결정

지난해 6월 출범한 ‘아시아 미래 AI포럼’은 법무법인 율촌과 한국경제신문사가 4차 산업혁명의 꽃으로 불리는 AI 분야 경쟁력을 높이기 위해 만든 포럼이다. 학계·연구기관·기업·국회·정부 등 각 분야 30여 명의 전문가가 회원으로 참여하고 있다.

최 교수는 AI를 방대한 데이터를 기반으로 최적의 의사결정을 도와주는 에이전트(조수)라고 정의했다. 이 에이전트를 똑똑하게 훈련하는 기술 중 하나가 딥러닝이다. 이미지, 음성 등 다양한 데이터를 기반으로 반복학습을 시킨다.사진 속 동물이 개인지, 고양인지 구분하는 AI의 사례가 널리 알려져 있다. AI 에이전트에게 사진을 주고 개인지 고양이인지 고르게 하는 게 첫 단계다. 맞을 때도 있고 틀릴 때도 있다. 정답과 오답 정보를 지속적으로 AI에 입력하는 게 다음 단계다. AI의 성능을 좌우하는 것은 컴퓨터 등의 하드웨어도 AI의 알고리즘도 아니다. 얼마나 정확하고 다양한 개와 고양이 사진이 주어졌느냐다.

최 교수는 구글의 AI가 잘하는 이유가 기술력 때문만은 아니라고 했다. 무한하다고 할 만큼 많은 데이터를 보유하고 있는 덕에 AI의 학습속도가 빨랐다는 설명이다. 서재에 책이 많은 집에서 자란 아이가 똑똑할 가능성이 높은 것과 비슷한 이치다.

사람의 손은 고품질 데이터를 축적하는 단계에서 필요하다. 컴퓨터 프로그램만으로는 정확한 데이터를 가려내기 어렵다.그는 AI 글로벌 리더 중 하나인 페이페이 리가 AI 연구자를 위해 개설한 이미지 데이터 사이트 ‘이미지넷’을 예로 들었다. 이미지넷의 이미지 데이터를 모으는 데 167개국에서 4만8940명이 동원됐다.

중국의 강점은 데이터 가공인력

최 교수는 사고 현장 이미지로 자동차 수리비를 산정하는 프로그램을 개발하면서 컴퓨터의 한계를 느꼈다고 털어놨다. ‘YOLO’라는 딥러닝 기반 사물인식 기술을 썼을 때의 인식률이 55%에 불과했다.그는 “현실에선 범퍼, 펜더, 차량 문 등 다양한 사물이 겹쳐진 것이 많다”며 “여러 개의 사물이 겹쳐 있을수록 컴퓨터 프로그램의 인식률이 낮게 나타난다”고 말했다. 결국 최 교수도 수작업으로 되돌아갔다. 사람의 손을 빌려 100만 장이 넘는 이미지 데이터베이스를 구축했다.

최근 중국이 AI 비즈니스에서 눈에 띄는 성과를 내고 있는 것도 ‘사람’과 관련 있다는 설명이다. 특히 안면인식 분야에 강점이 있다. 센스타임, 이투, 메그비 등 중국 스타트업들은 세계 최고 수준의 기술력을 갖춘 것으로 평가받는다.

최 교수는 “개인정보에 대한 인식 수준이 낮아 안면인식에 활용될 사람 얼굴 데이터가 많고 이 데이터를 정확하게 가공해낼 노동력도 풍부하다”고 말했다.

김남영 기자 nykim@hankyung.com