수학문제 풀고, 아이 울음도 분석…AI가 여는 '초개인화 기술'

21일 '구글플레이 개발자와의 대화' 열려
21일 ‘2020년 소비자 트렌드 - 초개인화 기술’을 주제로 ‘구글플레이 개발자와의 대화’가 진행됐다. 왼쪽 상단부터 시계 방향으로 이수지 디플리 대표, 황리건 원티드랩 제품총괄, 정원국 매스프레소 CTO, 이은아 구글코리아 부장/사진제공=구글플레이
수학 문제를 풀던 중 모르는 문제를 발견하면 어떻게 해야 할까. 말을 못하는 아이가 갑자기 운다면 어떻게 받아들여야 할까. 이 같은 난처한 상황을 해결하는 데 인공지능(AI)가 나섰다.

사진만 찍으면 처음 보는 문제의 풀이법이 나오고, 애플리케이션(앱)이 아이의 울음을 파악해 아이가 하고 싶은 말을 알려 준다. "이게 가능해?"라는 반응이 나올법 하지만 '초개인화'가 이를 구현시켰다.21일 구글플레이가 '2020년 소비자 트렌드-초개인화 기술'을 주제로 진행한 개발자와의 화상대화에서 이수지 디플리 대표와 정원국 매스프레소 최고기술책임자(CTO), 황리건 원티드랩 제품총괄은 자사 사업에 적용된 AI와 초개인화 기술에 대해 설명했다.

사운드 기반 스타트업 디플리는 AI 기반 아기 울음 분석앱 '와(WAAH)'를 소개했다. 아기가 내는 소리를 다양한 센서로 감지하고, 어떤 의미가 있는지를 분석하는 서비스다. 와는 AI로 배고픔, 졸림 등 총 6개 카테고리로 아기 상태를 파악한다. 기저귀 교체, 안아주기 등 부모가 해야 하는 행동도 알려줘 육아가 수월하도록 돕는다.

와의 음성 AI 기술은 상황에 따른 아기의 울음소리나 칭얼거림을 한 공간에서 발생하는 소음, 음악 등과 분리해 수집한다. 필터링된 아이의 비언어적 소리를 딥러닝을 통해 분석, 초보 엄마에게 아이의 상태와 요구사항을 알려준다.핵심은 울음소리의 데이터를 확보하는 것이다. 여러 아이들의 울음소리를 파악해 공통 분모를 찾아 개별 아이들의 울음을 분석하는 초개인화하는 과정이 필요하다.

이수진 대표는 "엄격하게 제한된 상태에서 아기들의 울음소리를 측정했고 6개월 미만 아기들의 10TB 이상의 보이스를 보유하고 있다"며 "행동 패턴이나 발달 정보를 함께 저장하고, AI 전문 데이터회사와 협업하고 있다"고 설명했다.

이어 "AI 이전 오디오 기술들은 상용화에서 리얼 월드에서 실제로 사용자가 사용했을 떄 정확성이 절반도 되지 않았지만 AI가 상용화단계에 도입하면서 이를 실현할 수 있었다"며 "와는 청각장애인 부모에게 특히 도움이 될 수 있다. 이제까지 나온 제품들은 데시벨을 측정하는 수준에 그치기 있기 때문"이라고 덧붙였다. 와처럼 사람 목소리 분석에 관심이 많은 디플리는 사물인터넷(IoT) 등과 결합해 관련 기술을 보편기술로 거듭나도록 하는 게 목표다.
사진제공=구글플레이
교육 플랫폼 기업 매스프레소는 수학 풀이 검색 서비스 '콴다'를 운영 중이다. 플레이스토어에서 교육 앱 1위에 선정되기도 했던 콴다는 학생들이 문제를 풀다가 어려운 문제가 생겼을 때 검색 하나만으로 해설지와 정답을 제공해주는 앱이다. 현재 콴다는 5억건 이상의 문제를 풀었고 230만의 이용자를 보유 중이다.

모르는 문제의 사진을 찍어 콴다에서 검색하면 5초 안에 해설과 함께 비슷한 유형의 문제를 제공한다. △사진 속 수식을 인식해 단계별로 풀이 과정을 제공하는 '수식 계산기' △유형 개념 난이도 등을 기준으로 약 2만개 이상 문제를 추천해주는 '문제집 서비스' △주요 개념을 검색하면 관련 강의를 볼 수 있는 '개념 검색' 등도 제공한다.

콴다의 핵심은 문제 사진을 인식하는 딥러닝 기반 자체 광학문자판독(OCR) 기술이다. 매스프레소 OCR 기술이 수학 문제 속 문자, 수식, 그림의 공간적인 구성을 파악하고 글자를 인식한다. 낙서 회전 그림자 등 비정형적 데이터에서도 글자를 찾아낸다.콴다는 문자인식의 정확도가 높은 구글의 클라우드 비전 OCR과 수식과 도형 등에 특화된 자체 OCR를 동시에 활용해 검색 서비스를 제공중이다. '풀이 검색'을 통해 축적한 데이터는 1억건을 웃돈다. 사용자들이 앱을 활용할수록 데이터가 쌓이고, 이같은 데이터가 문제풀이 정확성을 높이는 선순환 구조를 갖고 있다.

데이터 확보와 분석이 마냥 쉬웠던 건 아니다. 정원국 CTO는 "학생이 올린 문제 중 어떤게 어려웠을까를 파악하는 게 쉽지 않았다. 학습 데이터에 관한 부분도 해결하기 어려웠다. 그래서 데이터 수 자체보다는 데이터가 갖는 핵심을 파악하는 게 가장 중요하다"고 강조했다.

디플리와 매스프레소 그리고 지인 추천 채용 서비스를 제공하는 원티드는 모두 초개인화 기술을 실현시키기 위해 구글 머신러닝 기술의 덕을 봤다고 입을 모았다. 이들이 사용한 기술은 △머신러닝과 딥러닝을 위한 오픈소스 라이브러리 '텐서플로' △레스트 API을 캡슐화한 후 이미지 내용을 이해할 수 있는 '비전 API' △텍스트 구조와 의미를 보여주는 '자연어 처리 API' 등이다.

배성수 한경닷컴 기자 baebae@hankyung.com