“알렉사, 하늘은 왜 파랗지?”

[책마을] 터치에서 목소리로… 이젠 '보이스 퍼스트'
어린 아들이 식탁 위에 있는 조그만 스피커를 향해 묻는다. 스피커는 백과사전처럼 어린 아들의 질문에 답한다. 엄마는 냉장고를 들여다보고 사야 할 식료품이 생각나자 스피커에게 쇼핑 리스트에 추가해 달라고 큰 소리로 말한다. 식구들은 요리할 때면 알렉사에게 요리법을 묻고, 타이머를 맞춰달라고 한다. 아빠는 매일 아침 출근 전 30분가량 알렉사에게 책을 읽어달라고 한다.

미국에 사는 브라이언 씨네 가족의 모습이다. 2014년 미국 정보기술(IT) 기업 아마존이 출시한 보이스 인공지능 서비스 알렉사는 ‘에코’라는 실린더 모양의 작은 스피커 형태로 등장했다. 지금은 냉장고, TV, 조명을 비롯한 각종 가전제품에 탑재되고 있다. 말 한마디로 청소기를 작동시키고, 전기차 배터리를 체크해주며, 거실 어딘가에 굴러다니는 스마트폰을 찾아주기도 한다. 말로 조명과 온도 장치를 켜고 끄는 것은 시작일 뿐이다.

《보이스 퍼스트 패러다임》은 IT 유통 예술 법률 등 다양한 분야 전문가 9명이 강정수 메디아티대표와 함께 여섯 달 동안 머리를 맞대고 공부한 결과물이다. 이들은 올초 디지털경제 스터디 모임인 ‘호모디지쿠스’를 결성해 기술이 한국 사회와 미래에 끼칠 영향에 대해 공부하기 시작했다. 첫 주제가 바로 ‘음성 인공지능(AI)’이다.

컴퓨터가 작아지고 모바일 세상이 오자 사람들에게 공간의 제약이 사라졌다. 언제 어디서나 이메일을 주고받고 쇼핑과 예금 이체를 한다. 카페에서도 자유롭게 사무실 업무를 본다. 아이폰이 연 모바일 시대에는 화면 터치를 통해 데이터를 수집하고 명령했다. 음성 AI는 우리를 이런 화면의 제약에서 해방시킨다. 운동을 하거나 운전을 하고 책을 읽는 동안 음성을 통해 콘텐츠를 소비할 수 있다는 의미다.

사실 인공지능 음성비서는 새로운 개념이 아니다. 애플의 시리는 알렉사가 나오기 5년 전 개발됐다. 충성도 높은 아이폰 사용자들을 갖고 있었음에도 당시엔 주요 기능으로 자리잡지 못했다. 스마트폰의 제한된 기능과 화면 보조수단으로서 역할 때문이었다. 알렉사는 스마트폰의 앱스토어처럼 개발자들에게 ‘스킬’이라 불리는 애플리케이션(응용프로그램)을 개방했다. 음성 택시예약, 번역, 피자주문 등 수천 가지 기능을 사용자가 추가할 수 있게 됐다.

알렉사의 성공은 음성 AI 생태계를 확장하는 도화선이 됐다. IT 기업들은 잇따라 음성 AI 스피커를 내놨다. 작년 구글은 대화형 AI ‘구글 어시스턴트’를 탑재한 ‘구글 홈’을 출시했고 애플도 시리를 ‘홈팟’에 담아 내놓을 계획이다. 한국에서는 삼성이 갤럭시 스마트폰에 ‘빅스비’를 탑재해 음성비서로 소개했다. SK텔레콤의 스피커 ‘누구’, KT 스피커 ‘기가지니’, 네이버 ‘웨이브’에 탑재될 ‘클로바’ 그리고 ‘카카오 미니’에 탑재될 카카오의 ‘아이’가 있다.

음성 AI가 우후죽순 등장하고 있지만 아직 갈 길은 멀다. 저자들은 가장 큰 숙제로 이용자 요청에 대한 답변의 정확성 향상을 꼽는다. 아직 시간 장소 상황 등 맥락을 정확히 이해하는 음성인식 기술은 없고 단답형 질문에만 대답하는 수준이다. 또한 음성 데이터가 많이 수집될수록 프라이버시 문제가 불거질 수 있으며, 목소리 인증과 결제에서 개인정보 도용이 발생할 가능성에 대해 현재로선 뚜렷한 해법이 없다. 하지만 음성 AI는 삶의 양식을 바꿀 주요 기술이 될 것이란 점은 분명하다고 저자들은 말한다.

최종석 기자 ellisica@hankyung.com