영화 아이언맨의 인공지능(AI) 비서 자비스는 대화로 모든 명령어를 완벽하게 이해한다. 스마트 기기에 탑재된 AI가 지향하는 목표지만 현실적으로 기술 괴리가 존재한다.
영화 아이언맨의 인공지능(AI) 비서 자비스는 대화로 모든 명령어를 완벽하게 이해한다. 스마트 기기에 탑재된 AI가 지향하는 목표지만 현실적으로 기술 괴리가 존재한다.
이상형의 외모와 목소리를 가진 인공지능(AI)과 자유롭게 이야기를 나누는 서비스를 상상해본 경험이 있는가. 시간과 장소는 물론 대화 주제에 구애받지 않고 말이다. AI 스타트업 마인드로직을 창업한 2019년을 전후해 자연어 처리(NLP) 분야의 많은 저명인사의 조언을 얻었다. 대화 주제에 제약이 없는 AI를 만들겠다는 포부에 이들은 “불가능한 일이니 다른 사업을 하는 게 나을 것”이라고 답했다.

창업 당시를 기준으로 5년 안에 대화하는 상대방이 사람인지 AI인지 구분할 수 없는 시대가 올 것이라고 확신하던 차였다. 시장 상황은 반대였던 것이다. 창업 후 2년이 채 지나지 않은 시점인 2020년 6월 오픈AI의 초거대 언어모델인 ‘GPT-3’가 등장했다. 과거 부정적 의견을 내던 많은 사람이 “앞으로 수년 내 사람처럼 말하는 AI가 실현될 것”이라는 의견을 피력하고 있다. 2년 만에 격세지감을 느끼게 된 것이다.

물론 ‘컴퓨터 과학의 아버지’ 앨런 튜링 이래로 사람처럼 말하는 기계의 등장에 대한 막연한 기대는 줄곧 있었다. 하지만 사실 이를 체감할 수 있게 하는 실제 서비스들이 등장한 것은 길게 봐도 10여 년밖에 되지 않는다. 사람처럼 말하는 AI를 완성하려는 노력이 어떻게 변모해 왔고, 앞으로 어디를 향하게 될까. AI의 단계별 형태와 패러다임 전환 과정에 그 힌트가 있다.

요술램프 되지 못한 AI 비서

아이언맨 '자비스' 누구나 만든다…'1인 1AI 비서 시대' 성큼
2011년 10월 애플은 ‘시리’를 세상에 선보이면서 비서 역할을 하는 대화형 AI 시대를 열었다. 스티브 잡스는 스마트 기기와 사람 간 자판 입력이 아닌, 음성언어로 이뤄질 것이라는 혜안을 갖고 있었다. 세계적 ‘정보기술(IT) 자이언트’들은 앞다퉈 스마트 기기의 AI 비서 도입 경쟁에 돌입했다. 삼성 ‘빅스비’, 구글 ‘어시스턴트’, 아마존 ‘알렉사’, KT ‘기가지니’, SK텔레콤 ‘누구’ 등 비슷한 제품을 선보였다.

사용자는 나만의 AI 비서 시리를 처음 본 순간, 자연스럽게 영화 아이언맨의 ‘자비스’를 떠올렸다. 토니 스타크의 지시대로 요술램프 지니처럼 명령을 완벽히 수행하면서도 자연스럽고 위트 넘치게 대화하는 친구 같은 AI를 기대했다. 현실의 AI 비서는 실망감을 안겼다.

초거대 AI, 비용·속도가 문제

자유로운 주제의 대화가 가능하도록 ‘오픈 도메인(open domain)’ 기반 대화형 AI를 완성해야 한다는 열망이 여기서 생겨났다. ‘룰 베이스(규칙 입력 기반)’ 방식이 아니라 딥러닝 방식의 대화형 AI 개발이 가속화되기 시작했다. 화자의 발화 의도에 맞춰 AI가 과업을 정확히 수행하는 것이 핵심이 되며 ‘자연어 이해(NLU)’ 기술은 급속도로 발전할 수 있었다.

세상을 깜짝 놀라게 만든 GPT-3는 2020년 6월 등장했다. 이미 2018년 11월 구글의 ‘BERT’, 2019년 2월 오픈AI의 ‘GPT-2’가 차례로 소개되며 기술 진보가 이뤄졌지만, 일반 대중이 혁신을 체감한 것은 GPT-3였다.

전 세계에서 초거대 생성 언어모델을 개발하는 프로젝트가 앞다퉈 추진되기 시작한다. 국내에서도 동일한 방법론이 적용됐다. 네이버, 카카오를 비롯한 대표 IT 기업들과 정부 지원 프로그램이 초거대 생성 언어모델 개발에 열을 올렸다. 상당히 유의미한 결과물이 도출됐다.

그러나 초거대 생성 언어모델에도 한계는 존재한다. 우선 참조하는 매개변수(파라미터) 수가 급격히 증가함에 따라 추론 속도가 느려지고, 비용이 증가해 서비스 상용화가 쉽지 않다. AI가 상대방과의 대화 내용을 기억하지 못하거나, 앞서 발화한 내용과 상반되는 이야기를 할 수도 있다. AI의 페르소나(대화 주체의 성격이나 개성)가 특정되지 않아 일관성 없는 대화가 이어지는 등의 문제도 산적해 있다.

AI는 곧 ‘아바타’가 된다

자연어 처리 학계와 산업계는 초거대 생성 언어모델의 한계점을 극복하고자 애쓰고 있다.

마인드로직은 현재까지 선보인 바 없는 시도를 병행하고 있다. 마인드로직의 소셜 AI 서비스 ‘오픈타운’은 각각의 유저에 따라 개인화가 가능한 대화형 AI를 제공한다. 사용자들은 자신의 AI를 직접 훈련하고, 본인이 추구하는 특성과 콘셉트에 따라 대화하는 맞춤형 AI를 만들어낼 수 있다. 사용자는 궁극적으로 자신을 대변하는, 새로운 페르소나를 지닌 소셜 AI를 생성하게 된다. 이렇게 탄생한 소셜 AI는 이용자들을 메타버스에 머물게 하며 사람처럼 대화하는 친구가 돼주고 있다.

‘AI는 곧 비서’라는 기존의 지배적 시각은 점차 ‘AI를 사용자의 분신(아바타)’으로 정의하는 새로운 패러다임으로 대체되고 있다. 자신을 대변할 수 있는 개인화된 AI를 보유하고 활용하는 ‘1인 1 AI 시대’가 눈앞에 성큼 다가온 것이다. 이미 개인화된 소셜 AI는 복수의 메타버스 공간에서 동시에 존재하며 시간과 장소에 제약받지 않고 사용자를 대리하는 완벽한 AI 아바타로 거듭나고 있다. 고도화된 서비스를 통해 사용자 경험을 혁신하고 새로운 패러다임을 제시하는 기업만이 사람처럼 대화하는 AI를 완성하려는 꿈에 한 발짝 더 가까이 다가가게 될 것이다.

김용우/김진욱 마인드로직 공동대표