구글·파파고가 점령한 번역 세상…스타트업이 살아남는법 [긱스]
입력
수정
AI 번역 스타트업, 특화 번역 눈길인공지능(AI) 번역은 일상을 바꾼 대표적인 기술로 꼽힌다. 우리는 구글과 네이버(파파고) 덕분에 자료 리서치, 외국인과 대화 등 어렵지 않은 수준의 일상 번역은 어느정도 해결할 수 있게됐다. 데이터가 쌓이고 기술이 고도화되면서 번역의 완성도도 빠르게 높아지고 있다. 번역 앱의 양대산맥인 구글과 네이버뿐 아니라 마이크로소프트(MS), 엔비디아, LG 등 국내외 테크 기업들이 앞다투어 초거대 AI 언어모델을 구축하고 있다. 이 가운데 상대적으로 몸집이 작은 스타트업들은 빅테크 AI 번역이 해결할 수 없는 버티컬(전문) 영역을 구축하며 번역 시장의 틈새를 겨냥하고 있다.
고유명사, 구어체 등 차별화 된 언어데이터 확보
전문분야 특화된 AI 번역가도 등장
상장까지한 스타트업, 음식점으로 간 까닭
2012년 설립된 플리토(Flitto)는 AI 번역앱의 시대가 열리기 전, 집단지성 번역 플랫폼을 운영했다. 당시 사람들은 번역이 필요할 때 플리토를 찾았다. 설립 8년 만인 2019년 이 집단지성 번역 모델로 특례 상장까지 하며 성공 가도를 이어 갔지만 고민의 시기가 찾아왔다. 대기업들의 초거대 AI 모델이 고도화되면서 단순 '번역'만으로는 회사의 경쟁력을 유지하기 어려워진 것. 회사는 다른 방향을 모색해야 했다.메뉴판은 대부분 식자재, 지역명 등 고유명사로 이뤄져 있어 기존의 기계 번역만으로는 해석이 어렵다는 문제가 있었다. 기사, 논문 등 일반적인 텍스트에 비해 음식 메뉴 다국어 데이터의 양은 많지 않았다. 뿐만 아니라 음식 메뉴판은 손글씨로 작성되거나 왼쪽에서 오른쪽으로 읽는 가로형이 아닌 세로형 텍스트 등 기재된 형태가 매우 다양해 데이터 확보에 어려움이 있었다. 데이터가 부족했기에 기계가 번역을 하면 완성도가 낮았고, 그렇다고 사람을 써서 모든 메뉴판에 적힌 텍스트를 하나씩 번역하기는 번거로웠다. 사람과 기계의 협업 프로세스를 갖춘 플리토에게 적합한 분야였다.
고난이도 콘텐츠도 번역 척척
온라인동영상플랫폼(OTT) 사업이 폭발적으로 성장하면서 콘텐츠 현지화 수요 또한 급격히 늘었다. 기존의 번역 인력만으로는 부족해지면서 이들을 돕는 AI 콘텐츠 번역 업체의 존재감도 커지는 추세다.실리콘밸리 기반 스타트업 엑스엘에이트에이아이(XL8 .ai)는 번역을 넘어 번역가를 위한 업무툴을 제공한다. 구글과 애플, 퀄컴의 AI전문가들이 2019년 설립한 이 기업은 지난달 영상 번역툴 미디어캣(MediaCAT)을 공식 출시했다.회사에 따르면 그간 번역한 영상 콘텐츠 분량은 총 50만 시간을 넘어섰고, 번역한 단어는 24억개, 지원하는 번역 언어쌍의 종류는 총 66개이다. 영상자료를 기반으로 학습해 구어체 번역에 특화됐다는 점도 눈에띈다. 영상 내 대사의 맥락에 따른 번역뿐만 아니라 한국어의 '하세요', '합쇼', '해라' 등의 존중어, 높임말 등 인물 관계도 고려한 번역도 진행한다. 콘텐츠 분야 만큼은 구글, 파파고 등 빅테크가 따라올 수 없는 수준으로 번역하는 셈이다.
엑스엘에이트 관계자는 "유튜브 채널 EO(이오)와 보이저엑스 등 유력 스타트업, 번역가협회 등 여러 기업 및 단체와 사업 제휴를 논의중"이라며 "번역가들의 '포토샵' 같은 효율적인 툴이 될 것"이라는 포부를 밝혔다.
법률 등 전문분야 학습한 인텔리 AI 등장
텍스트 데이터가 많은 법률 분야에도 AI 번역의 존재감이 두드러지고 있다. 네이버의 투자를 받은 베링랩은 법률・특허 AI 번역 웹서비스를 운영한다. 베링랩은 특정 전문 분야의 데이터를 집중 학습해 해당 분야에서 범용 번역 엔진보다 높은 성능을 자랑한다. 현재 법률, 특허, 기술 분야를 중심으로 사업을 이어가고 있다.웹 서비스와 함께 번역툴 '인텔리캣'(IntelliCAT)도 선보였다. 이 툴은 MS워드 기반의 번역에 비해 시간을 50% 이상 단축할 수 있는 도구로 알려졌다. 법률・특허 분야에서 번역 업무 생산성을 크게 높여줄 수 있으며 관련 논문이 세계 최고 권위의 컴퓨터 언어학 학회 ACL에 채택되기도 했다.
최다은 기자 max@hankyung.com