"외국어 몰라도 돼"…AI 통역 시장 격전

산업 리포트

딥엘 실시간 통역 솔루션 출시
전문·학술분야 통역도 '척척'

'GPT-4o 리얼타임' 미는 오픈AI
구글은 '시뮬트론' 전면에 내세워
국내 업체들도 틈새시장 노려
실시간 통역 시장이 인공지능(AI) 기술의 새 격전지로 떠올랐다. 오픈AI와 메타가 통역 기술 수준을 높이자, AI 번역 강자인 독일 딥엘이 실시간 통역 솔루션으로 맞대응에 나섰다. 국내 대기업과 스타트업도 이 시장을 공략하기 위해 서비스를 잇달아 선보이고 있다.

○딥엘, 13개 언어로 동시통역

15일 업계에 따르면 딥엘은 지난 14일 실시간 통역 솔루션인 ‘딥엘 보이스’를 출시했다. 딥엘은 언어 번역에 특화한 자체 대규모언어모델(LLM)로 문서 번역 AI 서비스를 제공하는 기업이다. 지난 5월 3억달러(약 4300억원) 투자를 유치하고, 20억달러(약 2조8100억원)의 기업가치를 인정받았다. 딥엘은 동시통역을 한국어, 영어 등 13개 언어로 지원해 이 시장 점유율을 빠르게 늘리기로 했다.

마이크로소프트, 구글, 메타 등 빅테크가 주도하는 AI 번역 시장과 달리 실시간 AI 통역 시장은 뚜렷한 강자가 없는 초기 단계다. AI 연산 속도가 1초만 늦어져도 동시통역 서비스를 원활히 구동하기가 쉽지 않아서다. 서버 응답이 필요 없는 내장형(온디바이스) AI가 실시간 통역 기술로 각광받아온 배경이다. 발음과 음고에 따른 뉘앙스를 정확히 파악하는 AI를 구현하는 일도 테크 기업이 해결해야 할 과제다.

딥엘은 온디바이스 기반이 아니라 클라우드 통역 서비스로 기업 간 거래(B2B) 시장을 공략하기로 했다. 전문·학술 분야까지 아우르는 방대한 음성 데이터를 분석하는 작업은 온디바이스 AI보다 클라우드 기반 AI가 유리하다. 딥엘의 미팅용 서비스는 참석자가 각자 선호하는 언어로 말하면 참석자별로 원하는 자막으로 다중 언어를 번역해준다. 대화용 서비스는 발화자와 수화자 각자에게 맞는 자막을 한 화면으로 제공한다.

○오픈AI, GPT-4o 리얼타임 공개

빅테크도 통역 AI 기술을 고도화하고 있다. 오픈AI는 음성 생성 기능을 강화한 생성형 AI인 ‘GPT-4o 리얼타임’을 지난달 공개했다. 기존에는 음성을 인식해 문자로 변환하고, 변환한 문자를 번역한 뒤 음성을 생성하는 과정을 거쳐야 했다. GPT-4o 리얼타임은 음성 입·출력을 한 번에 처리하도록 해 실시간에 가까운 통역 서비스를 구현했다. 구글도 6월 온디바이스를 활용한 통역 모델인 ‘시뮬트론’을 공개했다. 삼성 갤럭시S24의 통역 기능처럼 음성을 다른 언어로 바꿔 들려주는 방식이다.

번역 언어에 맞춰 영상 속 등장인물의 입 모양을 바꿔주는 서비스도 대중화 단계다. 메타는 발화자의 입 모양을 번역 언어에 맞게 바꿔주는 기능을 9월 공개했다. 페이스북과 인스타그램에서 영어와 스페인어 대상으로 이 기능을 우선 시험하고 있다.

국내 업체는 빅테크가 선점하지 못한 시장 위주로 통역 시장을 파고들고 있다. LG유플러스는 대학용 AI 플랫폼인 ‘유버스’를 통해 한국어, 영어, 중국어 등의 실시간 강의 통역 기능을 지난달 제공하기 시작했다. KT는 AI를 활용해 음성을 수어로 표현해주는 그래픽 기능을 인터넷TV(IPTV) 서비스에 도입하기로 했다. SK텔레콤은 자체 AI 앱인 ‘에이닷’을 통해 통역 기능을 제공한다. 스타트업인 소이넷도 한 개 언어를 수십 개 언어로 동시통역해 영상으로 송출하는 서비스를 이달 14일 공개했다.

이주현 기자 deep@hankyung.com