"'더 글로리' 대사도 자동 번역"…영어 애먹던 구글맨의 '반전' [긱스]
입력
수정
정영훈 엑스엘에이트 대표넷플릭스에서 K콘텐츠 열풍이 분다는 말은 이미 클리셰 같은 문장이 됐습니다. 한국 콘텐츠가 세계로 뻗어나가고, 또 글로벌 콘텐츠를 우리집 침대에서 편히 볼 수 있는 데엔 '번역'의 힘을 빼놓을 수 없는데요. 하지만 아무리 자연스럽게 번역하더라도 현지의 문화를 완벽히 반영해 의미를 전달하기는 참 어렵습니다. 봉준호 감독은 영화 속 자막을 '1인치의 장벽'이라고 표현하기도 했죠.
AI 기계 번역 스타트업
'1인치 장벽' 넘어설까
이 장벽을 넘어서기 위해 사투를 벌이는 스타트업이 있습니다. 인공지능(AI) 기계 번역 스타트업 엑스엘에이트 이야기입니다. 온라인동영상서비스(OTT) 콘텐츠에 중요한 '구어체' 번역에 특화된 기술을 갖고 있습니다. 한경 긱스(Geeks)가 정영훈 엑스엘에이트 대표를 만났습니다."그래서 말인데 동은아, 고데기 열 체크 좀 해줄래?"
넷플릭스 시리즈 '더 글로리'의 이 대사는 어떻게 번역될까? 표준어가 아닌 '고데기'라는 표현은 '컬링 아이언(curling iron)'으로 의역됐다. 인간이라면 수월하게 번역했겠지만, 이 문장은 인공지능(AI) 번역가가 만든 작품이다. 또 이 드라마 속 '콩밥은 네가 먹어'라는 대사는 '감옥은 결국 네가 간다(You'll end up in jail)'로 번역됐다. 기계 번역 스타트업 엑스엘에이트가 내놓은 미디어 콘텐츠 특화 번역 자동화 도구 '미디어캣'을 통해 구현된 문장이다.
AI가 드라마의 대사를 학습하면서 맥락과 등장인물의 말투, 표정까지 배우면서 가능해진 일이다. 단순히 글자나 음성만 갖고 번역하는 데에서 한 발 나아간 셈이다. 정영훈 엑스엘에이트 대표는 12일 한경 긱스와 만나 "언어의 장벽을 완전히 넘어서는 시대를 열 것"이라고 말했다.
대화 맥락, 말투, 성별까지 AI가 학습
미국 실리콘밸리에 본사를 둔 엑스엘에이트는 구어체에 특화된 번역 기술을 갖고 있다. 넷플릭스나 디즈니+ 등 온라인동영상서비스(OTT) 콘텐츠에 들어가는 자막의 '초벌 번역' 작업을 주로 담당한다. 이를 아이유노와 같은 대형 현지화 서비스 업체(LSP)에 공급한다. LSP의 번역 인력 손을 거쳐 최종적으로 OTT에서 자막이 상영된다. 정 대표(사진)는 "LSP도 우리 기술이 없으면 3만6000시간에 달하는 넷플릭스 콘텐츠의 자막을 달기엔 벅찰 것"이라고 했다.회사의 주력 제품인 미디어캣은 영상에서 몇 번의 클릭으로 대사를 추출, 타임코드를 맞추고 원하는 언어로 대사를 번역해 더빙 작업까지 해결해주는 도구다. 지원하는 언어는 영어부터 세르비아어, 슬로바키아어, 리투아니아어에 이르기까지 70개가 넘는다. 회사가 문을 연 2019년 이후 번역된 단어 수는 20억개를 넘어섰는데, 한 달에 평균 2만시간의 영상을 번역하고 있다. 회사가 가진 경쟁력은 '문맥 파악 기술'에 있다. 단순히 문장만 보는 게 아니라 앞뒤 상황의 맥락을 고려해 번역하는 기술이다. 생략과 중의적인 표현이 빈번하게 일어나는 구어체를 번역하는 데 중요한 기술이다. 이를테면 '그것'이라는 대명사를 번역할 때 무엇을 지칭하는지 AI가 스스로 파악할 수 있다. 특히 프랑스어와 같이 성별이 나뉘어 있는 언어를 번역할 때 도움이 된다는 설명이다. 정 대표는 "지난해 하반기 이 기술을 처음 적용했더니 75% 수준이던 번역의 정확도가 90% 이상으로 올라갔다"고 귀띔했다.
대사들 외에 목소리, 몸의 움직임, 성별과 나이 등 비언어적 요소를 함께 파악하는 '멀티모달리티' 기술도 회사의 자랑거리다. 예를 들어 화자가 20대 여성이라면 그에 맞는 발화 습관을 AI가 학습해 조금 더 자연스럽게 번역하는 식이다. 정 대표는 "한국어처럼 존댓말이 있는 언어는 화자간의 관계에 따라 번역도 달라져야 하고, 일본어나 태국어 같은 언어는 성별에 따라 말투가 완전히 달라진다는 점을 잡아내는 것"이라고 말했다.
기술의 비결은 '데이터'에 있다. 통상 AI 번역기는 데이터를 학습할 때 웹사이트 등에 퍼져 있는 문장들을 크롤링해 활용한다. 그러다보니 오타나 비문 등을 덜어내지 못해 데이터의 질이 떨어질 수밖에 없다는 게 정 대표의 말이다. 구어체보다 문어체 데이터가 많다는 점도 영상 콘텐츠 번역에 적합하지 않다. 정 대표는 "엑스엘에이트의 번역 엔진은 LSP의 손을 거쳐 100% 번역된 데이터만 학습한 덕분에 구어체에 알맞는 결과물을 만들어내기에 유리하다"며 "구글이나 네이버 같은 빅테크보다 OTT 콘텐츠 번역에 강점을 가질 수 있는 이유"라고 설명했다. 이어 "모으는 데이터의 절대적인 양은 빅테크가 훨씬 많겠지만, 일정 수준을 넘어서면 데이터의 양보다 질이 중요하다"고 덧붙였다.
영어 애먹던 '구글맨', 창업 전선으로
정 대표가 창업의 길로 뛰어든 건 우연이 아니었다. 어린 시절부터 컴퓨터 '덕후'였던 그는 9살 때부터 코딩을 배우기 시작했다. 중학생 땐 용돈을 모아 C언어 교재를 사서 직접 공부했다. 고교 시절엔 컴퓨터 동아리에 들어갔는데, 체육대회 때 '청기백기' 게임을 직접 만들어 친구들 앞에 공개하기도 했다. 한창 '닷컴 열풍'이 불던 시기, 99학번으로 컴퓨터공학과에 진학한 그는 반드시 '테크 기반 창업'을 하겠다고 다짐했다. 경영학을 복수전공했다.대학생 때 닷컴 버블을 겪은 정 대표는 졸업 후 우선 사회를 경험해보기로 했다. 삼성전자에 입사해 소프트웨어 엔지니어로 첫 커리어를 시작했다. 6년여 간 회사를 다닌 뒤 2011년 미국 컬럼비아대로 유학을 떠났다. 이후엔 구글에 들어가 검색팀 엔지니어로 일했다. 탄탄대로였다. 삼성과 구글을 거친 엘리트 직장인의 표본인 셈이다.
그 즈음 뒤늦게 성장통이 왔다. 짧았던 영어 실력이 문제였다. 삼성전자 시절 5년 넘게 꾸준히 새벽반 영어회화 수업을 들었지만, 현지에서 겪은 실전 영어는 차원이 달랐다. 그는 "박사과정 중에 수요일마다 연구실 사람들과 포켓볼을 치고 맥주도 마셨는데, 말이 너무 빠르고 '슬랭'이 많아 도저히 대화에 낄 수가 없었다"며 "머릿속에 열심히 할 말을 정리해서 입을 열면 이미 대화 주제가 바뀐 뒤였다"고 회상했다.
구글에서 일하며 조금씩 영어는 익숙해졌지만, 왜 구어체에 특화된 번역 도구는 없을지 항상 고민했다. 결국 구글을 박차고 나와 2019년 창업에 나섰다.
"봉준호의 '1인치 장벽' 넘어설 것"
창업 이후 회사는 순항 중이다. 지난해 하반기 에이티넘인베스트먼트, 퓨처플레이 등으로부터 프리 시리즈A 투자를 유치했다.회사의 '넥스트 스텝'은 통역의 혁신이다. 지난해 스포츠 중계나 유튜브 라이브 방송 등에서 사용할 수 있는 통역 솔루션 '이벤트캣'을 내놨다. AI가 방송 음성을 인식해 자막을 입혀주는 방식이다.
지난달 스페인 바르셀로나에서 열린 세계 최대 이동통신 전시회 'MWC2023'에서는 이 기술을 화상 회의 '줌'에 적용한 통역 앱을 선보였다. 다양한 국적의 사람들이 모인 회의에서 서로 자신의 언어로 화상 회의를 할 수 있다. 화면에 대화가 실시간으로 통역돼 나타난다. 24개의 언어가 지원된다. 정 대표는 "바이어나 투자자 미팅뿐만 아니라 국적이 다른 친구들끼리의 '랜선 모임'에도 필수적으로 쓰이는 앱이 될 것"이라고 말했다.그가 그리는 미래는 언어라는 장벽이 완전히 무너진 시대다. 봉준호 감독이 영화 자막을 '1인치 장벽'이라고 말했던 것처럼, 문화와 어조의 미묘한 차이를 다른 언어권에 그대로 전달하기란 쉽지 않다. 하지만 이 장벽이 무너지면 재밌는 세상이 온다는 게 그의 말이다. 그는 "5년 안에 AI 번역의 정확도가 99%까지 올라간다"며 "아마 한국인 친구보다 외국인 친구가 더 많아질 세상이 오지 않을까 싶다"고 했다.
김종우 기자 jongwoo@hankyung.com