[천자칼럼] 언어 장벽 무너뜨리는 인공지능
-
기사 스크랩
-
공유
-
댓글
-
클린뷰
-
프린트
컴퓨터를 이용해 언어를 번역하려는 시도는 1950년대부터 시작됐다. 가장 먼저 등장한 기술은 ‘규칙 기반 기계 번역(rule-based machine translation)’이다. 특정 단어와 배열 등에 대해 규칙을 만들어 입력하면 기계가 그에 따라 번역하는 방법이다. 하지만 규칙에 없는 예외가 발생하면 제대로 된 결과물을 얻을 수 없었다.
2000년대 들어 ‘통계 기반 번역(statistical machine translation)’이 등장하면서 비로소 ‘번역기’가 상용화되기 시작했다. 통계 기반 번역은 기존에 사람이 번역한 수많은 데이터를 학습한 뒤 주어진 상황에서 가장 들어갈 확률이 높은 단어를 제시하는 식이다. 처음에는 단어 단위로 시작해 구(句) 단위로 확대됐다. 초창기의 구글 번역기가 이 방식을 이용했다. 한국어-일본어처럼 어순이 비슷한 언어는 매끄럽게 번역하지만, 어순과 문법이 다를수록 결과물이 부정확하다는 단점이 있었다.
현재 가장 널리 사용되는 기술은 인공지능(AI) 기반의 ‘인공신경망 기계 번역(neural machine translation)’이다. 2016년 구글이 자사 번역 서비스에 이 방식을 도입했고 같은 해 등장한 네이버의 파파고 역시 이 방식을 쓰고 있다. 단어나 구가 아니라 문장 전체를 기준으로 번역하는데, 문장의 맥락을 이해할 수 있어 정확도가 훨씬 높다.
기계 번역 기술을 비롯한 AI의 발전이 언어의 장벽을 빠르게 무너뜨리고 있다. 비전 AI 기술 덕분에 스마트폰 카메라를 비추는 것만으로 간판이나 메뉴의 외국어를 이해할 수 있게 됐다. 음성을 텍스트로 옮겨주는 STT(speech to text) 기술과 사람처럼 문장을 읽어주는 AI 음성 생성 기능이 결합하면서 실시간 통역 서비스도 나왔다. SK텔레콤이 지난 14일 전화 통화를 영어, 중국어 등으로 번역해주는 ‘에이닷 통역콜’을 내놨고 삼성전자도 내년 신제품에 통역 서비스를 선보일 전망이다.
국제 하계언어학연구소(SIL)에 따르면 현존하는 언어는 7100여 개다. AI가 그 장벽을 무너뜨리고 있다. 외국어 포비아에서 벗어날 날이 머지않았다.
이승우 IT과학부 기자 leeswoo@hankyung.com
2000년대 들어 ‘통계 기반 번역(statistical machine translation)’이 등장하면서 비로소 ‘번역기’가 상용화되기 시작했다. 통계 기반 번역은 기존에 사람이 번역한 수많은 데이터를 학습한 뒤 주어진 상황에서 가장 들어갈 확률이 높은 단어를 제시하는 식이다. 처음에는 단어 단위로 시작해 구(句) 단위로 확대됐다. 초창기의 구글 번역기가 이 방식을 이용했다. 한국어-일본어처럼 어순이 비슷한 언어는 매끄럽게 번역하지만, 어순과 문법이 다를수록 결과물이 부정확하다는 단점이 있었다.
현재 가장 널리 사용되는 기술은 인공지능(AI) 기반의 ‘인공신경망 기계 번역(neural machine translation)’이다. 2016년 구글이 자사 번역 서비스에 이 방식을 도입했고 같은 해 등장한 네이버의 파파고 역시 이 방식을 쓰고 있다. 단어나 구가 아니라 문장 전체를 기준으로 번역하는데, 문장의 맥락을 이해할 수 있어 정확도가 훨씬 높다.
기계 번역 기술을 비롯한 AI의 발전이 언어의 장벽을 빠르게 무너뜨리고 있다. 비전 AI 기술 덕분에 스마트폰 카메라를 비추는 것만으로 간판이나 메뉴의 외국어를 이해할 수 있게 됐다. 음성을 텍스트로 옮겨주는 STT(speech to text) 기술과 사람처럼 문장을 읽어주는 AI 음성 생성 기능이 결합하면서 실시간 통역 서비스도 나왔다. SK텔레콤이 지난 14일 전화 통화를 영어, 중국어 등으로 번역해주는 ‘에이닷 통역콜’을 내놨고 삼성전자도 내년 신제품에 통역 서비스를 선보일 전망이다.
국제 하계언어학연구소(SIL)에 따르면 현존하는 언어는 7100여 개다. AI가 그 장벽을 무너뜨리고 있다. 외국어 포비아에서 벗어날 날이 머지않았다.
이승우 IT과학부 기자 leeswoo@hankyung.com