한자투성이 고서, AI로 번역
입력
수정
지면A12
ETRI, 첫 고서번역 서비스“강헌대왕(태조 이성계의 존호)이 하늘의 명을 받아 한양에 도읍을 정하고, 강토를 개척해 8도라 칭했다. 사방의 복판에 있는 것을 경기라 하고 남쪽에 치우친 것은 전라, 동남은 경상이라 하였다.”
고문자 인식 정확도 92% 달해
인공지능(AI) 기술을 활용해 조선시대 지리지 동국여지승람 일부를 한글로 번역한 내용이다. 옛날 한자로 쓰인 방대한 분량의 고서를 번역하는 AI 서비스가 처음 개발됐다.한국전자통신연구원(ETRI)은 한국콘텐츠진흥원 등과 함께 ‘AI 기반 고서 번역 기술’을 개발해 실증하고 있다고 21일 밝혔다. 고서 번역가들은 오랜 시간에 걸쳐 낡은 장서 원문의 희미한 글자를 일일이 확인해 한글 번역서를 완성한다. ETRI는 이 작업 시간을 대폭 줄일 수 있는 기술을 개발했다. 다양한 모양의 한자 1000만여 개 데이터를 학습해 AI 인식 및 번역 플랫폼을 구축했다. 한자 인식 정확도는 92%, 번역 정확도는 85%로 알려졌다. 인식 알고리즘은 시각 정보 해석에 특화된 컨볼루션신경망(CNN)을, 번역 알고리즘은 재귀신경망(RNN)을 사용했다.
이 플랫폼은 번역가들이 공동 작업을 할 수 있게 특수용어 공유 기능 등을 갖췄다. 이달부터 국립중앙도서관, 국회도서관 등 전국 11개 도서관의 키오스크에 설치됐다. 연말께 선보일 정식 서비스에선 3만여 종의 고서와 수십만 점의 고문서 번역이 가능할 전망이다. 현재는 동국여지승람을 비롯해 동래군지, 산청읍지 등 지리지 중심 번역 서비스를 제공하고 있다. 일반인들이 휴대폰에서 고서 번역본을 읽을 수 있는 모바일 앱도 선보일 예정이다.
연구 책임자인 민기현 ETRI 인공지능융합연구실 책임연구원은 “이번 개발 과정에서 세종실록지리지 안에 독도가 한국 땅이라는 명확한 근거를 봤다”며 “지리지 안에는 지역 문화 등 풍속과 특산물, 인물 등 귀중한 정보가 많이 담겨 있다”고 말했다. ETRI는 번역된 고서의 스토리를 모션센서 등으로 체험할 수 있는 실감형 인터랙티브 콘텐츠도 개발할 계획이다.
이해성 기자 ihs@hankyung.com