메타, 1107개 언어 음성↔텍스트 변환 AI 모델 공개

메타, 1107개 언어 '음성↔텍스트' 변환 AI 모델 공개

조아라 기자

입력2023.05.24 09:12 수정2023.05.27 00:00

메타가 기존 대비 10배 많은 언어를 음성에서 텍스트 또는 텍스트에서 음성으로 변환해주는 '대규모 다국어 음성인식'(MMS)' 인공지능(AI) 모델을 24일 오픈소스로 공개한다고 밝혔다.

현재 지구상에 사용되는 언어의 수는 7000개 이상으로 알려졌는데, 기존 음성 인식 모델은 최대 100여개의 언어만을 지원한다.

메타가 이번에 공개한 AI 모델은 변환이 가능한 언어의 수를 기존 100여개에서 1107개로 10배가량, 음성으로 식별할 수 있는 언어의 수를 4000개 이상으로 40배가량 늘렸다는 점에서 의미가 있다.

기존 음성 변환 모델과 비교했을 때 성능도 우수하다. 메타 분석 결과, 음성 변환 언어의 수를 61개에서 1107개로 18배가량 늘렸을 때 문자 오류율은 단 0.4% 증가했다.

또한 오픈AI의 음성인식 모델 '위스퍼'와 비교한 결과, MMS 데이터로 교육된 모델은 단어 오류율을 절반으로 줄이면서도 11배 더 많은 언어를 처리할 수 있는 것으로 나타났다.

메타는 언어 다양성 보존에 기여하고, AI 생태계 전반의 발전과 책임 있는 개발을 위해 MMS 모델과 코드를 오픈소스로 공개한다는 계획이다.

조아라 한경닷컴 기자 rrang123@hankyung.com

관련 뉴스

1

'AI 기능' 강조한 갤럭시S25, 한국어→영어 번역해 봤더니 [영상]

삼성전자가 공개한 신형 갤럭시S25 시리즈의 AI 에이전트(인공지능 비서) 기능에서 영어 등 외국어를 한국어로 번역할 수는 있지만 반대로는 작동되지 않았다. 사용자에게 개인화된 AI 경험을 제공하는 등 AI 추천 기...
2

"온몸이 욱신욱신"…'명절증후군' 피해가려면 [건강!톡]

27일이 임시공휴일로 지정되면서 올해 설 명절 연휴가 6일로 늘었다. 긴 연휴가 끝난 뒤에는 명절 전후로 나타나는 신체적, 정신적 증상인 '명절증후군'을 겪거나 일상생활로 돌아오기 어려워 하는 사람들이...
3

아이폰 로봇부터 전기차까지…거침없는 '폭스콘의 질주' [강경주의 IT카페]

애플 아이폰의 최대 위탁 제조사인 대만 폭스콘(훙하이정밀공업)의 광폭 행보가 심상치 않다. 중국 최대 로봇 기업 유비...