사람 목소리 20분이면 완벽 구현…교육·게임업체서 각광
마인즈랩의 인공지능(AI) 음성 생성 서비스인 ‘마음보이스(maum Voice)’가 ‘2019 대한민국 임팩테크(ImpaCT-ech) 대상’에서 한국경제신문 사장상을 수상했다.

음성생성 AI 알고리즘을 적용한 마음보이스가 사람의 목소리를 훔치는 데 걸리는 시간은 20분에 불과하다. 여러 문장을 녹음하면 이 데이터를 기반으로 실제 목소리와 거의 흡사한 음성을 만들어낸다. 동영상을 업로드하는 유튜버가 음성을 등록하면 나중엔 말하지 않고 텍스트만 입력해도 이를 본인의 음성으로 변환해주는 식이다.

마인즈랩 관계자는 “누가 들어도 로봇 목소리 같거나 기계음이 심했던 기존 음성합성과 달리, 실제 사람 목소리처럼 자연스런 음성을 짧은 시간 안에 만드는 것이 마인즈랩 음성생성 AI기술의 핵심”이라고 설명했다. 이 관계자는 “대기업이나 전문가의 전유물로 여겨지던 AI 음성생성을 개인이나 기업 누구나 규모와 관계없이 쉽게 쓸 수 있도록 했다는 의미도 크다”고 덧붙였다.

마음보이스는 교육 콘텐츠 제작업체, 게임업체 등에서 각광받고 있다. 특정 게임 캐릭터 음성을 유명 영화배우 음성으로 바꾸는 것도 가능해진다. 보험 등 금융권에서도 서비스를 앞두고 있다. 금융위원회 지정 핀테크(금융기술) 기업인 마인즈랩은 AI 음성생성과 챗봇 기술을 결합한 ‘음성봇’을 통해 보험 신청과 접수, 심사와 실행까지 원스톱으로 처리하는 서비스를 조만간 선보일 계획이다.

이해성 기자 ihs@hankyung.com