"AI 목소리가 희로애락까지 표현"…KT, AI 음성합성 서비스 출시
KT가 인간의 감정을 담아 인공지능(AI) 음성합성 콘텐츠를 만들 수 있는 'AI 보이스 스튜디오' 서비스를 19일 출시했다

AI 보이스 스튜디오는 100개의 AI 목소리를 활용해 즐거움, 침착함, 중립, 슬픔, 화남의 5가지 감정으로 음성을 합성할 수 있는 ‘AI 보이스’와, 이 AI 보이스를 활용해 영상 등 오디오 합성 콘텐츠를 제작할 수 있는 ‘스튜디오’로 구성됐다.

국내 최초로 ‘감정 더빙’ 기술을 탑재해 AI 보이스를 이용자가 낭독한 감정 그대로 더빙할 수 있다는 설명이다. KT는 한국어뿐만 아니라 영어, 중국어, 일본어 4개 언어로 ‘다국어 합성’이 가능해 글로벌 시장을 노리는 제작자들에게도 유용하다고 덧붙였다.

유명인들의 음성을 AI로 제공하는 ‘셀럽 AI 보이스’도 준비했다. 첫 번째 ‘셀럽 AI 보이스’의 주인공은 가수 윤도현이다. AI 보이스 스튜디오에 담긴 AI 윤도현의 목소리는 오디오북을 제작할 수 있도록 윤도현의 낭독체와 대화체가 담겨 있다. 문맥에 따라 강약을 주며 오디오 작품을 만들 수 있도록 행복, 슬픔, 분노 등의 감정 표현도 제공한다.

KT는 AI 보이스 스튜디오를 체험할 수 있도록 독서 플랫폼 밀리의서재와 협업했다. 인기 도서 ‘인간관계가 힘들어서 퇴사했습니다’를 AI 윤도현이 낭독하는 오디오북으로 제작했다.

AI 보이스 스튜디오의 웹 버전은 월별 AI 보이스 제공량에 따라 △프리(무료, 4000자) △베이직(1만2000원, 2만4000자) △프로(4만8000원, 12만자) △프로맥스(12만원, 38만4000자) 등 4종으로 구분된다.

KT는 다음 달 7일까지 AI 보이스 스튜디오의 출시를 기념해 다양한 이벤트를 준비했다. 신규가입 고객 전원에게 한 달간 AI 보이스 스튜디오 2만4000자를 무료 제공하고, 추첨을 통해 마이크와 헤드셋 등 다양한 기념품을 증정한다.

최준기 KT AI/빅데이터 사업본부 본부장은 “AI 보이스 스튜디오는 KT만의 차별화된 AI 기술로 인간에 가까운 감정을 표현하는 등 AI 목소리의 가치를 향상시켰다”고 말했다.

이승우 기자 leeswoo@hankyung.com