휴멜로, 감정 표현까지 척척 'AI 성우'
“지원아 아직도 안 일어났어? 빨리 일어나서 나랑 놀아줘.”

아침에 일어나면 아이돌 그룹 엑소(EXO)의 멤버 디오가 모닝콜을 건다. 생일에는 “지원아 생일 축하해”라는 인사말도 건넨다. 디오의 목소리를 쏙 빼닮은 음성이지만 사실 스타트업 휴멜로가 TTS(text to speech) 기술로 만들어 유튜브 채널에 공개한 기계음이다. 휴멜로의 인공지능(AI) 기술을 활용하면 이 같은 음성을 얼마든지 생성해낼 수 있다.

TTS 기술은 정보기술(IT) 각 분야로 쓰임새를 넓히고 있다. 오디오북, 지하철 안내방송, AI 음성 비서 등 활용처가 다양해졌다. 네이버는 ‘클로바더빙’을 서비스하고 있고, 카카오엔터프라이즈는 재난방송에서 스크립트를 읽어주는 AI 아나운서를 연내 선보인다.

휴멜로는 지난 4월 TTS 프로그램 ‘프로소디’(사진)를 내놓으며 서비스 경쟁에 뛰어들었다. 감정과 운율까지 자유자재로 조절할 수 있다는 게 다른 프로그램과 구별되는 장점이다. 기쁨, 차분함, 화남, 슬픔, 실망 등 여러 감정을 표현할 수 있다. 말하는 속도와 음높이를 원하는 대로 조절하는 것도 가능하다. 성우 녹음에 드는 비용의 20% 정도로 음성을 만들 수 있다고 설명했다.

특정 사람의 음성을 흉내 내려면 우선 그 사람의 목소리를 입력해야 한다. 휴멜로는 여기에 드는 시간을 줄이기 위해 기술 고도화에 힘을 쏟고 있다. 이자룡 휴멜로 대표는 “기존 TTS 서비스에서는 40분 이상 목소리를 넣어야 그 사람의 음색을 따라할 수 있었다”며 “몇 문장의 목소리를 입력하는 것만으로 음성을 재현하는 서비스를 조만간 선보일 것”이라고 말했다.

휴멜로는 SM엔터테인먼트 등 여러 연예기획사와 TTS 기술을 활용한 협력 방안을 논의하고 있다. 이 대표는 “국내 연예인이 영어 음성을 통해 해외 팬덤과 소통할 수 있도록 돕는 서비스 등을 구상하고 있다”고 말했다.

최한종 기자 onebell@hankyung.com