가상인간 로지, 목소리는 어떨까

네이버, 클로바AI로 음성 제작
8일 라디오 프로그램서 첫 공개
네이버가 인공지능(AI) 기술로 버추얼 인플루언서 ‘로지’(사진)의 목소리를 개발했다. 네이버는 클로바 AI 음성합성 기술로 로지의 AI 목소리를 만들어 8일 SBS 파워FM ‘두시탈출 컬투쇼’에서 공개한다고 6일 발표했다.

로지는 이날 방송에 스페셜 게스트로 출연해 DJ 김태균과 버추얼 인플루언서로의 활동에 대한 이야기를 나누고 청취자 사연도 직접 읽을 계획이다. 가상 인간이 라디오 방송에 출연하는 것은 이번이 처음이다. 로지는 2020년 8월 콘텐츠 기업 싸이더스스튜디오엑스가 공개한 가상 인간이다. 보험회사 광고를 비롯해 주로 광고 영역에서 활동하고 있다.로지의 AI 목소리는 네이버의 음성합성 기술 ‘NES(natural end-to-end speech synthesis)’를 통해 탄생했다. 40분가량 특정인의 말을 녹음하면 이를 기반으로 사람에 가까운 자연스러운 목소리를 구현할 수 있다는 설명이다. 로지가 별도의 녹음 없이도 AI 보이스를 통해 음성으로 자유롭게 의사소통할 수 있게 되면서, 그동안 소셜미디어와 광고 등에 주력했던 로지의 활동 영역도 라디오 DJ, 사회자, 라이브 커머스 진행자 등으로 한층 넓어질 전망이다.

네이버는 AI 보이스로 동영상을 더빙할 수 있는 ‘클로바더빙’을 통해 음성합성 기술을 서비스하고 있다. 클로바더빙에서는 다양한 성별, 연령대, 스타일의 105개 보이스를 자유롭게 사용할 수 있다.

이승우 기자 leeswoo@hankyung.com