"신해철이 살아돌아온 줄"…라디오 DJ 목소리에 깜짝
입력
수정
AI가 '환생'시킨 신해철 목소리 들어보니“거의 10년만이네요. 그죠? 이렇게라도 여러분들을 만나게 되어 반갑습니다. 저는 뮤지션 신해철입니다. 워낙 오랜만이라 어떤 이야기를 할까 고민을 많이 했는데…음악하는 제 동료, 후배들 얘기를 좀 해볼까 해요. 코로나 얘기도 함께요.”
AI 기반 고인 음성합성 시도 늘어
일반인 대상 서비스 준비도 확산
'고인 되살리기' 움직임에 윤리적 논란도
묘한 일이다. 2014년 세상을 뜬 라디오 DJ의 목소리로 코로나19 얘기가 나온다. 가수 겸 라디오 DJ였던 고(故) 신해철씨의 음성이다. 앞날을 내다본 미공개 녹음본일리는 없다. 이를 가능케 한 것은 인공지능(AI) 기술이다. 신해철씨의 음성 데이터를 AI가 학습해 문장으로 재합성했다. 국내에서 고인이 이야기를 하는 듯한 AI 라디오 콘텐츠가 나온 것은 이번이 처음이다.
AI 기술로 부활한 'DJ 신해철'
KT가 12일 공개한 음성 콘텐츠 ‘AI DJ, 신해철과의 만남’은 KT가 자체 개발한 AI 기반 개인화 음성합성기술(TTS)를 썼다. 라디오 방송 형식으로 총 22분 분량 세 편으로 구성했다. 신해철씨가 2001년부터 11년간 진행한 라디오 방송 ‘신해철의 고스트스테이션’ 형식을 차용했다.AI가 되살려낸 목소리가 100% 자연스럽지는 않다. 간혹 음성 합성의 영향으로 소리 잔향이 남거나, 말 빠르기가 조금 어색한 때가 있다.
하지만 안내용 AI와는 달리 감정없는 목소리가 평이하게 이어지는 것도 아니다. ‘AI DJ 신해철’이 농담을 하다가 ‘허참’하며 헛웃음을 짓는 부분에선 마치 실제 인물의 말을 듣고 있는 기분이 들 정도다. 이는 DJ가 다루는 이야기에 따라 감정 기복을 나타낼 수 있도록 AI에게 데이터를 구분해 학습시킨 영향이다.
박재한 KT TTS기술프로젝트 팀장은 “단순히 자모음 기반으로 음성을 합성하니 문장마다 감정이 오락가락하게 들렸다”며 “라디오 방송처럼 이야기에 따라 적절한 어조를 구현하기 위해 음성 데이터를 평상시·진지함·흥분함·밝음 등 네 분류로 나누고, 이 조합을 기반으로 음성을 재처리하게 했다”고 말했다. 각 분류별로 신해철씨의 발화 패턴과 억양이 조금씩 달라 이를 반영했다는 설명이다.
KT는 22분 길이 음성파일을 만들기 위해 약 20시간 분량인 신해철씨의 원본 음성 데이터를 활용했다. 박 팀장은 “AI 딥러닝 방식을 써 상대적으로 짧은 시간의 음성데이터로도 목소리를 합성할 수 있었다”며 “고인을 실제로 만날 수가 없었기 때문에 남겨놓은 유산 격인 라디오 음원을 통해 대중들이 기억하는 신해철을 표현하기 위해 노력했다”고 말했다. ‘AI DJ’를 구현하기 위해선 방송 내용도 관건이었다. 신해철씨가 이야기했을 법한 내용을 구성하기 위해 과거 신해철씨와 라디오 방송 작업을 함께 한 배순탁 작가가 원고를 작성했다. 배 작가는 '배철수의 음악캠프' 메인 작가로 MBC 라디오방송 '배순탁의 비사이드'를 진행하고 있다.
이 콘텐츠는 다음달 7일까지 한달여간 KT의 기가지니를 통해서 들을 수 있다. 기가지니에게 ‘신해철 목소리 들려줘’라고 요청하면 된다. 신해철씨의 팬과 기가지니를 이용하지 않는 KT 고객을 위해 오는 17일부터 KT 유튜브 채널에도 콘텐츠를 공개한다.
최근 고인 목소리 합성 수요 늘어
최근 정보통신(IT)업계에선 AI 음성합성 기반 신사업이 커지고 있다. 네오사피엔스, 휴멜로, 자이냅스 등 스타트업들도 각각 특화 음성합성 서비스를 운영한다.그간엔 실존 연예인의 목소리를 안내 멘트로 합성하는 경우가 많았지만 최근엔 고인의 목소리를 AI로 되살리려는 시도도 이어지고 있다. 작년 말엔 고 김광석, 고 김현식 등 유명을 달리한 가수들의 노래 공연을 AI로 재현한 사례가 나왔다.일반 대중을 겨냥한 개인화 음성합성 서비스를 준비하는 기업들도 있다. AI를 활용해 ‘돌아가신 부모님과 명절 안부 통화하기’ 등을 하는 식이다. 한 스타트업 관계자는 "AI 기술이 확산하면서 일반인 대상 AI 음성 합성 서비스 수요가 커지고 있다"며 "스마트폰을 통해 가족이나 친구들의 영상이나 음성 데이터를 확보하기 쉬워졌기 때문에 기술적으로 가족들의 음성 등을 재구현할 수 있을 것"이라고 설명했다.
'고인 추모' vs '존엄성 훼손' 논란도
상용화까지 남은 과제도 많다. 윤리적 논쟁이 대표적이다. AI로 합성한 목소리는 기술의 영역이라도, 그 목소리가 담는 내용은 그렇지 않다는 지적이다. 고인의 생전 허락을 받지 않은 채 주요 생체 정보를 재활용하는 것에 대해서도 각계간 이견이 크다.고인을 추모하려는 의도가 자칫 고인의 존엄성을 훼손하는 오용으로 연결될 수 있다는 우려도 나온다. 고인의 가치관과는 다른 내용이 합성한 음성을 통해 잘못 알려질 수도 있어서다. 신기술 등 새로운 사안에 대해선 이미 세상을 등진 이들의 생각을 알 길이 없다. 고인이 법적 다툼 등으로 진위를 바로잡을 수도 없다. 합성된 음성이 보이스피싱이나 가짜뉴스 전파 등에 악용될 가능성도 있다. 미국에선 지난 7월 개봉한 한 다큐멘터리 영화가 AI로 합성한 음성을 마치 고인이 생전 남겼던 이야기인 것처럼 내보내 논란을 사기도 했다.
선한결 기자 always@hankyung.com