생성형 인공지능(AI) 기술이 텍스트를 넘어 음성으로 폭넓게 적용되고 있다. 유명인의 목소리를 입히거나 음악, 보컬 자동 생성 서비스가 잇따라 개발되며 투자자들의 선택을 받고 있다.

네이버 D2SF(D2 Startup Factory)는 생성형 보컬 AI 기술을 개발한 스타트업 ‘오드아이(대표 최순범)’에 신규 투자했다고 21일 밝혔다. 오드아이는 KAIST 음악 AI 연구실 창업팀으로, 지난 6월 세계적인 성악가 조수미와 AI 보컬의 듀엣 공연을 성공적으로 마무리하며 주목받았다.
소프라노 조수미가 지난 7월15일 프랑스 중부 루와르 지방의 고성인 ‘샤토 드 라 페르테-앵보에서 열린 ‘조수미 국제 콩쿠르’ 발대식 및 독창회에서 공연을 펼치고 있는 모습 / 사진=뉴스1
소프라노 조수미가 지난 7월15일 프랑스 중부 루와르 지방의 고성인 ‘샤토 드 라 페르테-앵보에서 열린 ‘조수미 국제 콩쿠르’ 발대식 및 독창회에서 공연을 펼치고 있는 모습 / 사진=뉴스1

5초 만에 보컬 생성 AI 개발

오드아이는 적은 데이터로 고퀄리티 보컬을 생성하는 보컬 AI 기술을 개발했다. 다양한 스타일의 보컬을 생성하는 것은 물론, 기존 보컬을 원하는 스타일로 변환할 수도 있어 높은 데이터 효율성을 자랑한다.

국제 음성·음악 학회, 전문가 블라인드 테스트 등에서 보컬 완성도를 인정받았으며, 한국어, 영어, 일본어 등 다국어를 지원해 기술 확장성 측면에서도 경쟁력을 확보하고 있다는 게 회사 측 설명이다.

오드아이는 11월 오픈 베타 서비스를 목표로, AI 기반 보컬 생성 솔루션 ‘복스 팩토리(Vox Factory)’를 준비 중이다. 멜로디나 가사를 입력하면 그에 어울리는 보컬을 자동 생성하는 솔루션이다. 웹 기반이라 누구나 쉽게 사용할 수 있으며 스타일, 끝음처리 등 보컬의 세부 요소도 정교하게 편집할 수 있는 것이 강점이다.

이미 오드아이는 게임, 엔터테인먼트 및 버추얼 콘텐츠 지식재산권(IP) 시장 중심으로 호응을 얻으며 본격적인 협업을 논의 중이다. 조수미의 성악 데이터를 가창 합성 모델에 학습시킨 AI 아바타의 목소리도 탄생시킨 바 있다.

최순범 대표를 비롯한 오드아이의 공동창업진은 KAIST에서 음악 AI 박사 과정을 전공했으며, 작곡부터 음향, 프로듀싱 등 음악 창작 전반에 대해 높은 이해도를 갖춘 멤버들로 구성돼 있다.

네이버가 발굴한 캠퍼스 기술 창업팀


오드아이는 예비창업 단계에서 네이버 D2SF의 캠퍼스 기술창업 공모전에 최종 선정돼 6개월간의 인큐베이팅을 거친 팀이다. 법인 설립 이후 네이버 D2SF로부터 첫 기관 투자를 유치했다.
네이버 D2SF는 보컬 분야에 특화한 생성 AI 기술의 가능성, 그리고 짧은 시간 동안 빠르게 사업모델을 고도화해 의미 있는 성장을 일궈낸 점에 주목해 투자를 결정했다.
'조수미와 완벽 듀엣'…AI 개발사 오드아이, 네이버가 찜했다 [허란의 VC 투자노트]
양상환 네이버 D2SF 리더는 “오드아이는 음악 이해도와 AI 역량, 빠른 실행력을 갖춘 희소한 역량의 팀"이라며 “최근 버추얼 IP 등 보컬 AI가 활용될 수 있는 음악 창작 시장이 빠르게 성장하는 가운데 오드아이가 새로운 지평을 열 것"이라고 기대했다.

네이버 D2SF는 2016년부터 캠퍼스 기술 창업 공모전을 진행하며 극초기 단계의 대학생 창업팀을 적극 발굴 육성하고 있다. 이를 통해 ▲음악 AI 스타트업 ‘포자랩스’ ▲ 네이버웹툰에 인수된 비디오 AI 스타트업 ‘비닷두’ ▲디지털트윈 스타트업 '모빌테크' 등 7개 팀에 직접 투자도 진행했다.

현재 13기 캠퍼스 기술창업 공모전을 공개 모집 중이다.

허란 기자 why@hankyung.com