회의록 작성·K팝 스타 목소리 재현…음성 AI 놀라워라!
-
기사 스크랩
-
공유
-
댓글
-
클린뷰
-
프린트
진화하는 음성 AI 서비스
네이버, 앱에 녹음파일 올리면
참석자 목소리 구분해 문자변환
SK C&C, 이용자 말투까지 모사
엔씨, 아이돌 가수 음성 서비스
넷마블, 목소리로 게임 조종
네이버, 앱에 녹음파일 올리면
참석자 목소리 구분해 문자변환
SK C&C, 이용자 말투까지 모사
엔씨, 아이돌 가수 음성 서비스
넷마블, 목소리로 게임 조종
인공지능(AI)을 활용한 음성 인식 서비스가 진화하고 있다. 국내 정보기술(IT) 기업들이 음성 내용을 글자로 그대로 옮기거나 K팝 스타의 목소리를 활용한 상품 등을 잇따라 내놓거나 개발하고 있다.
사용 방법은 간단하다. 클로바노트 앱에서 직접 녹음하거나 음성 파일을 업로드하면 해당 내용이 참석자의 목소리까지 구분된 문자로 변환돼 화면에 나타난다. 음성으로 다시 확인하고 싶은 부분의 문자 기록을 클릭하면 해당 내용을 들을 수 있다. 클로바노트 앱과 PC는 자동으로 동기화된다. 앱에서 녹음을 마치면 PC에서 바로 문자로 변환된 음성 기록을 확인할 수 있다. 클로바노트를 사용한 시간이 많아질수록 음성 인식 정확도가 높아진다.
사용자가 자주 쓰는 단어나 전문 어휘를 직접 지정하면 더욱 정확한 음성 인식 결과를 확인할 수 있다. 클로바노트 서비스를 맡고 있는 한익상 네이버 책임리더는 “앞으로 화상회의처럼 보다 다양한 환경에서 클로바노트를 효과적으로 사용할 수 있도록 기능을 확장하고 특정 기업 환경에 특화된 서비스를 선보일 것”이라고 말했다.
SK C&C는 20분 정도의 음성 녹음 파일만 있으면 자신의 목소리를 닮은 소리를 만드는 일명 ‘AI 보이스’ 서비스를 개발하고 있다. SK C&C는 스타트업 라이언로켓과 관련 서비스를 만들고 있다. 라이언로켓은 AI를 활용해 화자의 목소리와 말투를 모사하는 음성합성 기술을 보유한 스타트업이다. 두 회사는 각각 보유한 자연어 처리와 음성 변환 기술을 결합해 문화 및 교육 분야를 중심으로 관련 콘텐츠 상품을 공동 개발하고 있다.
SK C&C 관계자는 “두 회사가 힘을 합친 ‘AI 텍스트 음성 변환’ 기술은 20분 분량의 음성 녹음 데이터만 있으면 화자의 목소리, 톤, 억양, 발음, 속도 등의 특징을 분석해 어떤 문장이라도 자연스럽게 읽을 수 있다”고 설명했다. 두 회사는 우선 시각장애인의 학습과 문화 체험을 돕기 위해 활자책을 음성으로 변환하는 사업에 집중하고 있다.
넷마블은 AI를 활용해 게임 이용자 음성으로 게임을 조종하는 기술을 개발하고 있다. 세계 최고 권위의 AI 학회 중 하나인 ‘신경정보처리시스템학회(NeurIPS) 2020’에서 관련 기술을 공개했다. 넷마블은 딥러닝 기반의 음성 인식 기술을 세계 최초로 모바일 게임에 적용한 ‘모니카’를 소개했다. 안수남 넷마블 AI센터 팀장은 “모바일 게임 내에서 높은 정확도와 빠른 응답 속도로 반응하는 음성 인식 기술을 개발해 게임 이용자들의 몰입도 향상에 주력하고 있다”고 설명했다. 넷마블은 향후 출시할 게임에 관련 기술을 적용할 계획이다. 김주완 기자 kjwan@hankyung.com
AI가 음성을 문자로 기록
네이버는 지난달 AI 기술이 적용된 음성 기록 서비스 ‘클로바노트’를 출시했다. 클로바노트는 문자로 변환된 녹음 내용을 참고해 필요한 내용만 다시 ‘눈으로 보며 듣기’가 가능한 음성 기록 서비스다. 네이버 관계자는 “각종 인터뷰나 업무 미팅 등 음성을 기록하는 다양한 상황에서 대화 내용을 받아 적거나 녹음을 다시 들으며 필요한 내용을 찾는 데 들이는 시간과 노력을 크게 줄일 수 있다”고 설명했다.사용 방법은 간단하다. 클로바노트 앱에서 직접 녹음하거나 음성 파일을 업로드하면 해당 내용이 참석자의 목소리까지 구분된 문자로 변환돼 화면에 나타난다. 음성으로 다시 확인하고 싶은 부분의 문자 기록을 클릭하면 해당 내용을 들을 수 있다. 클로바노트 앱과 PC는 자동으로 동기화된다. 앱에서 녹음을 마치면 PC에서 바로 문자로 변환된 음성 기록을 확인할 수 있다. 클로바노트를 사용한 시간이 많아질수록 음성 인식 정확도가 높아진다.
사용자가 자주 쓰는 단어나 전문 어휘를 직접 지정하면 더욱 정확한 음성 인식 결과를 확인할 수 있다. 클로바노트 서비스를 맡고 있는 한익상 네이버 책임리더는 “앞으로 화상회의처럼 보다 다양한 환경에서 클로바노트를 효과적으로 사용할 수 있도록 기능을 확장하고 특정 기업 환경에 특화된 서비스를 선보일 것”이라고 말했다.
SK C&C는 20분 정도의 음성 녹음 파일만 있으면 자신의 목소리를 닮은 소리를 만드는 일명 ‘AI 보이스’ 서비스를 개발하고 있다. SK C&C는 스타트업 라이언로켓과 관련 서비스를 만들고 있다. 라이언로켓은 AI를 활용해 화자의 목소리와 말투를 모사하는 음성합성 기술을 보유한 스타트업이다. 두 회사는 각각 보유한 자연어 처리와 음성 변환 기술을 결합해 문화 및 교육 분야를 중심으로 관련 콘텐츠 상품을 공동 개발하고 있다.
SK C&C 관계자는 “두 회사가 힘을 합친 ‘AI 텍스트 음성 변환’ 기술은 20분 분량의 음성 녹음 데이터만 있으면 화자의 목소리, 톤, 억양, 발음, 속도 등의 특징을 분석해 어떤 문장이라도 자연스럽게 읽을 수 있다”고 설명했다. 두 회사는 우선 시각장애인의 학습과 문화 체험을 돕기 위해 활자책을 음성으로 변환하는 사업에 집중하고 있다.
K팝 스타 목소리도 활용
엔씨소프트도 AI 음성 인식 기술을 활용한 서비스를 준비 중이다. 내년 초에 선보일 K팝 엔터테인먼트 플랫폼 ‘유니버스’에 관련 기술을 적용할 예정이다. K팝 스타의 실제 목소리를 활용한 음성 서비스다. 이용자가 원하는 상황에 맞춰 전화 통화 방식으로 즐길 수 있다. 엔씨소프트는 강다니엘, 몬스타엑스, 아이즈원, (여자)아이들, 우주소녀 등의 음성으로 관련 서비스를 제공할 예정이다.넷마블은 AI를 활용해 게임 이용자 음성으로 게임을 조종하는 기술을 개발하고 있다. 세계 최고 권위의 AI 학회 중 하나인 ‘신경정보처리시스템학회(NeurIPS) 2020’에서 관련 기술을 공개했다. 넷마블은 딥러닝 기반의 음성 인식 기술을 세계 최초로 모바일 게임에 적용한 ‘모니카’를 소개했다. 안수남 넷마블 AI센터 팀장은 “모바일 게임 내에서 높은 정확도와 빠른 응답 속도로 반응하는 음성 인식 기술을 개발해 게임 이용자들의 몰입도 향상에 주력하고 있다”고 설명했다. 넷마블은 향후 출시할 게임에 관련 기술을 적용할 계획이다. 김주완 기자 kjwan@hankyung.com