네이버, 음성인식 AI에 '하이퍼클로바' 적용…정확도 대폭 향상
-
기사 스크랩
-
공유
-
댓글
-
클린뷰
-
프린트
네이버는 음성인식 인공지능(AI) 엔진 '네스트(NEST)'에 최근 공개한 초대규모 AI '하이퍼클로바'의 딥러닝 기술을 접목했다고 8일 밝혔다.
전통적으로 AI 딥러닝은 데이터와 데이터를 설명하는 '레이블'을 동시에 학습시키는 '지도학습' 방식으로 이뤄진다. 가령 고양이 이미지와 '고양이'라는 설명을 같이 학습시키는 식이다. 반면 음성인식 AI를 개발하기 위해서는 음성과 음성 속 텍스트를 같이 학습시켜야 한다. 이러한 '데이터 레이블링'은 수작업으로 이뤄져 학습데이터 구축에 시간과 비용이 많이 든다.
반면 '자기지도학습'(self-supervised learning)은 레이블 없이 데이터 자체만으로 학습할 수 있는 최신 딥러닝 기법으로, 학습 효율성을 훨씬 높일 수 있다. 이는 네이버가 최근 공개한 초대규모 AI '하이퍼클로바'의 핵심 기술이다.
네이버는 자기지도학습 기법을 AI 음성인식 엔진 '네스트'에 적용해 기존 대비 음성인식 정확도를 약 30% 높이고 비용도 크게 줄였다고 설명했다.
NEST 엔진은 단문 위주 음성 명령보다 복잡한 장문의 음성 표현을 인식하는 데 최적화된 기술로, 네이버가 지난해 4월 처음 공개했다. 이번 기술 접목으로 업그레이드된 네스트는 음성기록 서비스 '클로바노트'에 먼저 적용됐다. 앞으로 AI가 전화로 코로나19(신종 코로나바이러스 감염증) 능동감시자를 확인하는 클로바 케어콜, 뉴스 자동 자막 서비스 등으로 확대할 예정이다.
한익상 네이버 책임리더는 "네이버는 음성 AI 분야 양대 국제 학회인 '인터스피치(Interspeech)'와 'ICASSP'에 올해 각각 9개씩의 논문이 채택되는 등 글로벌 최고 수준 음성기술 경쟁력을 인정받았다"면서 "여기에 하이퍼클로바의 기술을 접목시켜 다양한 음성 AI 서비스 성능을 더욱 고도화해나갈 것"이라고 말했다. 강경주 한경닷컴 기자 qurasoha@hankyung.com
전통적으로 AI 딥러닝은 데이터와 데이터를 설명하는 '레이블'을 동시에 학습시키는 '지도학습' 방식으로 이뤄진다. 가령 고양이 이미지와 '고양이'라는 설명을 같이 학습시키는 식이다. 반면 음성인식 AI를 개발하기 위해서는 음성과 음성 속 텍스트를 같이 학습시켜야 한다. 이러한 '데이터 레이블링'은 수작업으로 이뤄져 학습데이터 구축에 시간과 비용이 많이 든다.
반면 '자기지도학습'(self-supervised learning)은 레이블 없이 데이터 자체만으로 학습할 수 있는 최신 딥러닝 기법으로, 학습 효율성을 훨씬 높일 수 있다. 이는 네이버가 최근 공개한 초대규모 AI '하이퍼클로바'의 핵심 기술이다.
네이버는 자기지도학습 기법을 AI 음성인식 엔진 '네스트'에 적용해 기존 대비 음성인식 정확도를 약 30% 높이고 비용도 크게 줄였다고 설명했다.
NEST 엔진은 단문 위주 음성 명령보다 복잡한 장문의 음성 표현을 인식하는 데 최적화된 기술로, 네이버가 지난해 4월 처음 공개했다. 이번 기술 접목으로 업그레이드된 네스트는 음성기록 서비스 '클로바노트'에 먼저 적용됐다. 앞으로 AI가 전화로 코로나19(신종 코로나바이러스 감염증) 능동감시자를 확인하는 클로바 케어콜, 뉴스 자동 자막 서비스 등으로 확대할 예정이다.
한익상 네이버 책임리더는 "네이버는 음성 AI 분야 양대 국제 학회인 '인터스피치(Interspeech)'와 'ICASSP'에 올해 각각 9개씩의 논문이 채택되는 등 글로벌 최고 수준 음성기술 경쟁력을 인정받았다"면서 "여기에 하이퍼클로바의 기술을 접목시켜 다양한 음성 AI 서비스 성능을 더욱 고도화해나갈 것"이라고 말했다. 강경주 한경닷컴 기자 qurasoha@hankyung.com