'귀'신같이 알아듣는 AI 스피커 나온다

최한종 기자

입력2021.02.15 17:57 수정2021.02.16 00:48 지면A16

KAIST, 인간 달팽이관 닮은 음성센서 개발

말귀 어두운 사오정 스피커는 가라
공진현상 통해 잡음 95% 낮춰
정확도 높이고, 크기는 확 줄여
음성 암호 보안기술도 선보여
스마트폰·AI스피커 등에 상용화

챗봇, 디지털 휴먼 등 인공지능(AI) 기기가 먼 거리의 소리를 정확하게 인식할 수 있도록 돕는 기술이 개발됐다. KAIST는 이건재 신소재공학과 교수 연구팀이 인간의 귀를 닮은 신개념 음성 센서를 개발했다고 15일 밝혔다. 연구팀은 스마트폰과 AI 스피커에 이 센서를 장착하는 데도 성공했다.

달팽이관 모사해 잡음 줄여

현재 상용화된 AI 스피커는 가까이서 발생하는 소리는 잘 듣지만 먼 거리의 소리에는 약하다. 귀의 구조에 비밀이 숨겨져 있다. 인간은 특정 주파수 영역에서 센서가 큰 폭으로 진동하는 공진 현상을 통해 먼 거리의 소리를 인식한다. 달팽이관에 있는 사다리꼴 막이 가청 주파수 대역에서 공진 현상을 통해 소리를 증폭하는 방식이다.

이 교수 연구팀은 이 같은 원리를 인공적으로 구현해 신호 대 잡음 비가 낮은 센서를 개발하는 데 성공했다. 매우 얇은 유연 압전 막을 사용해 인간의 달팽이관을 모사했다. 압전은 압력을 가했을 때 전기적인 신호가 생성되는 현상이다. 센서에서 음성이 막을 진동시키면 인간의 귀에서처럼 공진 현상이 일어나 민감도가 높은 전압 신호를 얻을 수 있게 된다.

연구팀은 2019년 최초로 공진형 유연 압전 센서를 개발했다. 첫 제품은 크기가 가로·세로 3㎝로 커 모바일용 제품에 적용하기 어렵다는 한계가 있었다. 연구팀은 이번 연구 과정에서 초박형 미세 박막 공정을 적용해 크기를 70%가량 줄이는 데 성공했다. 센서 구조에 따른 공진, 주파수, 압전 막의 역할 등을 이론적으로 밝혀내 디자인을 최적화했다. 음성을 암호화하는 보안 기술도 함께 선보였다.이 교수는 “이번에 제품화한 센서는 민감도가 높으면서도 크기가 작아 미래 AI 기술을 구동하는 핵심 센서로 활용될 수 있을 것”이라고 말했다.

적은 데이터로도 화자 식별

개발된 센서는 화자 식별 오류율이 기존 상용 센서에 비해 최대 95% 낮다. 오류율이 낮으면 AI가 적은 데이터로도 화자를 정확하게 식별할 수 있다. 음성인식 기능이 적용된 스마트폰, AI 스피커 등 사물인터넷(IoT) 기기에 폭넓게 활용될 것으로 전망된다. 음성을 암호화하는 보안 기술은 사용자 맞춤형 서비스와 핀테크 분야 등에서 적용될 것으로 기대되고 있다.

이 교수는 2016년 KAIST 내에서 자신이 창업한 기업인 프로닉스를 통해 이 기술을 상용화할 예정이다. 이 교수는 “현재 대량생산 공정도 완성 단계”라며 “프로닉스 미국 지사를 통해 여러 미국 정보기술(IT) 기업과 협업을 추진하고 있다”고 말했다. 이 교수는 지난해 열린 세계 최대 IT·가전 전시회 ‘CES 2020’에서 이 기술을 세계 시장에 처음으로 선보였다.이번 연구는 한국연구재단의 휴먼플러스 인공지능 센서 센터의 지원을 받아 진행됐다. 연구 결과는 국제 학술지 ‘사이언스 어드밴시스’에 지난 12일자로 게재됐다.

최한종 기자 onebell@hankyung.com

'귀'신같이 알아듣는 AI 스피커 나온다

달팽이관 모사해 잡음 줄여

적은 데이터로도 화자 식별

"AI 윤리 문제, 기술 부족이 원인…규제보다 표준화로 해결"

아자르 '2兆 대박' 하이퍼커넥트…데이터·개발 경력직 대규모 채용

"AI 과잉 규제, 산업 육성 막아선 안돼"

SK텔레콤, 'T전화x누구' 전용 이어폰 출시

길어지는 ‘집콕’에 커지는 ‘필터 버블’···알고리즘에 지배 당하는 소비자들?