"AI로 소리 분석…활용 영역 무궁무진"

인터뷰 / 이수지 디플리 대표

소리 데이터 기반 '리슨AI' 개발
건강 상태·산업현장 이상 등 감지
이수지 디플리 대표(오른쪽)와 류명훈 CIO.
디플리는 소리 인공지능(AI) 감지·분석 솔루션을 개발한 스타트업이다. 디플리를 창업한 이수지 대표는 한국경제신문과의 인터뷰에서 “콜센터에서 갑질 상황을 포착하는 것부터 축산현장에서 가축의 건강 상태를 확인하는 것까지 소리 AI로 할 수 있는 영역이 정말 넓다”고 강조했다.

디플리가 자체 개발한 AI 음향 감지 시스템 ‘리슨 AI’는 42종, 총 5만 시간에 달하는 소리 데이터를 기반으로 각종 현장의 돌발 상황을 포착해낸다. 예컨대 제조현장에서 기계 음향을 포착해 고장 등 이상을 감지할 수 있다. 건설현장에선 무언가 떨어지는 소리나 비명 소리로 근로자 낙상 사고를 알아내고 빠르게 대응하는 게 가능하다.기존에도 사람의 음성을 분석해 번역 등을 제공하는 AI 서비스는 있었지만 음향 분류와 분석에 특화한 AI는 드물었다. 류명훈 디플리 CIO는 “AI 솔루션 경쟁력을 갖춘 동시에 수음용 마이크와 엣지 서버 등 하드웨어까지 개발해 패키지를 갖췄다”며 “가장 적합한 하드웨어에 AI를 접목했을 때 나올 수 있는 잠재력이 크다”고 말했다.

실제 디플리는 강원랜드, 롯데건설, 코레일 등 여러 기업 및 기관과 파트너십을 맺고 있다. 최근엔 정부세종청사 체육관과 인천대입구역 화장실에도 리슨 AI를 공급했다. 현장에서 소리를 실시간 감지하고 이상 상황을 판단하면 즉각 경보를 울린다. 이 대표는 “CCTV가 설치된 곳이라도 관제실에서 24시간 모니터링하지 않으면 사고 발생 시 실시간으로 알기 어렵다”며 “CCTV와 같이 리슨 AI를 설치하면 모니터링 정확도를 높일 수 있다”고 말했다. 코레일에서도 견인 전동차의 모터 소리 등을 감지해 이상 여부 탐지에 활용하고 있다.

이 대표는 이미지와 영상 등 시각 AI보다 소리 AI 영역에 기술적인 장벽이 있겠다고 판단하고 디플리를 창업했다. 그는 “소리 AI가 잘 작동하기 위해선 공간의 울림부터 노이즈, 사람의 발화적 특성까지 모두 기술적으로 포함해야 하기 떄문에 다른 AI 회사들이 쉽게 따라오기 어려운 영역이라고 생각했다”고 말했다.소리 AI 모델 개발을 위해 다양한 음성·음향 데이터를 모았다. 비명 소리부터 싸우는 소리, 물건이 부딪히는 소리, 떨어지는 소리 등이다. 류 CIO는 “외부에서 데이터를 사오기도 하고, 필요하면 액터를 고용해 직접 녹음하기도 하면서 다양한 소리를 수집했다”며 “다양한 소스에서 모은 데이터셋을 사운드 이벤트 리스트에 맞게 학습시키고 모델을 만들었다”고 설명했다.

디플리는 고려대 병원과 함께 우울증 환자의 생활을 트래킹하는 연구도 시작했다. 규칙적으로 운동이나 식사를 하고 있는지 소리를 통해 파악하는 것이다.

이 대표는 “소리AI의 활용영역은 무궁무진하다”며 “디플리가 개척해나가는 역할을 할 것”이라고 말했다.

고은이 기자 koko@hankyung.com