인공지능(AI) 스타트업(신생 벤처기업) 마인즈랩이 특정인의 목소리만 따로 떼어낼 수 있는 음성 분리 기술을 구현하는 데 성공했다고 5일 발표했다.

토론회처럼 여러 사람이 동시에 말하는 일이 잦은 상황에서 요긴하게 쓸 수 있다는 것이 회사 측 설명이다. AI 기술 중 하나인 ‘딥러닝’을 활용했다. 이 기술을 처음 소개한 회사는 구글이다. 지난해 10월 논문을 통해 딥러닝 기술을 활용하면 개개인의 음성을 분리할 수 있다는 사실을 밝혔지만 오픈소스를 공개하지는 않았다. 음성 분리 기술을 오픈소스 형태로 외부에 알린 것은 마인즈랩이 처음이다.

최홍섭 마인즈랩 상무는 “세 명 이상의 사람이 동시에 말할 때 각각의 목소리를 분리하는 데 성공했다”며 “상용 서비스가 가능한 수준까지 기술을 고도화할 예정”이라고 설명했다.

음성 분리 기술은 회의록을 자동으로 작성하는 등 세밀한 음성 인식 기술이 필요한 분야에서 다양하게 쓰일 것으로 전망된다. 마인즈랩은 이 기술을 토대로 ‘AI 회의록 서비스’와 ‘AI 하이브리드 고객센터 서비스’를 선보일 예정이다.

김남영 기자 nykim@hankyung.com