KT, AI서비스 확대…동영상에 감정 담긴 음성 삽입

콘텐츠 제작자들이 KT의 ‘AI 보이스’를 활용해 영상을 제작하고 있다. /KT 제공
KT가 인공지능(AI) 서비스 영토 확장에 속도를 내고 있다. 최근 침착한 목소리, 화난 목소리 등 감정이 담긴 AI 음성을 생성해 동영상에 넣는 서비스 상품을 선보인 게 대표적이다. AI를 접목한 고객센터를 시작으로 다양한 AI 서비스를 발굴하는 전략에 힘을 싣고 있는 모양새다.

KT는 지난 4일 영상 소프트웨어 전문기업 곰앤컴퍼니와 손잡고 동영상 편집 프로그램 ‘곰믹스 맥스’에 AI 보이스를 결합한 상품을 출시했다. 월 5900원에 2만 자 수준의 AI 보이스를 생성해주는 서비스다. AI로 누구나 손쉽게 동영상을 만들고 편집할 수 있도록 도와주는 도구다.

곰믹스 맥스에서 AI 보이스를 활용하면 고급 음향 장비 없이도 고품질의 AI 음성을 생성해 동영상에 삽입 및 편집할 수 있다. 같은 말도 콘텐츠의 다양한 상황을 반영해 즐거움, 침착함, 중립, 슬픔, 화남 등의 감정이 담긴 목소리로 제작이 가능한 수준이다.

다룰 수 있는 언어도 여럿이다. 영어와 일본어, 중국어, 스페인어 등 외국어 음성을 AI로 생성해 영상에 삽입할 수 있다. 추후 태국어, 말레이시아 등 동남아권 언어 지원도 추가할 계획이다.AI 보이스는 KT가 개발한 AI 음성합성 오디오 제작 플랫폼인 ‘KT AI 보이스 스튜디오’를 기반으로 한다. 이 플랫폼은 110개의 다양한 AI 음성을 제공한다. 5가지 감정과 5개국 언어로 합성을 지원하는 것도 특징이다. 30개 문장을 녹음하는 음성 합성 과정을 거치면 나만의 AI 보이스를 제작해주기도 한다.

최준기 KT AI·빅데이터사업본부장은 “이제 콘텐츠 제작에서 AI 기술은 필수 요소로 꼽힌다”며 “생성 AI 기술로 AI 음성뿐 아니라 AI 이미지, 영상, 대화 등 영역을 확장하며 콘텐츠 제작 시장에서 존재감을 키우겠다”고 말했다.

KT는 AI 서비스 관련 포트폴리오를 지속 확장할 계획이다. 이용자 편의를 높이는 데 초점을 맞춘 AI 특화 서비스로 승부를 보겠다는 전략이다.지난 6월에는 음식 사진을 찍으면 그 종류와 영양성분을 분석해 알려주는 AI 식이 관리 솔루션 ‘AI 푸드 태그’를 개발해 한국인공지능인증센터로부터 품질을 인증받았다. AI 푸드 태그는 AI 영상 기술로 사진 속 음식의 종류를 인식한 뒤 영양성분, 칼로리 정보 등을 분석해 정밀한 영양 관리를 돕는 식이 관리 솔루션이다. 당뇨 등 만성질환 환자의 식단을 관리하는 데 활용할 수 있다.

KT는 지난달 AI 스타트업 업스테이지와 콴다에 100억원씩 총 200억원 규모의 지분 투자를 하기도 했다. 이 회사가 스타트업에 수백억원대 투자를 단행한 것은 올 하반기 들어서만 두 번째다. 지난 7월엔 AI 인프라 소프트웨어 기업인 모레에 150억원을 투자했다.

KT 관계자는 “AI 분야에서 사업 경쟁력을 확보하기 위해 다양한 기업과 동맹을 맺고 있다”고 설명했다. 회사의 명운이 달렸다는 얘기가 나올 정도로 AI 서비스 사업에 공들인다는 후문이다. 포화된 통신사업만으로는 성장에 한계가 있다고 본 것이다. KT는 이달 초거대 AI ‘믿음’을 출시할 계획이다.

정지은 기자 jeong@hankyung.com