자율주행·의료·챗봇…AI용 '데이터 댐' 구축해 디지털 뉴딜 이끈다

9월의 우수사례 - 슈퍼브에이아이·딥노이드·솔트룩스
슈퍼브에이아이의 솔루션을 통해 자율주행 데이터를 라벨링하는 모습. 슈퍼브에이아이 제공
데이터는 ‘미래의 석유’로 불린다. 데이터를 수집하고 활용하는 능력이 인공지능(AI) 성능과 직결되기 때문이다. 과학기술정보통신부와 정보통신산업진흥원(NIPA)은 국가 디지털 경쟁력을 높이기 위해 ‘데이터 댐’ 구축에 공들이고 있다.

빅데이터를 성공적으로 모아 활용하고 새로운 서비스를 선보이는 민간 기업들도 속속 나오고 있다. 과기정통부와 NIPA가 ‘9월의 디지털 뉴딜 우수사례’로 선정한 슈퍼브에이아이, 딥노이드, 솔트룩스가 대표적이다. NIPA는 지난 4월부터 D·N·A(데이터·네트워크·인공지능) 우수기업 선정 사업을 디지털 뉴딜 우수사례로 확대 개편했다.

데이터 라벨링 시간 10분의 1로 절감

2018년 설립된 스타트업 슈퍼브에이아이는 효율적인 데이터 라벨링 기술을 개발했다. 데이터 라벨링은 AI 머신러닝(기계학습)의 재료로 쓰기 위해 데이터별로 정보값을 입력하는 작업이다. 과거 이 작업은 주로 사람이 맡았다. 많은 기업들이 부담을 느낄 만큼 데이터 가격이 높아진 이유다.

슈퍼브에이아이의 ‘슈퍼브에이아이 스위트’는 AI가 라벨링까지 도와주는 데이터 구축 플랫폼이다. 슈퍼브에이아이 스위트를 쓰면 데이터 라벨링에 드는 시간이 기존 대비 최대 10분의 1로 줄어든다. 그만큼 비용도 아낄 수 있다. AI 데이터 라벨링 정확도는 99.3%에 달한다. 슈퍼브에이아이는 정확도를 높이기 위해 5000만 개의 라벨링 데이터를 쌓았다. 데이터 라벨링 관련 국내 특허 1건 및 미국 특허 5건도 출원했다.

슈퍼브에이아이는 기술 우수성을 인정받아 지난해 25억원의 시드 투자를 유치했다. 업계에선 슈퍼브에이아이가 특히 자율주행 관련 데이터를 분석하는 데 강점을 갖고 있다고 평가하고 있다. 기업들의 ‘러브콜’도 이어지고 있다. LG전자, 퀄컴, 나이엔틱 등 국내외 정보기술(IT) 기업들이 슈퍼브에이아이 스위트를 도입했다.

의료진 AI 연구 도우미

딥노이드의 AI 의료영상 진료·판독 시스템으로 흉부질환을 판독해내고 있다. 딥노이드 제공
의료 AI 플랫폼 전문기업 딥노이드는 의료인이 코딩 없이도 AI를 연구할 수 있는 기술을 개발했다. AI는 의학 수준을 획기적으로 높일 열쇠로 꼽히지만 의료인이 컴퓨터공학도 수준의 프로그래밍 지식을 갖추기 어렵다는 게 기술 발전의 난점이었다. 딥노이드의 ‘딥파이(DEEP:PHI)’를 쓰면 프로그래밍 지식이 없는 의료인도 X선 촬영, 컴퓨터단층촬영(CT), 자기공명영상(MRI) 등의 의료영상을 활용한 AI 연구에 참여할 수 있다.

2008년 설립된 딥노이드의 무기는 방대한 데이터다. 총 38종, 24만8000건에 이르는 뇌동맥류 등 의료영상의 데이터셋을 구축했다. 딥노이드는 뇌동맥류, 폐결절, 요추 압박결절 등 총 15종 질환을 AI로 판독할 수 있는 ‘딥에이아이’도 개발했다. 공항 등에서 보안검색 영상을 자동으로 판독할 수 있는 시스템도 개발했다. 이 시스템은 이달 초 김포공항 국내선 보안검색대에 시범 적용됐다.

딥노이드는 AI 관련 13개의 식품의약품안전처 인허가 솔루션을 보유하고 있다. 이를 기반으로 총 35개의 특허를 출원해 그중 23개를 등록했다. 빅데이터 개방 서비스를 제공하고 있고, 의료인 대상 AI 교육도 진행 중이다.

‘1세대 AI 기업’ 솔트룩스 올 7월 상장

2000년 설립된 1세대 벤처 기업 솔트룩스는 국내 AI 기술 대표 주자로 꼽힌다. 자연어 처리 분야에 집중해 국내에서 가장 많은 AI 특허를 갖추는 데 성공했다. 머신러닝 기반 자연어처리 검색, 데이터마이닝 솔루션 등이 이 회사의 핵심 기술이다. AI가 사람의 질문에 심층적인 대답을 내놓을 수 있게 하는 기술과 방대한 규모의 데이터를 분석할 수 있는 솔루션을 개발했다.

솔트룩스의 대표 제품은 ‘AI 스위트’이다. 자연어 이해, 음성인식 등 서비스를 제공하는 플랫폼이다. 언어, 시각인지 등 총 50여 가지 응용프로그램 인터페이스(API)를 제공하는 ‘아담플랫폼’도 제공하고 있다. 신종 코로나바이러스 감염증(코로나19) 확산으로 AI 챗봇을 활용한 비대면 고객 상담 등이 늘어나며 솔트룩스의 제품을 찾는 기업들이 많아졌다. 현재 금융·통신·의료·쇼핑 등 다양한 기업들이 이 회사의 솔루션을 쓰고 있다.

솔트룩스가 자체적으로 구축한 AI 학습 데이터는 150억 건에 달한다. 음성 데이터는 2만 시간 분량이다. 보유한 데이터 중 오픈데이터, 소셜데이터, 언어자원, 지식베이스 데이터 등 80억 건은 단계적으로 개방하고 있다. 국내 AI 생태계 발전에 기여한다는 취지다.솔트룩스는 올해 설립된 지 20년 만에 코스닥시장에 상장했다. 약 188억원을 조달하는 데 성공했다. 과기정통부 관계자는 “솔트룩스는 기업 보유 데이터를 공개해 지능정보 사회 구현에 기여했고, AI 서비스를 위한 국내 산업 기반을 마련했다”고 평가했다.

최한종 기자 onebell@hankyung.com