한경 긱스(Geeks)는 혁신을 향하는 스타트업의 여정에 귀를 기울입니다. 기업 소개자료 및 취재 문의는 geeks@hankyung.com 으로 보내주시면 답변드립니다.
악어디지털은 인공지능(AI)을 활용해 각종 종이 문서를 디지털 문서로 바꿔주는 스타트업이다. 단순히 서류를 스캔해 이미지 파일로 만드는 게 아니다. 문장이나 단어를 검색·열람할 수 있도록 텍스트로 변환한다. 시큐어소프트, 안랩, 네이버 등을 거친 개발자 출신 김용섭 대표(사진)가 2014년 창립했다. 김 대표가 전자책(e북) 시장이 활성화하기 전에 출장을 가서도 원하는 책을 보기 위해 이미지 스캔본을 만든 게 창업 계기가 됐다.악어디지털의 핵심 기술은 자체 개발한 AI OCR(광학문자판독) 엔진 ‘KANDA’다. 각종 수기 데이터를 AI에 학습시켜 AI가 문자를 인식·추론하게 했다. 인식률이 낮은 데이터는 사람이 교정해주는 학습 과정을 반복해 정확도를 높였다. KANDA는 문자를 인식하고, 인식한 정보를 일상 언어(자연어) 맥락에 맞게 교정하는 등 두 단계를 거치는 게 특징이다. 이를 통해 ㅎ을 ㄹ처럼 흘려 쓴 글씨나 ㅁ을 ㅇ과 비슷하게 휘갈겨 쓴 글씨도 맥락에 맞게 읽어낸다. 보관 과정에서 구겨졌거나 일부 훼손된 종이 문서도 이 같은 과정을 통해 디지털 문서로 변환할 수 있다는 설명이다. 올해 기준 KANDA의 문자 인식 정확도는 99.34%다.악어디지털의 KANDA는 한글 필기체 문자 약 600만 자, 일본어 필기체 문자 약 120만 자를 학습했다. 기존 데이터를 이용해 스스로 필체를 생성해 내용을 습득하기도 한다. 이를 기반으로 문서를 하루 최대 100만 장 처리할 수 있다.작년 악어디지털이 디지털 문서로 변환한 종이 문서는 1억2000만 장에 달한다. 대통령기록관, 국회도서관, 삼성바이오로직스, 현대자동차 등 각 분야에 고객사 300여 곳을 두고 있다.‘전자 문서 및 전자거래 기본법 개정안&rsquo
2021.10.05
기업·기관이나 연구소, 병원 등엔 종이 문서 자료가 많다. 하지만 책장이나 캐비넷에서 빼곡히 자리를 차지하고 있는 종이 문서를 정리하기는 쉽지 않다. 수기 내용을 일일이 컴퓨터에 입력하려면 매우 많은 시간과 노동력이 들기 때문이다. 악어디지털은 인공지능(AI)을 활용해 이같은 문제를 해결해주는 스타트업이다. 각종 종이 문서를 디지털 문서로 바꿔준다. 단순히 서류를 스캔해 이미지 파일로 만드는게 아니다. 문장이나 단어를 검색·열람할 수 있도록 텍스트로 변환한다. “자체 AI 엔진, 문자 인식률 99%” 악어디지털의 핵심 기술은 자체 개발한 AI OCR(광학문자판독) 엔진 ‘KANDA’다. 각종 수기 데이터를 AI에 학습시켜 AI가 문자를 인식·추론하게 했다. 인식률이 낮은 데이터는 사람이 교정해주는 학습과정을 반복해 정확도를 높였다. 올해 기준 KANDA의 문자 인식 정확도는 99.34%다. KANDA는 문자를 인식하고, 인식한 정보를 일상 언어(자연어) 맥락에 맞게 교정하는 등 두 단계를 거치는 게 특징이다. 이를 통해 ㅎ을 ㄹ처럼 흘려 쓴 글씨나 ㅁ을 ㅇ과 비슷하게 휘갈겨 쓴 글씨도 맥락에
2021.09.09