"아마존·엔비디아 이겼다"…국제 AI 경진대회 석권한 토종 기업
입력
수정
인공지능(AI) 스타트업 업스테이지가 글로벌 AI 경진대회 ‘ICDAR 로버스트 리딩 컴페티션’에서 4개 부문을 석권했다고 24일 밝혔다. 아마존, 엔비디아 등 글로벌 IT보다 앞선 성적이다.
업스테이지는 21일 국제패턴인식협회인 ‘IAPR’이 시작한 국제 경진 대회인 ‘ICDAR 로버스트 리딩 컴페티션’ 'HierText-1/2', 'VQAonBD', 'IHTR' 등 4종목에서 모두 1위를 기록했다. ‘ICDAR 로버스트 리딩 컴페티션’은 디지털 이미지와 비디오 상에서 텍스트를 감지·인식하는 기술인 'Robust Reading' 분야에서 가장 권위있는 국제경진대회다. ICDAR는 'International Conference on Document Analysis and Recognition’의 약자로 1991년을 시작으로 매년 열리는 국제 학회다. 문서 분석 및 인식 분야에서 활동하는 글로벌 기업 및 연구자와 전문가들이 참여한다,
OCR(Optical Character Recognition)은 크게 이미지에서 문자의 위치를 찾는 ‘검출 기술’과 문자가 무엇인지 알아내는 ‘인식 기술’로 나뉜다. 업스테이지는 문자 검출 기술과 인식기술 모두에서 아마존, 엔비디아, 알리바바, 화웨이 등 글로벌 빅테크 기업들과의 경쟁에서 가장 높은 점수를 기록했다.
업스테이지가 1위의 결과를 받은 IHTR 종목은 인도에서 쓰이는 대표 10종의 언어에 대한 글자 인식 문제를 다뤘다. 업스테이지는 글자 인식 기술을 활용하여 대회에 참가해 이전에 경험이 없던 언어지만 최고 성능의 모델을 구축한 성과를 보였다. 단순 OCR기술만으로 좋은 평가를 받을 수 없는 'VQAonBD' 종목에서도 업스테이지는 2위와 큰 점수 차이로 글로벌 톱의 성적을 거뒀다. VQAonBD는 문서 이미지를 주고 이미지 내 데이터의 답을 얻는 과제를 수행하는 종목이다. 예를 들면 계산이 복잡한 세금문서를 준 후 "2019년의 세금 합계가 뭐야?"와 같은 질문에 대해 정확한 답변을 추출하는 것뿐만 아니라 그 값을 이용, 비율, 평균, 최소 최대 값 등을 구하는 연산 작업까지 수행하는 문제도 제시됐다.
이번에 입상한 업스테이지 팀은 국내 유일의 캐글대회 두 자릿 수 금메달을 따낸 업스테이지 챌린지스 팀과 OCR팀이 의기투합해 구성했다. 21년과 22년 연속으로 캐글 대회에서 세계 1위와 2위를 기록하며 국내 최연소 그랜드마스터에 이름을 올린 김윤수 엔지니어를 포함해 두 명의 그랜드마스터와 한 명의 마스터를 보유한 챌린지스 팀의 역량과 현업에서 실제 다양한 기업의 OCR 과제를 수행하고 있다.
김성훈 업스테이지 대표는 "세계최고의 기술력이 검증된 업스테이지의 AI OCR로 문서 자동화가 필요한 전 산업의 디지털 전환과 AI 글로벌 혁신을 도울 것"이라고 전했다.
김주완 기자 kjwan@hankyung.com
업스테이지는 21일 국제패턴인식협회인 ‘IAPR’이 시작한 국제 경진 대회인 ‘ICDAR 로버스트 리딩 컴페티션’ 'HierText-1/2', 'VQAonBD', 'IHTR' 등 4종목에서 모두 1위를 기록했다. ‘ICDAR 로버스트 리딩 컴페티션’은 디지털 이미지와 비디오 상에서 텍스트를 감지·인식하는 기술인 'Robust Reading' 분야에서 가장 권위있는 국제경진대회다. ICDAR는 'International Conference on Document Analysis and Recognition’의 약자로 1991년을 시작으로 매년 열리는 국제 학회다. 문서 분석 및 인식 분야에서 활동하는 글로벌 기업 및 연구자와 전문가들이 참여한다,
OCR(Optical Character Recognition)은 크게 이미지에서 문자의 위치를 찾는 ‘검출 기술’과 문자가 무엇인지 알아내는 ‘인식 기술’로 나뉜다. 업스테이지는 문자 검출 기술과 인식기술 모두에서 아마존, 엔비디아, 알리바바, 화웨이 등 글로벌 빅테크 기업들과의 경쟁에서 가장 높은 점수를 기록했다.
업스테이지가 1위의 결과를 받은 IHTR 종목은 인도에서 쓰이는 대표 10종의 언어에 대한 글자 인식 문제를 다뤘다. 업스테이지는 글자 인식 기술을 활용하여 대회에 참가해 이전에 경험이 없던 언어지만 최고 성능의 모델을 구축한 성과를 보였다. 단순 OCR기술만으로 좋은 평가를 받을 수 없는 'VQAonBD' 종목에서도 업스테이지는 2위와 큰 점수 차이로 글로벌 톱의 성적을 거뒀다. VQAonBD는 문서 이미지를 주고 이미지 내 데이터의 답을 얻는 과제를 수행하는 종목이다. 예를 들면 계산이 복잡한 세금문서를 준 후 "2019년의 세금 합계가 뭐야?"와 같은 질문에 대해 정확한 답변을 추출하는 것뿐만 아니라 그 값을 이용, 비율, 평균, 최소 최대 값 등을 구하는 연산 작업까지 수행하는 문제도 제시됐다.
이번에 입상한 업스테이지 팀은 국내 유일의 캐글대회 두 자릿 수 금메달을 따낸 업스테이지 챌린지스 팀과 OCR팀이 의기투합해 구성했다. 21년과 22년 연속으로 캐글 대회에서 세계 1위와 2위를 기록하며 국내 최연소 그랜드마스터에 이름을 올린 김윤수 엔지니어를 포함해 두 명의 그랜드마스터와 한 명의 마스터를 보유한 챌린지스 팀의 역량과 현업에서 실제 다양한 기업의 OCR 과제를 수행하고 있다.
김성훈 업스테이지 대표는 "세계최고의 기술력이 검증된 업스테이지의 AI OCR로 문서 자동화가 필요한 전 산업의 디지털 전환과 AI 글로벌 혁신을 도울 것"이라고 전했다.
김주완 기자 kjwan@hankyung.com