업스테이지, 'ICML 2023-DMLR'에서 국내 기업 최다 논문 채택

인공지능(AI) 스타트업 업스테이지가 'Data-Centric' AI 분야에서 가장 권위 있는 워크숍인 'Data-centric Machine Learning Research (DMLR) Workshop'에 7편의 논문을 발표해 국내기업 최다 연구 성과를 달성했다고 22일 밝혔다.

글로벌 머신러닝 학회(ICML 2023-DMLR)는 머신러닝의 이론과 실제를 다루는 최고 수준의 학술 행사로 매년 약 7만 명 이상이 참가하는 국제 학회다. 논문 채택률 20%, 임팩트 팩터 6.99를 가진 가장 영향력 있는 인공지능학회이기도 하다. 업스테이지 데이터팀이 연구성과를 발표한 DMLR은 ICML 2023 중 데이터 중심 머신러닝 연구(Data-centric Machine Learning Research)에 관한 워크숍이다. 세계적 석학이자 'Data-Centric AI'를 만든 스탠포드 대학교 앤드류 응 교수가 참여해 해당 분야에 탄생을 알린 'NeurIPS 2021- Data Centric AI' 워크숍의 후속 워크이다.

업스테이지는 기업에서 인공지능 학습 데이터를 효과적으로 구축할 수 있는 프로세스를 제안한 'DMOps: Data Management Operations and Recipes'와 데이터 구축시 효과적인 비용관리와 효율적인 구축을 가능케하는 'Inter-Annotator Agreement in the Wild: Uncovering Its Emerging Roles and Considerations in Real-World Scenarios'를 포함 총 7편의 연구 성과를 워크숍에서 발표한다.

이번 연구성과 중 4편의 논문은 자연언어처리 분야 세계적 석학인 고려대학교 임희석 교수 연구팀과 공동연구를 진행했다. 업스테이지와 고려대학교는 공동 연구를 통해 데이터 중심 기계번역, 데이터 중심 상식 추론 연구와 더불어 합성 데이터의 부정적인 효과에 대한 분석 논문을 포함해 음성인식 후처리기 분야의 새로운 방법론 'Explainable Error Benchmark'를 제안하는 등 다양한 성과를 이뤄냈다.김성훈 업스테이지 대표는 “이번 ICML 2023- DMLR에서 글로벌 톱 수준의 연구 성과를 낼 수 있어 무척 기쁘다” 며 “업스테이지는 AI 서비스뿐만 아니라 아낌없는 R&D 투자로 모두가 최고 성능의 AI를 더 편리하게 이용하실 수 있도록 최선을 다하겠다”고 밝혔다.

김주완 기자 kjwan@hankyung.com

핫이슈