업스테이지, 챗GPT 넘어 세계 최고 수준 AI 모델 개발

인공지능(AI) 스타트업 업스테이지가 개발한 생성형 AI 모델의 성능이 오픈AI의 챗GPT(GPT-3.5)를 앞선 것으로 나타났다.

업스테이지가 메타의 최신 초거대언어모델(LLM) 라마2로 개발한 AI 모델이 세계 최대 머신러닝 플랫폼 허깅페이스의 ‘오픈 LLM 리더보드’ 평가에서 72.3점을 획득하며 1위에 올랐다고 1일 밝혔다. 이는 같은 평가 방식에서 오픈AI의 챗GPT GPT-3.5 버전의 성능(71.9)을 뛰어넘는 결과다.허깅페이스 오픈 LLM 리더보드는 오픈소스 생성형 AI 모델의 성능 평가 지표로 꼽힌다. 전 세계 500여개의 오픈 모델들이 추론과 상식 능력, 언어 이해 종합능력 및 환각현상(할루시네이션) 방지 등 네 가지 지표의 평균 점수로 성능을 평가한다.

앞서 업스테이지는 지난달 허깅페이스를 통해 공개한 다른 AI모델이 평균 67점을 획득해 메타의 라마2(70B 모델)을 추월하고 국내 LLM 최초로 1위에 올랐다.

업스테이지는 더 많은 데이터로 최신 라마2 기반으로 만든 모델을 최근 내놓으며 글로벌 1위를 유지했다. 새로 공개한 업스테이지 AI 모델은 미국 스테빌리티AI의 ‘스테이블 벨루가2’ 모델(71.4점)도 넘어섰다. 업스테이지는 AI 올림픽으로 불리는 ‘캐글(Kaggle)’ 경진대회와 국제 학회 논문상 등을 차지한 인력을 투입해 두 달여 만에 GPT-3.5를 상회하는 모델을 개발했다. 최초의 한국어 자연어이해(NLU) 평가 데이터셋 ‘클루(KLUE)’를 구축했고 OCR 세계대회인 ICDAR에서 4개종목 우승도 차지했다.130만명의 이용자를 확보한 AI 챗봇 서비스 ‘AskUp’ 운영한다.

업스테이지는 자사의 AI 모델 상용화로 ‘프라이빗AI’ 시장에 본격 진출할 계획이다. 프라이빗AI는 기업 내부 데이터만 학습해 정보 유출을 막고 잘못된 정보를 생성하는 환각 현상을 방지하는데 특화된 솔루션이다. 보안 이슈 등으로 생성 AI 도입을 주저하는 기업이 선호하는 방식이다.

김성훈 업스테이지 대표는 “업스테이지의 생성 AI 모델이 챗GPT를 능가하는 성능으로 세계 최고 수준의 기술력을 확인하게 되어 기쁘다”며 “앞으로 업스테이지는 압도적인 기술력을 바탕으로 국내외 프라이빗AI 시장 지배력 강화에 박차를 가할 것”이라고 말했다.

김주완 기자 kjwan@hankyung.com

핫이슈