과학기술 관련 빅데이터 분석에 특화된 경량화대규모언어모델(sLLM)이 나왔다.

한국과학기술정보연구원(KISTI)은 과학기술 특화 sLLM 고니(KONI)를 개발했다고 31일 밝혔다.

메타(옛 페이스북)의 오픈소스 LLM 라마3를 기반으로 개발된 고니는 사전학습 모델, 챗 모델 두 가지 버전으로 공개됐다. 작년 말 선보인 시제품보다 추론, 글쓰기, 이해 등 다양한 작업에서 성능이 높아졌다. KISTI 관계자는 “한국어 LLM에 대한 종합적 사고력을 측정하는 벤치마크 리더보드 ‘로직Kor’에서 동일 크기 LLM 중 1위를 차지했다”고 설명했다.

고니는 검색증강생성(RAG) 기술을 활용해 환각(할루시네이션) 현상을 최소화했다. 환각은 거짓을 참인 것처럼 둘러대는 치명적인 AI 오류를 말한다. RAG는 AI가 답변을 하기 전 외부 데이터베이스(DB)를 통해 스스로 재검토 과정을 거치도록 하는 기술이다.

김재수 KISTI 원장은 “고니로 과학기술 정보 유통과 분석 체계를 혁신하고 연구자의 과학적 발견을 지원할 수 있는 AI에이전트 시스템을 구축하겠다”고 말했다.

이해성 기자 ihs@hankyung.com