대규모 언어 모델 '솔라' 개발…맞춤형 AI 솔루션 제공해 산업 혁신
-
기사 스크랩
-
공유
-
댓글
-
클린뷰
-
프린트
[한경 글로벌 AI스타트업 사례연구 (11)] 업스테이지
전성민 가천대 경영학부 교수
전성민 가천대 경영학부 교수
업스테이지 김성훈 창업자는 홍콩과학기술대 교수이자 네이버의 클로바 인공지능(AI) 프로젝트를 이끈 경력을 가진 AI 분야의 유명인사다. 그는 인터넷 초기부터 주목받았다. 1996년 웹 크롤러를 이용한 검색 엔진 까치네를 개발하고, 나라비전을 공동 설립해 이메일 서비스인 깨비메일을 개발했다. 2020년 10월, 그는 더 많은 기업과 사람들이 AI를 쉽게 활용할 수 있는 환경을 제공하고자 업스테이지를 설립했다. 네이버에서 AI를 연구하던 뛰어난 인재들이 모인 팀으로 ‘AI 업계의 어벤저스’라는 별명을 얻을 정도였다.
솔라(SOLAR)는 업스테이지가 개발한 대규모 언어 모델(LLM)이다. 107억 개의 파라미터로 구성된 ‘솔라 미니’와, 220억 개의 파라미터로 구성된 ‘솔라 프로’ 등 2종류로 구성된다. 이 모델은 허깅페이스 오픈 LLM 리더보드에서 1위를 기록하며 세계적인 성능을 인정받았다. SOLAR는 헬스케어, 금융, 법률 등 특정 산업에 맞는 맞춤형 AI 솔루션을 제공한다. 의료 분야에서는 환자 기록 분석 및 요약, 금융 분야에서는 재무 보고서 작성 및 투자 분석, 법률 분야에서는 계약서 검토 및 법적 문서 요약에 사용된다.
솔라의 장점은 데이터를 로컬 환경에서 처리하도록 설계됐다는 점이다. 회사 내의 데이터 보안을 높이고, AI 언어모델의 가장 큰 이슈인 AI 환각 문제에 대응할 수 있다. 최근 업스테이지가 발표한 논문에 따르면 선호 데이터셋을 적용하는 ‘단계적 직접 선호 최적화’(sDPO)라는 방법을 적용하고 있다. 이 방식은 기존의 직접 선호 최적화(DPO) 기술을 초월하는 성과를 보이고 있다. sDPO는 직접 선호 최적화(DPO)의 확장된 모델로, 선호 데이터셋의 하위 집합을 단계적으로 사용하며 이전 단계에서 훈련된 정렬 모델이 현재 단계의 참조 모델로 사용된다.
업스테이지가 이 솔루션을 만든 이유는 여러가지다. 먼저 AI 도입의 문턱을 낮춰 더 많은 기업이 혁신에 동참할 수 있도록 하기 위해서다. 전통적으로 AI는 고도의 전문성과 막대한 비용이 필요한 영역이었다. 업스테이지는 이러한 제약을 줄이고 AI를 실제로 활용 가능한 형태로 만들어 다양한 산업에 확대할 계획이다. 데이터의 보안과 정확도를 높이기 위해서도 해당 솔루션이 필요하다. 국내 AI 기술의 글로벌 경쟁력도 과시하고 있다. 솔라 모델의 성능은 메타 구글 오픈AI 등의 모델과 견줄 만큼 뛰어난 것으로 평가받고 있다.
업스테이지는 이런 기술력을 기반으로 일본 및 아시아 비핵심 언어권으로의 글로벌 확장을 추진 중이다. 초기에는 SI(시스템 통합) 방식으로 시작했지만 현재는 패키지로 확장성을 확보했다. 일본 등에 지사를 설립하고 현지 인력 채용을 통해 사업을 확대할 방침이다. 태국에서는 KT와 협력해 태국 IT 기업 자스민그룹과 태국어 모델을 개발하고 있다.
전성민 가천대 경영학부 교수
솔라(SOLAR)는 업스테이지가 개발한 대규모 언어 모델(LLM)이다. 107억 개의 파라미터로 구성된 ‘솔라 미니’와, 220억 개의 파라미터로 구성된 ‘솔라 프로’ 등 2종류로 구성된다. 이 모델은 허깅페이스 오픈 LLM 리더보드에서 1위를 기록하며 세계적인 성능을 인정받았다. SOLAR는 헬스케어, 금융, 법률 등 특정 산업에 맞는 맞춤형 AI 솔루션을 제공한다. 의료 분야에서는 환자 기록 분석 및 요약, 금융 분야에서는 재무 보고서 작성 및 투자 분석, 법률 분야에서는 계약서 검토 및 법적 문서 요약에 사용된다.
솔라의 장점은 데이터를 로컬 환경에서 처리하도록 설계됐다는 점이다. 회사 내의 데이터 보안을 높이고, AI 언어모델의 가장 큰 이슈인 AI 환각 문제에 대응할 수 있다. 최근 업스테이지가 발표한 논문에 따르면 선호 데이터셋을 적용하는 ‘단계적 직접 선호 최적화’(sDPO)라는 방법을 적용하고 있다. 이 방식은 기존의 직접 선호 최적화(DPO) 기술을 초월하는 성과를 보이고 있다. sDPO는 직접 선호 최적화(DPO)의 확장된 모델로, 선호 데이터셋의 하위 집합을 단계적으로 사용하며 이전 단계에서 훈련된 정렬 모델이 현재 단계의 참조 모델로 사용된다.
업스테이지가 이 솔루션을 만든 이유는 여러가지다. 먼저 AI 도입의 문턱을 낮춰 더 많은 기업이 혁신에 동참할 수 있도록 하기 위해서다. 전통적으로 AI는 고도의 전문성과 막대한 비용이 필요한 영역이었다. 업스테이지는 이러한 제약을 줄이고 AI를 실제로 활용 가능한 형태로 만들어 다양한 산업에 확대할 계획이다. 데이터의 보안과 정확도를 높이기 위해서도 해당 솔루션이 필요하다. 국내 AI 기술의 글로벌 경쟁력도 과시하고 있다. 솔라 모델의 성능은 메타 구글 오픈AI 등의 모델과 견줄 만큼 뛰어난 것으로 평가받고 있다.
업스테이지는 이런 기술력을 기반으로 일본 및 아시아 비핵심 언어권으로의 글로벌 확장을 추진 중이다. 초기에는 SI(시스템 통합) 방식으로 시작했지만 현재는 패키지로 확장성을 확보했다. 일본 등에 지사를 설립하고 현지 인력 채용을 통해 사업을 확대할 방침이다. 태국에서는 KT와 협력해 태국 IT 기업 자스민그룹과 태국어 모델을 개발하고 있다.
전성민 가천대 경영학부 교수