문서 AI와 Solar LLM을 통한 산업 혁신 : 업스테이지 [긱스]
-
기사 스크랩
-
공유
-
댓글
-
클린뷰
-
프린트
[한경 글로벌 AI스타트업 사례연구⑪]
문서 및 언어 AI 스타트업 ‘업스테이지’
전성민 가천대 경영학부 교수
문서 및 언어 AI 스타트업 ‘업스테이지’
전성민 가천대 경영학부 교수
업스테이지 김성훈 창업자는 홍콩과학기술대학교 교수이자 네이버의 클로바 AI 프로젝트를 이끈 경력을 가지고 있는 AI 분야의 유명인사이다. 그는 인터넷 초기부터 주목받았는데 1996년 웹 크롤러를 이용한 검색 엔진 까치네를 개발하고, (주)나라비전을 공동 설립하여 이메일 서비스인 깨비메일을 개발했다. 교수로 재직할 때에도 글로벌 소프트웨어 학회에서도 많은 상을 받았고 네이버에서 일하는 동안에도 비전 및 문자인식, 음성인식 및 합성, 자연어 처리 등 다양한 AI 프로젝트를 이끌었다.
2020년 10월, 그는 “Making AI Beneficial”이라는 비전을 가지고 더 많은 기업과 사람들이 AI를 쉽게 활용할 수 있는 환경을 제공하고자 업스테이지를 설립했다. 초기부터 업스테이지는 네이버에서 AI를 연구하던 뛰어난 인재들이 모인 팀으로 주목받아, “AI 업계의 어벤저스”라는 별명을 얻을 정도였다. 김성훈 대표(CEO), 이활석 박사(CTO), 박은정 박사(CPO)가 주도하였으며, 이들은 모두 네이버 클로바 AI 조직의 핵심 멤버였다. 김성훈 대표는 “성 킴(Sung Kim)”이란 이름으로 전 세계적인 AI 대가들과도 잘 연결되어 있다. 글로벌 4대 AI 석학으로 불리는 딥러닝의 선구자 앤드류 응 미국 스탠퍼드대 교수도 업스테이지와 함께 온라인 교육 플랫폼 '딥러닝AI'를 통해 LLM 개발 강좌를 무료로 선보이기도 했다.
이활석 CTO는 공개 강연을 통해 교육 사업과 AI 생태계 확장에 대한 계획을 언급한 적이 있다. 그는 구체적으로 현업에서의 실무 경험을 반영한 교육 콘텐츠를 개발하여 여러 기업에 납품하고 있으며, 이를 통해 AI 기술의 발전에 기여하고자 하는 의지를 나타냈다. 한국 기반의 LLM 평가 리더보드를 개설하고 데이터 파트너십을 강화함으로써 생태계 확장에 힘쓰고 있으며, 앞으로 문서 이미지를 구조화하고 AI 솔루션을 통합한 시장을 개척하겠다고 강조했다. 맥킨지 출신의 권순일 부사장 또한 창업 초기에 참여하여 B2B AI 솔루션 사업과 글로벌 확장 전략을 주도하고 있다. 업스테이지는 한국을 기반으로 다양한 산업에서 AI 솔루션을 제공하며, 일본과 미국에도 지사를 설립하여 글로벌 비즈니스를 본격화하고 있다.
업스테이지는 100% 원격근무제를 도입하여 직원들이 전 세계 어디에서든 자유롭게 근무할 수 있는 환경을 제공한다. 140여 명의 임직원 모두가 제각각 서울, 제주, 울산, 미국 등 다양한 지역에서 근무하고 있으며, 본사는 연구소로 활용될 뿐 고정적으로 출근하는 직원은 없다. 이를 통해 업무 효율성을 높이고, 입사자에게는 개인 업무환경 구축을 위해 입사 시 500만원을 지원하는 등 근무 환경을 최적화하기 위한 제도를 시행하고 있다.
업스테이지는 인공지능(AI) 기술을 기업에 도입하기 위한 컨설팅과 솔루션을 제공하는 스타트업으로, 전체 임직원의 70%가 연구개발 인력으로 구성되어 있다. 이들은출 퇴근 시간이 자유롭고, 원격근무를 통해 유연한 근무 환경을 보장하고 있다. 또한, 업무 효율을 높이기 위해 업무 관련 소프트웨어, 자료, 교육수강비 등을 무제한 지원하고 있으며, 정기적인 비대면 티타임과 회식을 통해 임직원 간의 유대감도 지속적으로 강화하고 있다.
문서 처리기술(DocAI)
업스테이지는 보험사 프로젝트를 통해 금융 특화 AI 솔루션인 '도큐먼트 AI(Document AI)을 삼성생명에 공급했다. 이 솔루션은 문서 자동화를 통해 보험 청구 및 처리 과정을 크게 개선하였는데, 특히 진료비 영수증 등 다양한 보험 서류의 자동 처리를 지원했다. 구체적으로 업스테이지의 문서 처리 기술은 기업들이 문서 속 데이터를 효율적으로 추출하고 활용할 수 있도록 한다. 이 기술은 고성능 OCR(광학 문자 인식), 문서 구조 이해, 주요 정보 추출 등의 기능을 제공합니다. 예를 들어, 표, 그래프, 텍스트를 자동으로 분석하고, 이를 기반으로 데이터를 직렬화하여 CSV 또는 JSON과 같은 형식으로 저장한다. 이 기술은 특히 금융, 법률, 의료 등 문서 기반의 작업이 많은 산업에서 유용한데, 예를 들어, 보험사는 고객의 서류를 디지털화하고 자동으로 분류하여 처리 속도를 높일 수 있으며, 법률 사무소는 계약서 내 핵심 조항을 추출해 검토 과정을 단축할 수 있다. 아래 그림에서 볼 수 있듯이 업스테이지의 문서 속 데이터 추출 성공률은 글로벌 빅테크 기업들의 솔루션들보다도 훨씬 높은 수준이다. 대규모 언어모델(LLM)-SOLAR
SOLAR는 업스테이지가 개발한 대규모 언어 모델(LLM)이다. 107억 개의 파라미터로 구성된 ‘솔라 미니’와, 220억 개의 파라미터로 구성된 ‘솔라 프로’ 등 2종류로 구성된다. 이 모델은 허깅페이스 오픈 LLM 리더보드에서 1위를 기록하며, 세계적인 성능을 인정받았다. SOLAR는 데이터의 품질과 최적화된 학습 알고리즘을 기반으로, 더 작은 규모의 모델로도 뛰어난 성능을 발휘할 수 있다는 것을 보여주었다. SOLAR는 헬스케어, 금융, 법률 등 특정 산업에 맞는 맞춤형 AI 솔루션을 제공하며, 의료 분야에서는 환자 기록 분석 및 요약, 금융 분야에서는 재무 보고서 작성 및 투자 분석, 법률 분야에서는 계약서 검토 및 법적 문서 요약에 사용된다. SOLAR의 장점은 데이터를 로컬 환경에서 처리하도록 설계되어 회사 내의 데이터 보안을 강화하고, AI 언어모델의 가장 큰 이슈인 AI 환각(할루시네이션, hallucination) 문제에 대응할 수 있다. 할루시네이션은 AI가 정확하지 않거나 사실이 아닌 조작된 정보를 생성하는 것을 의미하는데, 내부 데이터를 활용하여 이 문제를 완화시키는 것이다. 최근 업스테이지가 발표한 논문에 따르면 선호 데이터셋을 적용하는 단계적 직접 선호 최적화(sDPO)라는 방법을 적용하고 있다. 이 방식은 기존의 직접 선호 최적화(DPO) 기술을 초월하는 성과를 보이고 있다. sDPO는 직접 선호 최적화(DPO)의 확장된 모델로, 선호 데이터셋의 하위 집합을 단계적으로 사용하며, 이전 단계에서 훈련된 정렬 모델이 현재 단계의 참조 모델로 사용된다. 출처: Kim, D., Kim, Y., Song, W., Kim, H., Kim, Y., Kim, S., & Park, C. (2024). sDPO: Don't Use Your Data All at Once. arXiv preprint arXiv:2403.19270.
업스테이지가 이 솔루션을 만든 이유는 명확하다. 첫째, AI 도입의 문턱을 낮추어 더 많은 기업이 혁신에 동참할 수 있도록 하기 위함이다. 전통적으로 AI는 고도의 전문성과 막대한 비용이 필요한 영역이었다. 업스테이지는 이러한 제약을 줄이고, AI 기술을 실질적으로 활용 가능한 형태로 만들어 중소기업과 다양한 산업에서 접근성을 확대하고자 했다. 둘째, 데이터의 보안과 정확성을 강화하기 위한 방안인 것이다. 업스테이지의 기술은 데이터를 로컬에서 처리하거나, 사용자 맞춤형 학습을 통해 AI 환각 및 정보 누락 문제를 해결하려는 목적을 가지고 있다. 이를 통해 고객은 AI를 신뢰하며 사용할 수 있는 환경을 제공받게 됩니다. 셋째, 국내 AI 기술의 글로벌 경쟁력을 입증하기 위해서이다. SOLAR 모델의 성능은 메타, 구글, 오픈AI 등 글로벌 기업의 모델과 견줄 만큼 뛰어난 것으로 평가받고 있으며, 이는 업스테이지가 한국을 넘어 세계 시장에서 인정받는 기반이 되고 있다.
글로벌 비즈니스 확장
업스테이즈는 이런 기술력을 기반으로 일본 및 아시아 비핵심 언어권으로의 글로벌 확장을 추진 중이다. 초기에는 SI(시스템 통합) 방식으로 시작하였으나, 현재는 패키지화하여 확장성을 확보하고 있다. 미국에서는 김성훈 대표와 박은정 CPO가 현지에서 사업을 주도하고 있다. "김치 디스카운트" 해소를 위해 주로 업스테이지 브랜드도 알리고 현지 파트너사와 협업을 통해 시장을 확장하고 데에 노력을 기울이고 있다. 향후 일본 등 다른 국가에도 지사를 설립하고 현지 인력 채용을 통해 사업을 확대할 계획도 가지고 있으며, 태국에서는 KT와 협력하여 태국 IT 기업 자스민 그룹과 태국어 모델을 개발하는 등의 성과를 내고 있다. 그러나 기술 솔루션화의 어려움, 글로벌 시장에서의 신뢰 구축, 규제와 정책 문제 등의 도전 과제가 여전히 존재한다. 네이버 팀에서 출발한 업스테이지가 글로벌 비즈니스를 만들어내는 큰 성공을 이루기를 기원해 본다.
전성민 가천대 경영학부 교수
[한경 공동기획 글로벌 AI스타트업 사례연구]
0. 오프닝
1. 마키나락스
2. Claythis
3. 네이션A
4. 플립션
5. 환경 분야
6. 라이너
7. 핏스탑커넥트
8. 올거나이즈
9. 트웰브랩스
10. 슈퍼브에이아이
11. 업스테이지
2020년 10월, 그는 “Making AI Beneficial”이라는 비전을 가지고 더 많은 기업과 사람들이 AI를 쉽게 활용할 수 있는 환경을 제공하고자 업스테이지를 설립했다. 초기부터 업스테이지는 네이버에서 AI를 연구하던 뛰어난 인재들이 모인 팀으로 주목받아, “AI 업계의 어벤저스”라는 별명을 얻을 정도였다. 김성훈 대표(CEO), 이활석 박사(CTO), 박은정 박사(CPO)가 주도하였으며, 이들은 모두 네이버 클로바 AI 조직의 핵심 멤버였다. 김성훈 대표는 “성 킴(Sung Kim)”이란 이름으로 전 세계적인 AI 대가들과도 잘 연결되어 있다. 글로벌 4대 AI 석학으로 불리는 딥러닝의 선구자 앤드류 응 미국 스탠퍼드대 교수도 업스테이지와 함께 온라인 교육 플랫폼 '딥러닝AI'를 통해 LLM 개발 강좌를 무료로 선보이기도 했다.
이활석 CTO는 공개 강연을 통해 교육 사업과 AI 생태계 확장에 대한 계획을 언급한 적이 있다. 그는 구체적으로 현업에서의 실무 경험을 반영한 교육 콘텐츠를 개발하여 여러 기업에 납품하고 있으며, 이를 통해 AI 기술의 발전에 기여하고자 하는 의지를 나타냈다. 한국 기반의 LLM 평가 리더보드를 개설하고 데이터 파트너십을 강화함으로써 생태계 확장에 힘쓰고 있으며, 앞으로 문서 이미지를 구조화하고 AI 솔루션을 통합한 시장을 개척하겠다고 강조했다. 맥킨지 출신의 권순일 부사장 또한 창업 초기에 참여하여 B2B AI 솔루션 사업과 글로벌 확장 전략을 주도하고 있다. 업스테이지는 한국을 기반으로 다양한 산업에서 AI 솔루션을 제공하며, 일본과 미국에도 지사를 설립하여 글로벌 비즈니스를 본격화하고 있다.
업스테이지는 100% 원격근무제를 도입하여 직원들이 전 세계 어디에서든 자유롭게 근무할 수 있는 환경을 제공한다. 140여 명의 임직원 모두가 제각각 서울, 제주, 울산, 미국 등 다양한 지역에서 근무하고 있으며, 본사는 연구소로 활용될 뿐 고정적으로 출근하는 직원은 없다. 이를 통해 업무 효율성을 높이고, 입사자에게는 개인 업무환경 구축을 위해 입사 시 500만원을 지원하는 등 근무 환경을 최적화하기 위한 제도를 시행하고 있다.
업스테이지는 인공지능(AI) 기술을 기업에 도입하기 위한 컨설팅과 솔루션을 제공하는 스타트업으로, 전체 임직원의 70%가 연구개발 인력으로 구성되어 있다. 이들은출 퇴근 시간이 자유롭고, 원격근무를 통해 유연한 근무 환경을 보장하고 있다. 또한, 업무 효율을 높이기 위해 업무 관련 소프트웨어, 자료, 교육수강비 등을 무제한 지원하고 있으며, 정기적인 비대면 티타임과 회식을 통해 임직원 간의 유대감도 지속적으로 강화하고 있다.
문서 처리기술(DocAI)
업스테이지는 보험사 프로젝트를 통해 금융 특화 AI 솔루션인 '도큐먼트 AI(Document AI)을 삼성생명에 공급했다. 이 솔루션은 문서 자동화를 통해 보험 청구 및 처리 과정을 크게 개선하였는데, 특히 진료비 영수증 등 다양한 보험 서류의 자동 처리를 지원했다. 구체적으로 업스테이지의 문서 처리 기술은 기업들이 문서 속 데이터를 효율적으로 추출하고 활용할 수 있도록 한다. 이 기술은 고성능 OCR(광학 문자 인식), 문서 구조 이해, 주요 정보 추출 등의 기능을 제공합니다. 예를 들어, 표, 그래프, 텍스트를 자동으로 분석하고, 이를 기반으로 데이터를 직렬화하여 CSV 또는 JSON과 같은 형식으로 저장한다. 이 기술은 특히 금융, 법률, 의료 등 문서 기반의 작업이 많은 산업에서 유용한데, 예를 들어, 보험사는 고객의 서류를 디지털화하고 자동으로 분류하여 처리 속도를 높일 수 있으며, 법률 사무소는 계약서 내 핵심 조항을 추출해 검토 과정을 단축할 수 있다. 아래 그림에서 볼 수 있듯이 업스테이지의 문서 속 데이터 추출 성공률은 글로벌 빅테크 기업들의 솔루션들보다도 훨씬 높은 수준이다. 대규모 언어모델(LLM)-SOLAR
SOLAR는 업스테이지가 개발한 대규모 언어 모델(LLM)이다. 107억 개의 파라미터로 구성된 ‘솔라 미니’와, 220억 개의 파라미터로 구성된 ‘솔라 프로’ 등 2종류로 구성된다. 이 모델은 허깅페이스 오픈 LLM 리더보드에서 1위를 기록하며, 세계적인 성능을 인정받았다. SOLAR는 데이터의 품질과 최적화된 학습 알고리즘을 기반으로, 더 작은 규모의 모델로도 뛰어난 성능을 발휘할 수 있다는 것을 보여주었다. SOLAR는 헬스케어, 금융, 법률 등 특정 산업에 맞는 맞춤형 AI 솔루션을 제공하며, 의료 분야에서는 환자 기록 분석 및 요약, 금융 분야에서는 재무 보고서 작성 및 투자 분석, 법률 분야에서는 계약서 검토 및 법적 문서 요약에 사용된다. SOLAR의 장점은 데이터를 로컬 환경에서 처리하도록 설계되어 회사 내의 데이터 보안을 강화하고, AI 언어모델의 가장 큰 이슈인 AI 환각(할루시네이션, hallucination) 문제에 대응할 수 있다. 할루시네이션은 AI가 정확하지 않거나 사실이 아닌 조작된 정보를 생성하는 것을 의미하는데, 내부 데이터를 활용하여 이 문제를 완화시키는 것이다. 최근 업스테이지가 발표한 논문에 따르면 선호 데이터셋을 적용하는 단계적 직접 선호 최적화(sDPO)라는 방법을 적용하고 있다. 이 방식은 기존의 직접 선호 최적화(DPO) 기술을 초월하는 성과를 보이고 있다. sDPO는 직접 선호 최적화(DPO)의 확장된 모델로, 선호 데이터셋의 하위 집합을 단계적으로 사용하며, 이전 단계에서 훈련된 정렬 모델이 현재 단계의 참조 모델로 사용된다. 출처: Kim, D., Kim, Y., Song, W., Kim, H., Kim, Y., Kim, S., & Park, C. (2024). sDPO: Don't Use Your Data All at Once. arXiv preprint arXiv:2403.19270.
업스테이지가 이 솔루션을 만든 이유는 명확하다. 첫째, AI 도입의 문턱을 낮추어 더 많은 기업이 혁신에 동참할 수 있도록 하기 위함이다. 전통적으로 AI는 고도의 전문성과 막대한 비용이 필요한 영역이었다. 업스테이지는 이러한 제약을 줄이고, AI 기술을 실질적으로 활용 가능한 형태로 만들어 중소기업과 다양한 산업에서 접근성을 확대하고자 했다. 둘째, 데이터의 보안과 정확성을 강화하기 위한 방안인 것이다. 업스테이지의 기술은 데이터를 로컬에서 처리하거나, 사용자 맞춤형 학습을 통해 AI 환각 및 정보 누락 문제를 해결하려는 목적을 가지고 있다. 이를 통해 고객은 AI를 신뢰하며 사용할 수 있는 환경을 제공받게 됩니다. 셋째, 국내 AI 기술의 글로벌 경쟁력을 입증하기 위해서이다. SOLAR 모델의 성능은 메타, 구글, 오픈AI 등 글로벌 기업의 모델과 견줄 만큼 뛰어난 것으로 평가받고 있으며, 이는 업스테이지가 한국을 넘어 세계 시장에서 인정받는 기반이 되고 있다.
글로벌 비즈니스 확장
업스테이즈는 이런 기술력을 기반으로 일본 및 아시아 비핵심 언어권으로의 글로벌 확장을 추진 중이다. 초기에는 SI(시스템 통합) 방식으로 시작하였으나, 현재는 패키지화하여 확장성을 확보하고 있다. 미국에서는 김성훈 대표와 박은정 CPO가 현지에서 사업을 주도하고 있다. "김치 디스카운트" 해소를 위해 주로 업스테이지 브랜드도 알리고 현지 파트너사와 협업을 통해 시장을 확장하고 데에 노력을 기울이고 있다. 향후 일본 등 다른 국가에도 지사를 설립하고 현지 인력 채용을 통해 사업을 확대할 계획도 가지고 있으며, 태국에서는 KT와 협력하여 태국 IT 기업 자스민 그룹과 태국어 모델을 개발하는 등의 성과를 내고 있다. 그러나 기술 솔루션화의 어려움, 글로벌 시장에서의 신뢰 구축, 규제와 정책 문제 등의 도전 과제가 여전히 존재한다. 네이버 팀에서 출발한 업스테이지가 글로벌 비즈니스를 만들어내는 큰 성공을 이루기를 기원해 본다.
전성민 가천대 경영학부 교수
[한경 공동기획 글로벌 AI스타트업 사례연구]
0. 오프닝
1. 마키나락스
2. Claythis
3. 네이션A
4. 플립션
5. 환경 분야
6. 라이너
7. 핏스탑커넥트
8. 올거나이즈
9. 트웰브랩스
10. 슈퍼브에이아이
11. 업스테이지