29일(현지시간) 미국 라스베이거스에서 열린 'AWS 리인벤트 2023'에서  이황석 업스테이지 최고기술책임자(CTO)가 거대언어모델(LLM) 사업에 대해 설명하고 있다.  /라스베이거스=이주현 기자
29일(현지시간) 미국 라스베이거스에서 열린 'AWS 리인벤트 2023'에서 이황석 업스테이지 최고기술책임자(CTO)가 거대언어모델(LLM) 사업에 대해 설명하고 있다. /라스베이거스=이주현 기자
생성 인공지능(AI) 서비스 업체인 업스테이지가 의료·e커머스 시장을 공략하기 위해 소형 AI 기초모델(FM)을 올해 안에 내놓는다. 이 FM을 활용해 저비용으로 잦은 업데이트가 가능한 소형 거대언어모델(LLM)을 개별 기업 수요에 맞춰 공급하기로 했다. 해외 시장은 일본을 첫 공략지로 정했다.

몸집 줄인 FM으로 기업 특화 AI 제공"

29일(현지시간) 미국 라스베이거스에서 열린 콘퍼런스 행사 ‘AWS 리인벤트 2023’에서 기자들과 만난 이활석 업스테이지 최고기술책임자(CTO)는 “연내 파라미터 수가 각각 70억개, 107억개인 FM을 출시하겠다”고 밝혔다. 파라미터 수는 AI가 신경망에서 받아들일 수 있는 입력값의 범위를 가리킨다. 이 수가 클수록 더 많은 데이터를 활용한 추론이 가능하다. 범용으로 쓰이는 큰 LLM인 ‘챗GPT-4’는 파라미터 수가 1조개가 넘는 것으로 알려져 있다.

업스테이지가 내놓으려는 FM은 파라미터 수가 적은 편이다. 소형 FM은 처리할 수 있는 데이터의 양이 적지만 그만큼 구동 비용이 저렴하다. 잦은 업데이트를 하기에도 부담이 적다. 특정 분야에 국한해 쓴다면 소형 FM이 효율적일 수 있단 얘기다. 업스테이지는 지난 8월 세계 최대 AI 플랫폼인 허깅페이스에서 300억개 규모 LLM으로 챗GPT3.5보다 높은 성능 평가를 받기도 했다.

이 CTO는 “내년 1분기엔 파라미터 수가 300억개 규모인 산업별 FM도 선보이겠다”며 “아마존웹서비스(AWS)의 플랫폼인 아마존 세이지메이커 점프스타트에서 FM을 유통하겠다”고 말했다.

업스테이지가 소형 FM으로 공략하려는 시장은 의료와 e커머스, 그리고 앞서 밝혔던 수학교육 분야다. 이들 영역에서 개별 기업별로 특화한 생성 AI 수요가 클 뿐 아니라 양질의 데이터를 확보하기도 쉽다는 판단에서다. 이 CTO는 “FM 규모별로 산업별 LLM을 ‘솔라’라는 브랜드 아래 만들겠다”며 “이 LLM에 기업이 원하는 데이터들을 학습시켜 맞춤 제공할 것”이라고 말했다. 이어 “의료 LLM은 의학 논문을 학습시켜 의료진이 의사 결정에 참고할 수 있도록 했다”고 했다.

일본 산업 AI 시장도 '노크'

해외 시장에서도 개별 산업에 특화한 LLM을 내놓기로 했다. 이 CTO는 “일본 시장에 진출하기 위해 AI에 일본어 학습도 하고 있다”며 “일본은 시장 규모가 작지 않을 뿐 아니라 이미 업스테이지가 기업간거래(B2B) 사업을 했던 경험이 있는 시장”이라고 말했다. 이 업체는 동남아 시장에도 진출하고자 현지 산업 데이터를 분석하고 있는 단계다.

기존에 하던 검색·추천 상품 개발은 중단하기로 했다. LLM과 광학문자인식(OCR) 기술 개발에 힘을 쏟기 위해서다. OCR은 이미지 상의 문자를 인식하는 기술이여서 LLM 학습과 시너지를 낼 수 있다는 게 업스테이지의 판단이다. 이 CTO는 “내년이 소형 FM의 성패를 가르는 분수령이 될 것”이라며 “시장 경쟁이 치열해지고 있지만 이는 그만큼 이 산업의 시장성이 충분하단 얘기”라고 말했다.

중간 규모의 LLM 개발에선 KT와 협업하고 있다. 이 CTO는 “고객이 결과물로 만족할 수 있는 FM을 공급하는 게 목표”라고 말했다.

라스베이거스=이주현 기자 deep@hankyung.com