대규모언어모델(LLM) ‘제미니’ 출시를 앞둔 구글이 주요 기업을 대상으로 기능 테스트에 들어갔다. 제미니는 생성형 인공지능(AI) 오픈AI의 LLM GPT-4 대항마로 꼽힌다. 제미니의 파라미터(매개변수)는 1조 개에 달한다. 5000억 개로 추정되는 GPT-4보다 두 배 큰 규모다. 업계에선 오픈AI 챗GPT의 독주 체제가 막을 내릴 수 있다는 전망이 나온다.

GPT-4보다 세다…구글 '제미니' 출격 임박
16일(현지시간) 로이터, 월스트리트저널(WSJ) 등 외신과 관련 업계에 따르면 구글은 최근 일부 기업에 제미니의 초기 버전을 제공하고 테스트에 들어갔다. 구글은 제미니가 AI 리더십 회복에 큰 역할을 할 것으로 기대하고 있다. 지난해 말 마이크로소프트(MS)의 지원을 등에 업은 오픈AI가 챗GPT를 출시해 생성형 AI 시장의 주도권을 가져가자 구글은 올해 이 부문 투자를 강화해왔다.

제미니는 텍스트 요약 생성, 코딩은 물론 이미지까지 만들어내는 ‘멀티모달’ 기능도 갖출 것으로 보인다. 멀티모달은 텍스트, 이미지, 음성 등 여러 종류의 데이터를 동시에 처리할 수 있는 기술을 뜻한다. 생성형 AI가 텍스트를 넘어 다양하고 복잡한 정보를 이해하고 처리할 수 있게 되는 것이다.

멀티모달 기능은 지난 3월 출시된 GPT-4에도 적용됐다. 예를 들어 밀가루, 우유, 달걀 사진을 제시하고 “이 재료들로 무엇을 만들 수 있을까”라고 물어보면 팬케이크, 와플 등의 요리법을 알려준다. 다만 GPT-4는 텍스트를 입력했을 때 이미지를 만들어주는 기능은 없다. 구글 제미니는 ‘텍스트 입력 시 이미지 생성’ 기능으로 GPT-4와의 차별화를 꾀할 것으로 보인다. 업계 관계자는 “구글이 MS·오픈AI 동맹을 압박하는 모양새”라며 “생성형 AI 시장을 둘러싼 주도권 경쟁이 한층 더 치열해질 것”이라고 말했다.

메타도 LLM 경쟁에 뛰어들었다. 7월 공개한 ‘라마2’를 내년까지 GPT-4 수준으로 강화하는 작업을 마칠 방침이다. 메타는 2월 ‘라마’를 공개할 때부터 오픈소스 전략을 취했다. LLM 핵심 기술을 공개하지 않고 유료화 전략을 사용하는 오픈AI나 MS, 구글 등과 차별화했다. 라마2는 상업적 사용까지도 무료로 활용할 수 있도록 했다.

새 LLM 역시 오픈소스를 기반으로 공개해 기업들이 무료로 이용하게 할 방침인 것으로 알려졌다. 메타는 이를 위해 엔비디아의 최첨단 AI용 반도체인 ‘H100’ 확보 작업도 벌이고 있다. 라마2는 MS 클라우드 컴퓨팅 플랫폼인 애저를 이용하고 있다. 새로운 LLM은 메타의 자체 슈퍼 컴퓨팅 인프라에서 작동할 것으로 전망된다.

실리콘밸리=최진석 특파원 iskra@hankyung.com