사진=오픈AI
사진=오픈AI
오픈AI의 대규모언어모델(LLM) GPT-4의 ‘게으름’ 문제가 끊이지 않자, 클로드3 등 다른 LLM으로 이동하는 사용자들이 늘고 있다. 챗GPT가 유료 사용자들의 요구에 제대로 응답하지 않자 이에 불만족한 이들이 대안을 찾아 나섰다는 것이다. 이런 점을 노린 아마존웹서비스(AWS) 등 클라우드서비스 업체들은 자사 서비스 내에 앤스로픽과 라마2, 미스트랄AI 등 다양한 LLM에 대한 접근성을 높이고 나섰다.

2일(현지시간) 관련 업계에 따르면 작년 하반기부터 제기된 GPT-4의 게으름 문제가 최근 다시 불거지고 있다. 작년 말 오픈AI가 이를 개선하기 위해 GPT-4터보를 출시했음에도 개선되지 않았다는 지적이 나온다. 이에 앤스로픽의 클로드3로 갈아타는 이용자들도 늘고 있다고 비즈니스 인사이더가 최근 보도했다.

특히 지난달 초 출시된 클로드3는 GPT-4를 능가하는 성능을 갖췄다는 평가를 받으면서 선호도도 늘고 있다. 클로드3의 최상위 버전인 ‘오푸스’는 추론, 수학 등의 능력을 측정하는 ‘대규모 멀티태스크 언어이해(MMLU)’ 벤치마크에서 오픈AI GPT-4와 구글의 최상위 모델인 제미나이 울트라를 넘어섰다.

데이터 처리 능력도 확장돼 단어 15만 개 분량의 책 한 권을 한 번에 분석해 요약할 수 있다. 앤스로픽은 “기존보다 처리 용량이 두 배 증가했다”며 “‘해리포터와 죽음의 성물’ 책을 요약할 수 있다”고 설명했다.

다른 경쟁사들도 성능 높인 새로운 AI 모델 속속 내놓고 있다. 일론 머스크의 xAI는 GPT-4 수준에 근접한 LLM ‘그록-1.5’를 최근 발표했다. 작년 11월 '그록-1.0' 출시 이후 5개월 만이다.

xAI는 “그록-1.5가 코딩과 수학을 포함한 주요 벤치마크에서 이전 모델보다 향상됐다”며 “구글의 제미나이 1.5 프로나 GPT-4 클로드3 등과 성능이 비슷하다”고 설명했다. 이 모델은 이번 주부터 X 프리미엄 사용자에게 제공된다.

프랑스의 미스트랄AI도 새로운 LLM '미스트랄 7B v0.2' 지난달 말 출시했다. 메타의 라마2를 뛰어넘는 성능으로, 더 적은 매개변수에서도 성능과 다양성, 효율성을 보여줬다는 평가가 나온다.

오픈AI는 현재 올여름 출시를 목표로 GPT-5 개발하고 있다. 이 때문에 게으름 문제 해결에 리소스를 집중할 것 같지 않다는 지적이 나온다.

이런 점을 겨냥해 AWS는 AI 플랫폼 ‘베드록’의 시장 점유율을 높이기 위해 앤스로픽, 라마2, 미스트랄AI, 코히어를 무료로 사용할 수 있도록 하는 등 이들에 대한 사용 접근성을 높였다. 아마존은 최근 앤스로픽에 25억700만달러를 추가로 투자하는 등 누적 40억달러를 투자해 협업 체제를 강화했다. 앤스로픽은 AWS를 기본 클라우드 제공업체로 사용하고, 아마존의 AI칩 트레이니엄과 인퍼런시아를 통해 모델을 훈련할 예정이다.

실리콘밸리=최진석 특파원 iskra@hankyung.com