오픈AI, GPT-5 개발 지연…데이터·비용 한계
입력
수정
"학습에 필요한 데이터 부족해"챗GPT 개발사 오픈AI의 차세대 주력 인공지능(AI) 모델 개발이 지연되고 있다. 데이터 부족과 막대한 비용 문제로 어려움을 겪고 있는 것으로 알려졌다.
22일(현지시간) 월스트리트저널(WSJ)은 여러 소식통을 인용해 코드명 ‘오리온’으로 알려진 오픈AI의 차세대 AI 모델 GPT-5는 개발 일정이 기약 없이 지연되고 있다고 보도했다. 당초 오픈AI의 최대 투자사인 마이크로소프트(MS)는 올해 중반께 새로운 AI 모델이 나올 것으로 예상했다.소식통에 따르면 오픈AI는 1년 6개월이 넘는 개발 기간 중 방대한 양의 데이터를 처리하는 대규모 훈련을 최소 두 차례 진행했지만 매번 새로운 문제가 발생했다. 새 모델은 기존 GPT-4보다는 나은 성능을 보였지만, 투입한 비용에 비해 만족스러운 결과가 아니었다고 WSJ는 전했다. 업계는 이 정도의 대규모 AI 훈련에는 6개월간 컴퓨팅 비용만으로 약 5억달러(약 7248억원)가 소요될 수 있다고 추정했다.
오픈AI는 데이터 부족 문제를 해결하기 위해 새로운 데이터를 직접 생성하는 방식을 시도하고 있다. 주로 소프트웨어 엔지니어나 수학자를 고용해 AI가 학습할 코드를 만들거나 복잡한 수학 문제를 해결하는 방식을 도입했지만, 많은 시간이 소요되고 있다. 또 경쟁사들이 수백만달러의 연봉을 제시하며 오픈AI 주요 연구원을 영입하려고 나서, 인건비 부담까지 커지는 분위기로 알려졌다. 올해 일리야 수츠케버 오픈AI 공동 창업자를 비롯해 20명 이상이 오픈AI를 떠났다.
수츠케버는 지난 13일 한 강연에서 “컴퓨터 연산 능력은 향상되고 있지만 학습에 필요한 데이터는 증가하지 않고 있다”며 “생성형 AI 모델의 사전 훈련은 결국 한계에 도달할 것”이라고 우려했다. 그는 AI 모델 학습·훈련에 필요한 데이터를 유한한 자원인 화석연료에 비유하기도 했다.샘 올트먼 오픈AI 최고경영자(CEO)는 지난 20일 고급 추론 AI 모델 ‘o3’를 공개했지만, GPT-5의 구체적인 출시 일정은 밝히지 않았다.
정지은 기자 jeong@hankyung.com