이미지 AI도 '딥시크 쇼크'?…"오픈AI '달리3' 성능 넘었다"

중국 AI 스타트업 딥시크가 오픈 소스 이미지 모델을 출시했다. 딥시크는 이 모델의 성능이 오픈AI의 이미지 모델 '달리(DALL-E3)' 보다 우수하다고 주장했다.

딥시크는 27일(현지시간) 허깅페이스를 통해 이미지 이해 및 생성 모델 '야누스 프로 7B'를 출시했다. 딥시크 측 기술 논문에 따르면 이 모델 역시 추론모델 R1과 마찬가지로 효율성에 강점이 있다. 사실적인 이미지 생성과 복잡한 시각적 추론, 이미지 캡션 생성 등 다양한 시각 작업에서 탁월하다고 보고서는 적었다. 보고서는 또 야누스 프로가 7200만 개의 고품질 합성 이미지를 추가하고 이를 실제 데이터와 균형 있게 조정해 시각적으로 더 매력적이고 안정적인 이미지 출력을 달성했다고 전했다. 연구진은 "이전 통합 모델을 능가하고, 기존 모델의 성능과 동일하거나 더 뛰어나다"고 강조했다. 복잡한 프롬프트에 대한 이미지 생성 기능을 테스트하는 'DGP-벤치' 등에서 오픈AI 달리 3와 스테이블 디퓨전의 SDXL 성능을 능가한다고 주장했다.

딥시크는 추론모델 R1으로 글로벌 AI 생태계에 충격을 준 기업이다. 딥시크가 최근 출시한 오픈소스 추론 모델인 R1은 오픈AI의 o1에 필적하는 성능을 갖춘 것으로 평가되고 있다. 딥시크는 R1 훈련에 600만 달러(약 86억7600만원)도 들지 않았다고 밝혔다. AI 모델 구축에 수십억 달러를 쏟고 있는 미국 기업과는 대조적이다.

고은이 기자 koko@hankyung.com