"스푸트니크 모먼트 왔다"…실리콘밸리의 '中 딥시크 쇼크'
입력
수정

CNBC는 24일(현지시간) 딥시크가 성능이 뛰어난 AI 모델을 출시하면서 실리콘밸리에 공포가 퍼졌다고 소개했다. 벤처비트도 딥시크가 지난 며칠 간 실리콘밸리에서 가장 많이 논의된 회사라고 전했다. 딥시크는 최근 오픈AI의 'o1' 모델과 경쟁하는 추론 모델 ‘R1’ 시리즈를 오픈 소스로 공개했다. R1과 R1-제로는 ‘딥시크-V3’를 미세조정한 모델이다. 각각 6710억개의 매개변수를 포함하고 있다. '전문가 혼합(MoE)' 아키텍처를 채택했다. 전체 매개변수 중 약 340억개만 활성화하도록 설계돼 비용 대비 효율이 높다.
뉴욕타임스(NYT)가 분석한 보고서에 따르면 딥시크-V3 개발에 투입된 비용은 557만6000달러(약 78억8000만원)다. 엔비디아의 'H800 GPU'를 시간당 2달러에 2개월 동안 빌린 비용이다. NYT는 오픈AI와 구글 등 실리콘밸리의 거대 기업보다 첨단 칩을 적게 사용하면서도 경쟁력 있는 챗봇을 만들었다고 소개했다.
오픈AI를 공동창업한 안드레이 카르파티는 지난달 26일 엑스(X·옛 트위터)에 올린 글에서 딥시크의 기술 보고서를 읽고 훌륭하고 상세하다는 평가와 함께 '농담 같은 예산'으로 선도적 LLM 출시를 쉬운 것처럼 보이게 했다고 언급했다.알렉산더 왕 스케일 AI CEO는 중국이 미국을 앞질렀을 수 있다고 봤다. 그는 "우리가 분석한 바에 따르면 딥시크의 모델은 가장 성능이 뛰어나거나 미국 최고 모델과 거의 비슷한 수준"이라라고 평가했다. 중국은 GPU 부족을 해결하기 위한 목적으로 서로 다른 AI칩을 연계하는 기술을 개발해왔다.
고은이 기자 koko@hankyung.com