인텔·네이버 "엔비디아 AI칩 대체재 찾았다"

AI용 GPU 대안찾기 속도

품귀 현상에 가격 치솟고
주문해도 수령까지 1년 걸려

GPU 기반 '네이버 플레이스'
인텔 CPU로 전환해 가동 성공
"비용절감·서비스 고도화에 탁월"
네이버와 인텔이 인공지능(AI) 서비스에 활용되는 엔비디아의 그래픽처리장치(GPU)를 중앙처리장치(CPU)로 대체하는 데 성공했다. AI 서비스의 필수재로 꼽히는 GPU의 대체재를 찾은 국내 첫 사례다. 전 세계 AI 기업들이 골몰하고 있는 엔비디아 GPU 대안 찾기 움직임에 속도가 붙을 것이란 전망이 나온다.

30일 반도체업계에 따르면 네이버는 최근 ‘네이버 플레이스’ 서비스의 AI 추론(AI 모델을 서비스에 직접 활용하는 과정)용 서버를 엔비디아 GPU 기반에서 인텔 CPU로 전환했다. 네이버 플레이스는 사용자에게 네이버 지도를 기반으로 지역 상점에 대한 정보를 제공하는 서비스다. 상점 이용자들이 입력한 정보를 실시간 수집하고, 허위 정보와 유용한 정보를 판별해 노출하는 데 AI 모델을 활용하고 있다.

GPU 서버는 CPU 서버 대비 AI 추론 처리 능력이 10배 정도 뛰어난 것으로 알려져 있다. 네이버와 인텔은 GPU를 CPU로 안정적으로 대체하기 위해 기술 노하우를 총동원했다. 인텔은 추론에 최적화된 소프트웨어 솔루션을 도입해 CPU의 성능을 높였다. 이를 통해 CPU의 초당 처리 능력(RPS)을 4~7배 개선했다. 네이버는 플레이스 서비스의 위치 정확도를 유지하면서 AI 모델을 경량화해 CPU에 주는 부담을 최소화했다. 두 회사는 CPU 서버를 한 달간 사전 테스트한 뒤 최근 실제 서비스에 적용하기 시작했다.

네이버가 GPU 대체에 나선 건 최근 엔비디아 GPU 기반 서버 비용이 크게 증가하고 원활하게 GPU를 공급받는 게 힘들어졌기 때문이다. ‘AI 기업들이 서비스 업그레이드에 어려움을 겪을 것’이란 우려가 나올 정도다.최근 ‘H100’ 등 AI 서비스에 특화된 엔비디아의 GPU 가속기는 리드타임(주문 후 수령까지 걸리는 기간)이 52주로 늘었다. 엔비디아 AI용 GPU를 독점 제조하는 대만 TSMC의 생산능력이 수요를 못 따라가고 있어서다. 품귀 현상 때문에 올초 4000만원 안팎이던 유통 가격은 최근 2배 정도인 7000만~8000만원으로 뛰었다.

네이버 관계자는 “CPU 전환과 AI 모델 최적화를 통해 운영비를 절감할 수 있게 됐다”며 “향후 CPU를 확대 적용할 수 있는 기반을 확보했다”고 설명했다.

산업계에선 엔비디아 GPU를 대체하기 위한 AI·반도체 기업 간 협업이 속도를 낼 것이란 전망이 나온다. 엔비디아가 AI GPU에 최적화된 쿠다(CUDA) 소프트웨어를 앞세워 생태계를 장악하고 있지만, 이번에 대체 가능성이 입증됐기 때문이다. 네이버는 인텔의 최신 서버용 CPU(사파이어래피즈)를 활용해 GPU 서버를 추가로 대체할 계획이다.

황정수 기자 hjs@hankyung.com