[단독] 네이버, 인텔 손 잡고 엔비디아 GPU 대체 성공
-
기사 스크랩
-
공유
-
댓글
-
클린뷰
-
프린트
"개당 5000만원 내고 1년 안 기다려도 된다"
네이버 플레이스 AI 추론 서버
엔비디아 GPU에서 인텔 CPU로
"추가장비 투입 없이 동일 성능"
엔비디아 GPU '품귀' 현상 심화
지금 주문해도 1년 기다려야
"GPU 대체 가능성 입증"
네이버 플레이스 AI 추론 서버
엔비디아 GPU에서 인텔 CPU로
"추가장비 투입 없이 동일 성능"
엔비디아 GPU '품귀' 현상 심화
지금 주문해도 1년 기다려야
"GPU 대체 가능성 입증"
개당 5000만원에 주문해도 1년 뒤 수령. 명품백 구매대란 얘기가 아니다. 미국 엔비디아가 개발·판매하는 그래픽처리장치(GPU) 기반 인공지능(AI) 가속기 시장 상황이다. 가속기가 AI 서비스 고도화를 위한 필수재로 꼽히면서 '돈 주고도 못 사는' 상황이 벌어졌다. 마이크로소프트 등 AI 개발사들의 불안감은 커지고 있다.
국내 기업 상황도 비슷하다. "가속기가 부족해 업그레이드가 쉽지 않다"는 원성이 쏟아진다. 국내 AI 기업의 맏형 네이버가 묘수를 냈다. 최근 인텔과 손잡고 엔비디아의 가속기를 대체할 수 있는 제품 확보에 성공했다.
보통 GPU 서버는 CPU 서버 대비 AI 추론 처리 능력이 10배 정도 뛰어난 것으로 알려져있다. 두 회사는 GPU의 CPU 대체를 위해 기술 노하우를 총동원했다. 인텔은 추론에 최적화된 소프트웨어 솔루션을 도입해 CPU의 활용도를 높였다. 이를 통해 CPU의 초당 처리 능력(RPS)을 4~7배 개선했다. 네이버는 플레이스 서비스의 위치 정확도를 유지하면서 AI 모델을 경량화해 CPU에 주는 부담을 최소화했다.
네이버와 인텔은 CPU 서버에 대한 한 달 간의 사전 최종 테스트를 거친 뒤 실제 서비스에 적용하기 시작했다. 네이버는 서버 전환에 따른 서비스 질 하락이나 추가 장비 투입 없이 GPU 대체로 연 4억원에 달하는 비용을 절감하게 됐다.
'H100' 등 AI 서비스에 특화된 엔비디아의 GPU 가속기의 경우 리드타임(주문 후 수령까지 걸리는 기간)이 최근 '52주'로 늘었다. 지금 주문해도 1년 뒤에 받을 수 있다는 뜻이다. 엔비디아 GPU를 제조하는 대만 TSMC의 생산능력이 수요를 못 따라잡고 있어서다. 품귀 때문에 올초 4000만원 안팎이던 유통 가격도 최근 7000만~8000만원까지 뛰었다.
주윤상 네이버 G플레이스 AI개발팀장은 "CPU 전환과 AI 모델 최적화를 통해 운영비용을 절감할 수 있게 됐다"며 "향후 확대 적용할 수 있는 기술 기반을 확보하게 됐다"고 설명했다.
네이버 역시 향후 인텔의 최신 4세대 서버용 CPU(사파이어래피즈)를 활용해 GPU 서버를 추가로 대체할 계획이다. 나승주 인텔코리아 상무는 "CPU를 효율적으로 활용하면 GPU 사용을 최소화하면서도 원하는 성능을 확보할 수 있다"고 강조했다.
황정수 기자 hjs@hankyung.com
국내 기업 상황도 비슷하다. "가속기가 부족해 업그레이드가 쉽지 않다"는 원성이 쏟아진다. 국내 AI 기업의 맏형 네이버가 묘수를 냈다. 최근 인텔과 손잡고 엔비디아의 가속기를 대체할 수 있는 제품 확보에 성공했다.
네이버 플레이스 AI 서비스에 인텔 CPU 서버
30일 반도체업계에 따르면 네이버는 최근 '네이버 플레이스' 서비스의 AI 추론(AI 모델을 서비스에 직접 활용하는 과정)용 서버를 엔비디아 GPU 기반에서 인텔 CPU로 전환했다. 플레이스 서비스는 사용자에게 네이버 지도 기반으로 지역 상점에 대한 정보를 제공하는 서비스다. 상점 이용자들이 입력한 정보를 실시간 수집하고, 허위 정보와 유용한 정보를 판별해 노출하는 데 AI 모델을 활용하고 있다.보통 GPU 서버는 CPU 서버 대비 AI 추론 처리 능력이 10배 정도 뛰어난 것으로 알려져있다. 두 회사는 GPU의 CPU 대체를 위해 기술 노하우를 총동원했다. 인텔은 추론에 최적화된 소프트웨어 솔루션을 도입해 CPU의 활용도를 높였다. 이를 통해 CPU의 초당 처리 능력(RPS)을 4~7배 개선했다. 네이버는 플레이스 서비스의 위치 정확도를 유지하면서 AI 모델을 경량화해 CPU에 주는 부담을 최소화했다.
네이버와 인텔은 CPU 서버에 대한 한 달 간의 사전 최종 테스트를 거친 뒤 실제 서비스에 적용하기 시작했다. 네이버는 서버 전환에 따른 서비스 질 하락이나 추가 장비 투입 없이 GPU 대체로 연 4억원에 달하는 비용을 절감하게 됐다.
엔비디아 GPU 조달 어렵고 가격 올라 '부담'
네이버가 GPU 대체에 나선 건 최근 엔비디아 GPU 기반 서버 비용이 급증하고 GPU를 원활하게 공급받는 게 어려워져서다. 'AI 기업들이 서비스 업그레이드에 어려움을 겪을 것'이란 우려도 쏟아졌다.'H100' 등 AI 서비스에 특화된 엔비디아의 GPU 가속기의 경우 리드타임(주문 후 수령까지 걸리는 기간)이 최근 '52주'로 늘었다. 지금 주문해도 1년 뒤에 받을 수 있다는 뜻이다. 엔비디아 GPU를 제조하는 대만 TSMC의 생산능력이 수요를 못 따라잡고 있어서다. 품귀 때문에 올초 4000만원 안팎이던 유통 가격도 최근 7000만~8000만원까지 뛰었다.
주윤상 네이버 G플레이스 AI개발팀장은 "CPU 전환과 AI 모델 최적화를 통해 운영비용을 절감할 수 있게 됐다"며 "향후 확대 적용할 수 있는 기술 기반을 확보하게 됐다"고 설명했다.
엔비디아 생태계 강력하지만...대체재 확보 '첫발'
산업계에선 엔비디아 GPU를 대체하기 위한 AI·반도체 기업 간 합종연횡이 속도를 낼 것이란 전망이 나온다. 엔비디아가 AI GPU에 최적화된 쿠다(CUDA) 소프트웨어를 앞세워 생태계를 장악하고 있지만 대체하는 게 불가능하지는 않아서다.네이버 역시 향후 인텔의 최신 4세대 서버용 CPU(사파이어래피즈)를 활용해 GPU 서버를 추가로 대체할 계획이다. 나승주 인텔코리아 상무는 "CPU를 효율적으로 활용하면 GPU 사용을 최소화하면서도 원하는 성능을 확보할 수 있다"고 강조했다.
황정수 기자 hjs@hankyung.com