"AI 시대, 인간 뇌 닮은 NPU가 대세"…구글·애플 이어 LG도 참전
입력
수정
지면A5
'온디바이스 AI' 빅뱅삼성전자의 ‘두뇌’ 역할을 하는 미래기술 연구조직인 삼성리서치는 지난달 통합칩셋(SoC·여러 반도체를 하나의 칩에 구현한 것) 설계팀에 엔지니어 200여 명을 충원했다. 이렇게 많은 개발자를 한꺼번에 삼성리서치에 투입한 건 흔치 않은 일이다. 이유는 온디바이스 인공지능(AI)을 구현하는 반도체인 신경망처리장치(NPU) 개발 역량을 강화하기 위해서였다.
(2) AI용 NPU 특수…엔비디아 GPU 아성 흔들까
신기술 연구 조직 '삼성리서치'
반도체 설계 인력 200명 영입
"NPU 개발 능력이 미래 경쟁력"
구글·애플 등 '최적화 칩' 개발
LG, 2년 공들인 칩 본격 탑재
삼성전자는 미국 실리콘밸리, 오스틴 등 연구개발(R&D) 핵심 기지에서도 NPU 설계 경력자를 상시 채용하고 있다. 삼성 고위 관계자는 “이제 막 열린 온디바이스 AI 전자제품 시장을 잡으려면 NPU 개발 능력을 끌어올리는 게 관건이라고 판단했다”고 설명했다.
본격적으로 열리는 NPU 시장
글로벌 정보기술(IT)업계에 NPU 개발 열풍이 불고 있다. NPU는 AI의 양대 축인 ‘학습’과 ‘추론’ 중 추론에 특화한 반도체다. 주로 전자기기용 SoC에 장착돼 외국어 자동 번역, 콘텐츠 화질 업그레이드 등을 담당한다.온디바이스 AI를 장착한 기기는 클라우드 연결 없이 자체적으로 AI 서비스를 구현해야 하는데, 이 기능을 NPU가 담당한다. 온디바이스 AI와 NPU는 일심동체처럼 같이 움직인다는 얘기다. NPU란 명칭은 인간의 뇌(신경망)와 비슷한 방식으로 정보를 처리한다는 이유에서 붙여졌다.최근 온디바이스 AI가 적용된 스마트폰, 가전, TV, 노트북이 잇달아 나오면서 NPU는 가장 ‘귀한’ 반도체가 되고 있다. 시장조사업체 가트너에 따르면 2022년 326억달러(약 43조원) 규모이던 NPU(AI용 반도체) 시장은 2030년 1170억달러(약 154조원)로 불어날 전망이다.
삼성전자 퀄컴 인텔 등 반도체회사들이 NPU를 미래 먹거리로 삼고 시장 확대에 사활을 거는 이유다. 삼성전자는 지난해 10월 기존 제품보다 NPU 성능을 14.7배 끌어올린 스마트폰용 SoC인 ‘엑시노스 2400’을 공개했다. 퀄컴은 직전 제품보다 NPU 성능을 98% 개선한 스마트폰용 SoC인 ‘스냅드래곤 8Gen 3’로 맞섰다.
최근엔 구글 애플 아마존 등 거대 테크기업과 LG전자까지 NPU 개발 행렬에 동참했다. 다른 회사가 만든 NPU를 사다 쓰는 것보다는 맞춤형 NPU를 직접 개발해야 온디바이스 AI 제품을 제대로 구동할 수 있다는 이유에서다. LG전자가 그렇다. 이 회사는 TV 화질을 자동 개선하는 AI 기능을 업그레이드하기 위해 작년부터 2세대 온디바이스 NPU 개발에 들어갔다.
GPU 밀어내고 패권 장악
반도체업계는 머지않은 시기에 NPU가 그래픽처리장치(GPU)를 밀어내고 AI 반도체 시대의 패권을 거머쥘 것으로 내다보고 있다. 현재 AI용 반도체 시장의 90%는 엔비디아의 GPU가 차지하고 있다. 화면 그래픽을 초당 수백·수천 번씩 채워넣기 위해 개발된 GPU는 여러 데이터를 동시에 처리하는 병렬 연산에 특화돼 있다. 이 때문에 대규모 데이터를 습득하는 AI 학습에 적합하다는 평가를 받으며 그래픽 처리 기능을 넘어 ‘AI 칩’으로 주목받았다.하지만 온디바이스 AI 시대의 주인공은 GPU가 아니라 NPU가 될 것이란 예상이 많다. 칩의 크기가 크고 값도 비싼 AI용 GPU는 클라우드를 활용한 현행 AI 시스템에는 그런대로 잘 맞지만, 스마트폰처럼 작은 기기에 적용하기는 어려워서다. 인터넷 연결 없이 AI 기능을 수행하려면 현 상태에선 작고 빠른 NPU를 능가하는 칩이 없다.
글로벌 기업들도 이런 점을 감안해 ‘차세대 AI 서비스’용 반도체 칩으로 NPU를 선택하고 있다. 테슬라가 그렇다. 이 회사는 자율주행 서비스에 NPU를 활용하기로 했다. 테슬라는 개별 차량에 HW3.0 등으로 이름 붙인 온디바이스 자율주행용 NPU를 활용한다.■ NPU(신경망처리장치)
사람의 두뇌처럼 정보를 학습하고 처리하는 반도체, 인공지능(AI) 전용으로 설계된 칩이기 때문에 추론(서비스) 영역에서는 GPU보다 더 효율적으로 작업을 수행한다.
황정수/김채연 기자 hjs@hankyung.com