초거대 AI경쟁, 슈퍼컴퓨터서 판가름 난다

테슬라, 슈퍼컴으로 자율주행 시뮬레이션 진행
엔비디아, 바이오-AI 연계 '캠브리지-1' 가동 시작
네이버, 초거대 언어모델 '하이퍼클로바' 개발 박차
엔비디아는 슈퍼컴퓨터 ‘캠브리지-1’을 통해 제약사들과 AI 기반 생명과학 연구에 나섰다.
글로벌 기업과 연구기관들의 슈퍼컴퓨터 구축 경쟁이 거세지고 있다. 목표는 인공지능(AI) 시장 선점이다. AI 서비스는 하드웨어(HW) 인프라 성능에 따라 개발 기간이 큰 폭으로 달라진다. 방대한 양의 데이터를 고속으로 연산할 수 있는 슈퍼컴퓨터는 AI 관련 HW 인프라 중 필수 요소다.

○바이오·자율주행 기반 닦는 슈퍼컴

엔비디아는 이달 AI 연구용 슈퍼컴퓨터 ‘캠브리지-1’ 가동을 시작했다. 아스트라제네카, 글락소스미스클라인(GSK), 옥스퍼드 나노포어, 킹스칼리지 런던 등과 함께 바이오와 AI를 연계하는 기술을 개발한다. 엔비디아는 이를 위해 1억달러(약 1150억원)를 투자했다.캠브리지-1은 80여 개의 AI 가속 엔진을 바탕으로 400페타플롭스(PF) 이상의 성능을 지원한다. 1PF는 1초에 1000조 번 부동소수점(컴퓨터의 실수 인식법) 연산이 가능한 속도다. 엔비디아는 이를 통해 신약 생성, 유전자 검증, 의약품 후보군 테스트를 모두 AI 기반으로 진행할 예정이다. 젠슨 황 엔비디아 최고경영자(CEO)는 “기존에 불가능했던 규모와 속도로 질병과 치료법에 대한 단서를 찾도록 지원할 것”이라고 밝혔다.
테슬라의 슈퍼컴퓨터는 오토파일럿 및 자율주행 성능 향상에 활용되고 있다.
테슬라는 오토파일럿 및 자율주행 기능 강화를 위해 슈퍼컴퓨터를 활용하고 있다. 지난달 테슬라는 세계 최대 컴퓨터 비전 콘퍼런스 ‘CVPR 2021’에서 심층신경망(DNN) 훈련에 사용하는 자사 슈퍼컴퓨터를 공개했다. 1초에 180경 번의 연산 처리가 가능한 1.8엑사플롭스급 성능을 구현했다고 설명했다.

테슬라는 이 슈퍼컴퓨터로 무수한 가상 시뮬레이션을 진행하고 있다. DNN은 초당 36프레임으로 녹화된 약 1.5페타바이트(PB)가량의 클립 데이터를 학습한다. 테슬라는 현재의 성능을 뛰어넘는 새 슈퍼컴퓨터 ‘도조(Dojo)’의 연내 도입도 예고했다.

○슈퍼컴 도입 경쟁, 한국도 시동

국내에서는 네이버가 AI 인프라 구축에서 앞서가고 있다. 네이버는 지난해 10월 AI 연구를 위해 700PF급 슈퍼컴퓨터를 국내 기업 가운데 최초로 도입했다. 140개의 컴퓨팅 서버를 갖췄으며, 내장한 그래픽처리장치(GPU)만 1120개에 달한다.

네이버는 최근 한국어 기반 초거대언어 모델 ‘하이퍼클로바’ 개발에 주력하고 있다. 지난해 공개된 글로벌 AI 언어 모델 ‘GPT-3’를 넘어서겠다는 목표다. 하이퍼클로바 개발에는 슈퍼컴퓨터가 핵심적인 역할을 담당한다. 네이버 관계자는 “슈퍼컴퓨터를 도입하니 예전엔 1년 걸리는 작업이 하루 만에 끝났다”며 “원래 가진 장비로 치면 500배 빠른 AI 개발이 가능해졌다”고 전했다. 2040억 개의 파라미터(매개변수)를 갖춘 하이퍼클로바는 GPT-3보다 한국어 데이터를 6500배 이상 더 학습했다. AI 스피커, 온라인 쇼핑 수요 예측, 검색 시스템 등 서비스 적용 분야가 무궁무진할 것으로 평가받는다.

정부 움직임도 빨라졌다. 한국과학기술정보연구원(KISTI) 국가슈퍼컴퓨팅센터는 2023년 국가슈퍼컴퓨터 6호기를 도입한다. 1초에 100경 번 연산이 가능한 엑사 스케일 슈퍼컴퓨터다. 글로벌 AI 연구 경쟁이 본격화하면서 슈퍼컴퓨터 활용 범위가 점점 늘고 있다는 판단에서다. KISTI는 수요 조사와 의견 수렴을 거쳐 오는 11월 구체적 사양을 결정할 방침이다.

이시은 기자 see@hankyung.com