메타도 가세한 AI 슈퍼컴퓨터 '절대강자' 경쟁
-
기사 스크랩
-
공유
-
댓글
-
클린뷰
-
프린트
메타 "가장 빠른 슈퍼컴 목표"
GPU만 1만6000개 투입
AI 속도 최대 20배 향상
MS·엔비디아도 "우리가 먼저"
불타오르는 세계 최고 전쟁
GPU만 1만6000개 투입
AI 속도 최대 20배 향상
MS·엔비디아도 "우리가 먼저"
불타오르는 세계 최고 전쟁
글로벌 빅테크 기업들이 인공지능(AI) 개발을 위한 슈퍼컴퓨터 확보에 열을 올리고 있다. 마이크로소프트(MS), 엔비디아 등이 AI 학습 속도를 슈퍼컴퓨터로 대폭 끌어올린 가운데, 가상현실을 AI 기술로 구현하겠다는 메타가 세계 최고 수준 AI 슈퍼컴퓨터 구축을 선언하고 나섰다.
월스트리트저널(WSJ) 등 외신에 따르면 메타는 최근 ‘AI 리서치 슈퍼클러스터(RSC)’ 개발 내역을 공개했다. RSC는 AI 개발에 쓰이는 슈퍼컴퓨터다. 메타는 이날 공식 블로그를 통해 “차세대 첨단 AI를 개발하기 위해선 강력한 새 컴퓨터가 필요하다”며 “올해 중반 RSC가 완전히 구축되면 세계에서 가장 빠른 AI 슈퍼컴퓨터가 될 것”이라고 강조했다. 목표는 1초에 500경 번 연산 처리가 가능한 5엑사플롭스급 성능 구현이다. 현재 글로벌 성능 1위 슈퍼컴퓨터로 알려진 ‘후가쿠’ 연산 속도는 1초당 44경2010조 번이다.
메타는 2017년 엔비디아 ‘V100 텐서 코어’ 그래픽처리장치(GPU) 2만2000개로 1세대 슈퍼컴퓨터 인프라를 구축했다. RSC는 해당 장치에 비해 컴퓨터비전 관련 학습을 최대 20배 더 빠르게 처리할 수 있다. 대규모 자연어처리(NLP) 훈련도 3배 빠르게 가능하다. 올해 말에는 매개 변수 1조 개가 넘는 AI 모델을 훈련시킨다는 계획도 갖고 있다. 메타 측은 “RSC가 서로 다른 언어를 사용하는 대규모 집단에게 실시간 음성 통역을 지원하거나 증강현실(AR) 게임 개발 등 새로운 AI 시스템을 구축하는데 쓰일 것”이라고 밝혔다.
새로운 AI 슈퍼컴퓨터엔 엔비디아 ‘A100’ GPU 1만6000개와 AMD의 ‘에픽롬 772’ 프로세서 4000개가 탑재될 전망이다. 글로벌 스토리지 전문 업체 퓨어스토리지 솔루션과 리눅스 전문업체 펭귄컴퓨팅 노하우도 투입된다. 현재까지는 1단계 작업이 완료됐으며 AI 100 GPU 6080개가 탑재된 상태다. 마크 저커버그 메타 최고경영자(CEO)는 “RSC는 수조 개의 데이터를 학습하고, 수백 개의 언어를 이해할 수 있는 새로운 AI 모델을 가능하게 할 것”이라고 전했다. 빅테크들의 AI 슈퍼컴퓨터 경쟁은 절정으로 치닫고 있다. MS는 초거대 언어 모델 ‘GPT-3’ 개발사인 오픈AI와 협력해 슈퍼컴퓨터를 구축해 운영하고 있다. 28만5000개 이상 중앙처리장치(CPU)와 1만 개 이상 GPU를 탑재했으며, 초당 2경 번 이상 연산이 가능할 것으로 추산된다. MS 클라우드 서비스인 애저를 기반으로 구축된 것이 특징이다. 해당 슈퍼컴퓨터는 오픈AI에 독점적으로 공급되고 있다. MS는 2019년 오픈AI에 약 10억달러(1조 2000억원)를 출자한 기업이기도 하다.
엔비디아는 슈퍼컴퓨터 개발에서 선두주자를 자처한다. 엔비디아에 따르면, 전 세계 ‘TOP 500’ 슈퍼컴퓨터 중 136개 인프라에 엔비디아 GPU가 들어가 있다. 연산 능력 상위 20위에는 엔비디아가 자체 개발한 슈퍼컴퓨터 3대도 포함된다는 설명이다. 주로 AI 및 자율주행 차량 개발 등에 활용되는 기기들이다. 외부와의 협력도 발 빠르다. 지난해 엔비디아는 영국에서 가장 빠른 AI 슈퍼컴퓨터 ‘캠브리지-1’ 가동을 시작했다. 투입한 자금은 약 1억달러(1200억원)에 이른다. 아스트라제네카, 글락소스미스클라인, 옥스포드 나노포어 등 의료 분야 기업이 AI 기반 신약 설계와 유전 변이 탐색에 해당 장비를 활용한다.
이시은 IT과학부 기자
월스트리트저널(WSJ) 등 외신에 따르면 메타는 최근 ‘AI 리서치 슈퍼클러스터(RSC)’ 개발 내역을 공개했다. RSC는 AI 개발에 쓰이는 슈퍼컴퓨터다. 메타는 이날 공식 블로그를 통해 “차세대 첨단 AI를 개발하기 위해선 강력한 새 컴퓨터가 필요하다”며 “올해 중반 RSC가 완전히 구축되면 세계에서 가장 빠른 AI 슈퍼컴퓨터가 될 것”이라고 강조했다. 목표는 1초에 500경 번 연산 처리가 가능한 5엑사플롭스급 성능 구현이다. 현재 글로벌 성능 1위 슈퍼컴퓨터로 알려진 ‘후가쿠’ 연산 속도는 1초당 44경2010조 번이다.
메타는 2017년 엔비디아 ‘V100 텐서 코어’ 그래픽처리장치(GPU) 2만2000개로 1세대 슈퍼컴퓨터 인프라를 구축했다. RSC는 해당 장치에 비해 컴퓨터비전 관련 학습을 최대 20배 더 빠르게 처리할 수 있다. 대규모 자연어처리(NLP) 훈련도 3배 빠르게 가능하다. 올해 말에는 매개 변수 1조 개가 넘는 AI 모델을 훈련시킨다는 계획도 갖고 있다. 메타 측은 “RSC가 서로 다른 언어를 사용하는 대규모 집단에게 실시간 음성 통역을 지원하거나 증강현실(AR) 게임 개발 등 새로운 AI 시스템을 구축하는데 쓰일 것”이라고 밝혔다.
새로운 AI 슈퍼컴퓨터엔 엔비디아 ‘A100’ GPU 1만6000개와 AMD의 ‘에픽롬 772’ 프로세서 4000개가 탑재될 전망이다. 글로벌 스토리지 전문 업체 퓨어스토리지 솔루션과 리눅스 전문업체 펭귄컴퓨팅 노하우도 투입된다. 현재까지는 1단계 작업이 완료됐으며 AI 100 GPU 6080개가 탑재된 상태다. 마크 저커버그 메타 최고경영자(CEO)는 “RSC는 수조 개의 데이터를 학습하고, 수백 개의 언어를 이해할 수 있는 새로운 AI 모델을 가능하게 할 것”이라고 전했다. 빅테크들의 AI 슈퍼컴퓨터 경쟁은 절정으로 치닫고 있다. MS는 초거대 언어 모델 ‘GPT-3’ 개발사인 오픈AI와 협력해 슈퍼컴퓨터를 구축해 운영하고 있다. 28만5000개 이상 중앙처리장치(CPU)와 1만 개 이상 GPU를 탑재했으며, 초당 2경 번 이상 연산이 가능할 것으로 추산된다. MS 클라우드 서비스인 애저를 기반으로 구축된 것이 특징이다. 해당 슈퍼컴퓨터는 오픈AI에 독점적으로 공급되고 있다. MS는 2019년 오픈AI에 약 10억달러(1조 2000억원)를 출자한 기업이기도 하다.
엔비디아는 슈퍼컴퓨터 개발에서 선두주자를 자처한다. 엔비디아에 따르면, 전 세계 ‘TOP 500’ 슈퍼컴퓨터 중 136개 인프라에 엔비디아 GPU가 들어가 있다. 연산 능력 상위 20위에는 엔비디아가 자체 개발한 슈퍼컴퓨터 3대도 포함된다는 설명이다. 주로 AI 및 자율주행 차량 개발 등에 활용되는 기기들이다. 외부와의 협력도 발 빠르다. 지난해 엔비디아는 영국에서 가장 빠른 AI 슈퍼컴퓨터 ‘캠브리지-1’ 가동을 시작했다. 투입한 자금은 약 1억달러(1200억원)에 이른다. 아스트라제네카, 글락소스미스클라인, 옥스포드 나노포어 등 의료 분야 기업이 AI 기반 신약 설계와 유전 변이 탐색에 해당 장비를 활용한다.
이시은 IT과학부 기자