AI 반도체 스타트업 하이퍼엑셀, 고성능 생성AI 전용 서버 오리온 출시

김주완 기자

입력2023.11.03 09:53 수정2023.11.03 09:53

챗GPT에 사용되는 GPU보다 두 배 이상 고성능

인공지능(AI) 반도체 스타트업 하이퍼엑셀이 고성능 서버 제품 오리온을 출시했다고 3일 밝혔다. 챗GPT 등에 사용되는 기존 고성능 GPU(그래픽처리장치)보다 두 배 이상으로 가격과 성능에서 뛰어난 제품이다.

하이퍼엑셀은 초거대 AI에 특화된 반도체 프로세서 'LPU(Latency Processing Unit)'을 개발했다. 자사의 LPU를 8개 탑재해 오리온 서버 제품을 이번에 출시했다.

오리온 서버는 오픈AI의 거애언어모델(LLM)' GPT와 메타의 라마 등 LLM을 효율적으로 수행할 수 있다. 서버당 최대 66B(매개변수 660억개) 크기의 모델까지 처리 가능하다. 특허 출원 중인 모델 병렬화 기술 및 확장 네트워크 기술을 활용해 기존 GPU 플랫폼과 다르게 가속기 개수에 비례해 성능이 좋아지는 확장성을 보여준다고 회사 측은 설명했다.

오리온은 메타의 최신 모델인 라마2 7B 모델의 기준 초당 174 토큰, OPT 66B 모델 기준 초당 23 토큰 등 실시간 토큰 생성이 가능하다. 김주영 하이퍼엑셀 대표는 “최근 공급망 문제와 높은 비용 문제를 가지고 있는 GPU 서버를 하이퍼엑셀 오리온 서버가 앞으로 대체할 것”이라고 밝혔다. GPU 서버 대비 낮은 가격과 높은 전력 효율성으로 데이터센터 운영비용을 획기적으로 낮출 것이라고 회사 측은 전망했다.

하이퍼엑셀은 김주영 KAIST 전기및전자공학부 교수가 2023년 1월에 창업한 스타트업이다. 지난 7월 트랜스포머 기반 거대 언어 모델에 특화된 AI 반도체인 LPU를 개발했다. LPU는 거대 언어 모델 연산에서 가장 중요한 메모리 대역폭 사용을 극대화했다. 모델 연산에 특화된 매트릭스와 벡터 엔진 로직을 집적했다. LLM 다수를 LPU로 효율적으로 분산할 수 있는 모델 병렬화 기술과 LPU 간의 데이터 동기화를 위한 자체 네트워킹 기술도 개발했다.

김주완 기자 kjwan@hankyung.com

관련 뉴스

1

창업자가 본 올해 스타트업 생태계는 46점... 지난해 比 7점 떨어져[Geeks' Briefing]

한국경제신문의 프리미엄 스타트업 미디어 플랫폼 긱스(Geeks)가 2일 스타트업 뉴스를 브리핑합니다.창업자가 본 올해 스타트업 생태계는 '46점'스타트업얼라이언스와 오픈서베이가 '스타트업 트렌드...
2

"대량 해고 목격했어요"…스타트업 직원 만족도 하락한 까닭 [긱스]

창업자들은 최근 스타트업 생태계에 대해 100점 만점에 46.5점을 준 것으로 나타났다. 2021년엔 같은 설문에서 79점, 2022년엔 53.7점이었다. 2014년 첫 조사 이후 50점을 밑돈 것은 이번이...
3

"엔비디아 GPU보다 빠른 AI칩"…하이퍼엑셀, 60억 투자유치 성공 [긱스]

챗GPT와 같은 생성형 인공지능(AI) 수요가 늘어나면서 이 기술에 들어가는 비용을 낮출 수 있는 특화 반도체에 벤처캐피털(VC)들의 관심이 커지고 있다. 30일 VC업계에 따르면 AI 스타트업 하이퍼엑셀은 미래에셋...