카카오브레인, 국내 최대 수준 딥러닝 전용 슈퍼컴퓨팅 인프라 도입
-
기사 스크랩
-
공유
-
댓글
-
클린뷰
-
프린트
1엑사 플롭스 뛰어넘는 국내 최대 규모 수준의 딥러닝 인프라 구축
한국어 초거대 언어모델 ‘KoGPT’ 성능 100배 향상 목표
한국어 초거대 언어모델 ‘KoGPT’ 성능 100배 향상 목표
카카오브레인(대표 김일두)이 국내 최대 수준의 딥러닝 인프라를 도입해 최근 공개한 한국어 특화 초거대 AI 언어모델 ‘KoGPT’ 의 연구 효율을 100배 이상 높인다.
‘KoGPT’는 Open AI의 언어 모델 ‘GPT-3’를 고도화한 한국어 특화 버전이다. △ 주어진 문장의 긍정과 부정 판단 △ 긴 문장 한줄 요약 △ 문장을 추론해 결론 예측 △ 질문을 하면 문맥 이해해 답변하는 등 언어를 가지고 활용할 수 있는 모든 언어 과제를 수행한다.
카카오브레인은 구글에서 개발한 텐서 처리 장치인 ‘구글 TPU’를 활용해 1엑사 플롭스(컴퓨터의 연산 속도 단위/초당 100경 연산처리)를 뛰어넘는 국내 최대 규모의 딥러닝 슈퍼컴퓨팅 인프라를 도입해 ‘KoGPT’에 적용한 AI 연구 효율을 기존 대비 100배 이상 높인다는 목표다.
‘구글 TPU’는 구글 클라우드에서 사용할 수 있는 대용량 연산 인프라로 데이터를 빠르게 계산하고 가공할 수 있는 장치다. GPU(Graphic Processing Unit, 3D 그래픽 연산을 위한 전용 프로세서)를 여러 대 컴퓨터에 분할해 설치/사용하지 않고, GPU보다 빠르고 복잡한 연산을 갖춘 상위 시스템을 슈퍼컴퓨터 한 대에 구축해 활용한다.
높은 연산 처리 성능으로 AI 연구모델 연산 속도를 획기적으로 향상시킬 수 있고, 클라우드 방식을 활용함으로써 다수의 연구자들이 유연하게 시스템에 접속/사용이 가능해 연구 효율을 높일 것으로 기대된다.
카카오브레인 김일두 대표는 “‘KoGPT’를 비롯한 언어모델을 비롯해 향후 공개할 비전 모델 등 초거대 AI의 다양한 모델에 슈퍼컴퓨터를 활용함으로써 연구 효율을 크게 높일 것으로 기대된다" 며 "다양한 언어 모델을 준비해 오픈 소스화함으로써 국내외 AI 생태계를 구축하는데 기여하고자 한다” 고 밝혔다.
‘KoGPT’는 Open AI의 언어 모델 ‘GPT-3’를 고도화한 한국어 특화 버전이다. △ 주어진 문장의 긍정과 부정 판단 △ 긴 문장 한줄 요약 △ 문장을 추론해 결론 예측 △ 질문을 하면 문맥 이해해 답변하는 등 언어를 가지고 활용할 수 있는 모든 언어 과제를 수행한다.
카카오브레인은 구글에서 개발한 텐서 처리 장치인 ‘구글 TPU’를 활용해 1엑사 플롭스(컴퓨터의 연산 속도 단위/초당 100경 연산처리)를 뛰어넘는 국내 최대 규모의 딥러닝 슈퍼컴퓨팅 인프라를 도입해 ‘KoGPT’에 적용한 AI 연구 효율을 기존 대비 100배 이상 높인다는 목표다.
‘구글 TPU’는 구글 클라우드에서 사용할 수 있는 대용량 연산 인프라로 데이터를 빠르게 계산하고 가공할 수 있는 장치다. GPU(Graphic Processing Unit, 3D 그래픽 연산을 위한 전용 프로세서)를 여러 대 컴퓨터에 분할해 설치/사용하지 않고, GPU보다 빠르고 복잡한 연산을 갖춘 상위 시스템을 슈퍼컴퓨터 한 대에 구축해 활용한다.
높은 연산 처리 성능으로 AI 연구모델 연산 속도를 획기적으로 향상시킬 수 있고, 클라우드 방식을 활용함으로써 다수의 연구자들이 유연하게 시스템에 접속/사용이 가능해 연구 효율을 높일 것으로 기대된다.
카카오브레인 김일두 대표는 “‘KoGPT’를 비롯한 언어모델을 비롯해 향후 공개할 비전 모델 등 초거대 AI의 다양한 모델에 슈퍼컴퓨터를 활용함으로써 연구 효율을 크게 높일 것으로 기대된다" 며 "다양한 언어 모델을 준비해 오픈 소스화함으로써 국내외 AI 생태계를 구축하는데 기여하고자 한다” 고 밝혔다.