한국어 초거대 언어모델 ‘KoGPT’ 성능 100배 향상 목표
‘KoGPT’는 Open AI의 언어 모델 ‘GPT-3’를 고도화한 한국어 특화 버전이다. △ 주어진 문장의 긍정과 부정 판단 △ 긴 문장 한줄 요약 △ 문장을 추론해 결론 예측 △ 질문을 하면 문맥 이해해 답변하는 등 언어를 가지고 활용할 수 있는 모든 언어 과제를 수행한다.
카카오브레인은 구글에서 개발한 텐서 처리 장치인 ‘구글 TPU’를 활용해 1엑사 플롭스(컴퓨터의 연산 속도 단위/초당 100경 연산처리)를 뛰어넘는 국내 최대 규모의 딥러닝 슈퍼컴퓨팅 인프라를 도입해 ‘KoGPT’에 적용한 AI 연구 효율을 기존 대비 100배 이상 높인다는 목표다.
‘구글 TPU’는 구글 클라우드에서 사용할 수 있는 대용량 연산 인프라로 데이터를 빠르게 계산하고 가공할 수 있는 장치다. GPU(Graphic Processing Unit, 3D 그래픽 연산을 위한 전용 프로세서)를 여러 대 컴퓨터에 분할해 설치/사용하지 않고, GPU보다 빠르고 복잡한 연산을 갖춘 상위 시스템을 슈퍼컴퓨터 한 대에 구축해 활용한다.
높은 연산 처리 성능으로 AI 연구모델 연산 속도를 획기적으로 향상시킬 수 있고, 클라우드 방식을 활용함으로써 다수의 연구자들이 유연하게 시스템에 접속/사용이 가능해 연구 효율을 높일 것으로 기대된다.
카카오브레인 김일두 대표는 “‘KoGPT’를 비롯한 언어모델을 비롯해 향후 공개할 비전 모델 등 초거대 AI의 다양한 모델에 슈퍼컴퓨터를 활용함으로써 연구 효율을 크게 높일 것으로 기대된다" 며 "다양한 언어 모델을 준비해 오픈 소스화함으로써 국내외 AI 생태계를 구축하는데 기여하고자 한다” 고 밝혔다.