초거대 AI 언어모델, 미지의 영역 '수학 문제' 풀어준다
-
기사 스크랩
-
공유
-
댓글
-
클린뷰
-
프린트
구글 NLP 신경망 '미네르바' 공개
방대한 학습으로 양적추론 가능
학부생 수준의 수학 문제 해결
방대한 학습으로 양적추론 가능
학부생 수준의 수학 문제 해결
각종 수학 문제를 손쉽게 풀어내는 초거대 언어모델이 개발됐다. 언어모델이 인간의 언어를 이해하고 처리하는 자연어처리(NLP) 분야를 넘어 미지의 영역으로 평가받던 양적추론(Quantitative Reasoning)까지 가능해졌다는 평가가 나온다.
11일 정보기술(IT)업계에 따르면 구글은 최근 자사 블로그를 통해 최신 초거대 언어모델 ‘PaLM(Pathways Language Model)’을 기반으로 한 NLP 신경망인 ‘미네르바(Minerva)’를 공개했다. 미네르바는 계산기와 같은 외부 도구에 의존하지 않고 수학 문제처럼 양적추론이 필요한 문제들을 해결한다. 양적추론이란 질문을 분석하고 이해하는 방식으로 단계별로 추론해 답을 찾아내는 과정을 뜻한다. 미네르바는 이런 과정을 자연어 처리 모델과 표준 수학 표기법을 결합해 해결했다는 게 구글의 설명이다.
미네르바는 지문을 보면 이를 이해한 뒤 문제를 단순화시킨 후 변수와 방정식을 설정해 문제를 풀어낸다. 이런 방식으로 학부생 수학 전공 수준의 문제까지 일정 수준의 정확도로 해결한다.
인공지능(AI)업계에선 미네르바처럼 AI와 머신러닝을 통해 수학 문제를 빠르게 풀어내는 사례가 없었다는 점을 주목해야 한다는 평가가 나온다. 수학 문제를 풀기 위해선 숫자를 인식하는 것은 기본이고 문장 분석, 수학 표기법, 공식 기호 등에 대한 이해도 필요하다. 주어진 데이터를 이해하고 이를 활용하는 과정도 복잡하다.
구글은 초거대 AI로 방대한 수학 사용 사례를 분석하는 방식으로 문제를 해결했다. 구글은 118GB(기가바이트)에 달하는 수학과 과학 분야 논문과 데이터를 머신러닝을 통해 미네르바에 학습시켰다. 미네르바의 기반이 된 PaLM은 구글이 지난 4월 선보인 초거대 언어모델로 현존 최고 성능을 자랑한다. 기존 대표 AI 언어모델인 오픈 AI의 GPT-3보다 약 세 배 큰 5400억 개 파라미터(매개변수)를 보유했다.
구글은 “언어모델과 머신러닝은 현대 과학 분야에서 가장 뛰어난 도구지만 대부분 언어 처리를 중심으로 활용 범위가 한정돼 있었다”며 “연구진과 학생들이 미네르바를 통해 수학은 물론 향후 과학, 천문학 등 다양한 분야에서도 새로운 기회를 창출할 수 있는 데 도움이 되길 바란다”고 말했다.
배성수 기자 baebae@hankyung.com
11일 정보기술(IT)업계에 따르면 구글은 최근 자사 블로그를 통해 최신 초거대 언어모델 ‘PaLM(Pathways Language Model)’을 기반으로 한 NLP 신경망인 ‘미네르바(Minerva)’를 공개했다. 미네르바는 계산기와 같은 외부 도구에 의존하지 않고 수학 문제처럼 양적추론이 필요한 문제들을 해결한다. 양적추론이란 질문을 분석하고 이해하는 방식으로 단계별로 추론해 답을 찾아내는 과정을 뜻한다. 미네르바는 이런 과정을 자연어 처리 모델과 표준 수학 표기법을 결합해 해결했다는 게 구글의 설명이다.
미네르바는 지문을 보면 이를 이해한 뒤 문제를 단순화시킨 후 변수와 방정식을 설정해 문제를 풀어낸다. 이런 방식으로 학부생 수학 전공 수준의 문제까지 일정 수준의 정확도로 해결한다.
인공지능(AI)업계에선 미네르바처럼 AI와 머신러닝을 통해 수학 문제를 빠르게 풀어내는 사례가 없었다는 점을 주목해야 한다는 평가가 나온다. 수학 문제를 풀기 위해선 숫자를 인식하는 것은 기본이고 문장 분석, 수학 표기법, 공식 기호 등에 대한 이해도 필요하다. 주어진 데이터를 이해하고 이를 활용하는 과정도 복잡하다.
구글은 초거대 AI로 방대한 수학 사용 사례를 분석하는 방식으로 문제를 해결했다. 구글은 118GB(기가바이트)에 달하는 수학과 과학 분야 논문과 데이터를 머신러닝을 통해 미네르바에 학습시켰다. 미네르바의 기반이 된 PaLM은 구글이 지난 4월 선보인 초거대 언어모델로 현존 최고 성능을 자랑한다. 기존 대표 AI 언어모델인 오픈 AI의 GPT-3보다 약 세 배 큰 5400억 개 파라미터(매개변수)를 보유했다.
구글은 “언어모델과 머신러닝은 현대 과학 분야에서 가장 뛰어난 도구지만 대부분 언어 처리를 중심으로 활용 범위가 한정돼 있었다”며 “연구진과 학생들이 미네르바를 통해 수학은 물론 향후 과학, 천문학 등 다양한 분야에서도 새로운 기회를 창출할 수 있는 데 도움이 되길 바란다”고 말했다.
배성수 기자 baebae@hankyung.com