인공지능(AI)의 기계학습(머신러닝) 정확도를 높이는 연구 결과가 발표됐다. 인공지능도 인간처럼 추론하는 능력을 향상한 것. 실제 인간을 대하듯 따뜻한 조언을 한마디 추가한 게 전부였다. AI 연구계에선 이번 연구가 특이점이 될 수 있다는 전망이 나온다.

일본 도쿄대학과 구글 브레인팀은 지난 24일(현지시간) 새로운 인공지능 머신러닝 학습법을 연구한 논문인 ‘제로샷 추론이 가능한 대형언어모델(Large Language Model are Zero-shot Reasoner)’을 발표했다.

구글과 도쿄대 연구진이 고안한 방식은 단순하다. 기존의 거대언어모델(LLM) 머신러닝 모델에 “차근차근 생각해보자(Let's Think Step by Step)”라는 명령어 한 줄을 추가한 게 전부였다. 명령어를 추가한 뒤 성과 측정을 시행했다.
구글 브렌인팀-일본 도쿄대 공동연구 논문 'Large Language Model are Zero-shot Reasoner'의 연구 결과 중 일부. 자료=아카이브(arxiv)
구글 브렌인팀-일본 도쿄대 공동연구 논문 'Large Language Model are Zero-shot Reasoner'의 연구 결과 중 일부. 자료=아카이브(arxiv)
결과는 놀라웠다. 연구진에 따르면 차근차근 생각하라는 조언을 들은 AI가 성능이 4배 이상 향상됐다. 언어추론 벤치마크인 'Multi-artith' 기준으로 답변 정확도가 기존 17.7%에서 78.7%로 올랐다. 수학 문제 처리 벤치마크인 'GSM8K' 기준으로도 기존 10.4%에서 40.7%로 성능이 제고됐다.
구글 브렌인팀-일본 도쿄대 공동연구 논문 'Large Language Model are Zero-shot Reasoner'의 연구 결과 중 일부.
구글 브렌인팀-일본 도쿄대 공동연구 논문 'Large Language Model are Zero-shot Reasoner'의 연구 결과 중 일부. "차근차근 생각해보자"라는 명령어를 입력할 때 정확도(78.7%)가 가장 높았다. 자료=아카이브(arxiv)
연구진들이 기본으로 활용한 제로샷(Zero Shot)은 인공지능에 직접 데이터를 입력하지 않아도 스스로 유추(Reasoning)할 수 있는 모델을 일컫는다. 구글이 2015년 구글 번역기에 도입하며 인공지능 개발자들에게 화제가 됐다. 모든 언어에 존재하는 교집합을 찾아내 인공지능이 해답을 유추하게 이끄는 방식이었다. 충분히 학습된 AI가 스스로 의미를 발견하고 패턴을 분석해 답을 찾는 길이 트인 것이다.

제로샷을 활용하면 인공지능이 뱀에 관한 데이터가 없어도 뱀을 생각할 수 있다. ‘길이가 길고 다리가 없는데 비늘이 있는 동물’이라고 질문을 하면 뱀을 찾아낸다. AI가 이미 학습된 데이터를 바탕으로 카테고리를 형성한 뒤 의미를 이해해서다. 소나타, 아반테 등 각 차량의 데이터를 주입하지 않아도 승용차라는 사실을 미리 알아낼 수 있게 됐다.

행동경제학에서 착안한 기계학습 방식이다. 2002년 노벨경제학상을 수상한 대니얼 카너먼 프린스턴대 명예교수가 2011년 발간한 ‘생각에 관한 생각(Thinking, Fast and Slow)’에 나온 아이디어를 활용한 것. 카너먼 교수는 인간이 ‘빠른 직관’과 ‘느린 이성’을 두 가지 방식으로 사고한다고 설명했다. 머신러닝 연구자들은 커너먼 교수가 착안한 사고의 이분법을 바탕으로 인공지능이 직관적으로 추론할 수 있는 학습법을 개발하기 시작했다.

스스로 추리하는 인공지능 개발이 가속화될 전망이다. 아직 추가 검증이 필요하지만 인공지능 연구의 특이점이 찾아냈다는 기대감이 증폭됐다. 도쿄대 연구진은 “이번 연구를 통해 간단한 명령어가 AI의 인지능력을 향상했다는 사실을 찾아냈다”며 “아직 개척되지 않은 제로샷 모델이 무궁무진하다는 사실을 암시한다”고 설명했다.

캐나다의 인공지능 전문 매체인 싱크드는 “복잡하고 고도화된 문제를 해결하는 데 제로샷 모델이 유용하다는 걸 입증했다”며 “AI 연구진들에겐 완벽한 제로샷 모델을 개발하는 원동력이 될 것”이라고 전망했다.

오현우 기자 ohw@hankyung.