[숫자로 읽는 교육·경제] 챗GPT, 무서운 성장…수능 국어 '만점'
입력
수정
지면S3
생각하기와 글쓰기오픈AI의 대규모언어모델(LLM)이 하루가 다르게 똑똑해졌다. 올해 대학수학능력시험 국어 영역에선 처음으로 만점이 나왔다. 영어 데이터를 주로 학습한 LLM이지만 다양한 언어 구사력과 추론 능력이 뛰어나 한국어 실력도 크게 향상됐다는 분석이다.
작년 16점서 괄목할 만한 개선
"LLM, 영어 넘어 한국어도 마스터"
15일 업계에 따르면 오픈AI가 지난 5일 정식 출시한 인공지능(AI) 챗봇 ‘챗GPT’의 ‘o1’이 2025학년도 수능 국어 영역에서 모든 문제에 정답을 내놨다. 국내 AI 기업 마커AI는 지난달 이전 모델인 ‘o1-프리뷰’로 시험한 결과 8번(홀수형 기준)만 틀리고 모두 맞혔다는 분석을 공개했다. o1-프리뷰 모델이 유일하게 틀린 문제는 이번 수능 문제 중 오답률(81.5%)이 가장 높았다. 하지만 한국경제신문이 최신 o1 모델의 챗GPT에 해당 문제를 입력했더니 정답을 찾아냈다. o1-프리뷰 모델을 분석한 진민성 마커AI 연구원은 블로그에 “LLM의 한국어 언어 능력이 인간을 뛰어넘을 시기가 머지않았음을 보여준다”고 설명했다. 업계에선 무엇보다 AI의 성능 향상 속도에 주목하고 있다. 마커AI에 따르면 2025학년도 수능 국어 영역을 기준으로 2023년 11월에 나온 ‘GPT-3.5 터보’ 모델은 16점을 얻는 데 그쳤다. 지난 5월 출시된 ‘GPT-4o’ 모델은 75점까지 성적을 높였다. 이달 초 나온 o1 모델이 만점을 받으면서 챗GPT는 1년 만에 한국어 열등생에서 우등생 대열에 합류했다. 수능 등급으로 따지면 8등급이 1등급이 된 셈이다.최근 오픈AI뿐 아니라 다른 해외 AI 기업의 AI 수준도 급격히 높아졌다. 오픈AI는 5일부터 주말을 제외하고 12일 연속으로 AI 관련 새로운 내용을 발표하고 있다. 메타도 6일 차세대 LLM인 ‘라마 3.3 70B’를 발표했다. 5일에는 아마존웹서비스(AWS)가 생성형 AI 모델 ‘노바’를 선보였다. 구글은 12일 차세대 AI 비서 ‘제미나이 2.0 플래시’를 공개했다. AI 스타트업 달파의 김도균 대표는 “오픈AI 등 해외 빅테크 기업의 AI 개발 속도가 너무 빨라 차별성 있는 AI 서비스를 개발하기 어려워졌다”고 말했다.
김주완 한국경제신문 기자