'챗GPT' 수능 국어 풀었더니…1년 만에 '대반전' 일어났다
-
기사 스크랩
-
공유
-
댓글
-
클린뷰
-
프린트
챗GPT, 무서운 성장…수능 국어 '만점'
AI 성능 향상 '가속페달'
작년 16점에서 급격한 개선
"LLM, 영어 넘어 한국어도 마스터"
메타·아마존·구글 실력도 껑충
토종 AI 기업 "빅테크 개발 속도
너무 빨라 따라가기 어려울 정도"
범용 AI 넘어 초지능 시대 '성큼'
인류 최대 위협으로 급부상
AI 성능 향상 '가속페달'
작년 16점에서 급격한 개선
"LLM, 영어 넘어 한국어도 마스터"
메타·아마존·구글 실력도 껑충
토종 AI 기업 "빅테크 개발 속도
너무 빨라 따라가기 어려울 정도"
범용 AI 넘어 초지능 시대 '성큼'
인류 최대 위협으로 급부상
오픈AI의 대규모언어모델(LLM)이 하루가 다르게 똑똑해졌다. 올해 대학수학능력시험 국어 영역 테스트에선 처음으로 만점이 나왔다. 영어 데이터를 주로 학습한 LLM이지만 다양한 언어 구사력과 추론 능력도 뛰어나 한국어 실력도 크게 향상됐다는 분석이다.
업계에선 무엇보다 AI의 성능 향상 속도에 주목하고 있다. 마커AI에 따르면 2025학년도 수능 국어 영역을 기준으로 2023년 11월에 나온 ‘GPT-3.5 터보’ 모델은 16점을 득점하는 데 그쳤다. 지난 5월 출시된 ‘GPT-4o’ 모델은 75점까지 성적을 높였다. 이달 초 나온 o1 모델이 만점을 받으면서 챗GPT는 1년 만에 한국어 열등생에서 우등생 대열에 합류했다. 수능 등급으로 따지면 8등급이 1등급이 된 셈이다.
최근 오픈AI뿐만 아니라 다른 해외 AI 기업의 AI 수준도 급격히 높아졌다. 오픈AI는 5일부터 주말을 제외하고 12일 연속으로 AI 관련 새로운 내용을 발표하고 있다. 메타도 6일 차세대 LLM인 ‘라마 3.3 70B’를 발표했다. 5일에는 아마존웹서비스(AWS)가 생성형 AI 모델 노바를 선보였다. 구글은 12일 차세대 AI 비서 ‘제미나이 2.0 플래시’를 공개했다. AI 스타트업 달파의 김도균 대표는 “오픈AI 등 해외 빅테크 기업의 AI 개발 속도가 너무 빨라 차별성을 가진 AI 서비스를 개발하기 어려워졌다”고 말했다.
이미 일부 빅테크 기업의 AI는 AGI 수준에 다다랐다는 분석도 나온다. 이번에 오픈AI가 내놓은 o1 등이 여기에 해당한다. 최근 오픈AI는 AGI를 달성할 경우 마이크로소프트(MS)도 이를 이용할 수 있도록 하는 방안을 논의 중이다. 앞서 오픈AI는 MS와의 기존 계약에서 ‘AGI의 상업적 및 지식재산권(IP) 라이선스 제외’ 조항을 뒀다. 애초 오픈AI가 비영리 목적으로 설립됐기 때문에 AGI가 상업적 목적으로 오용되는 것을 막기 위해서다. 하지만 오픈AI가 MS의 투자를 계속 받기 위해 관련 규정 삭제를 추진 중인 것으로 알려졌다.
AGI와 ASI가 인류의 위협이 될 것이라는 우려도 커지고 있다. 올해 노벨 물리학상 수상자인 제프리 힌턴 캐나다 토론토대 교수는 10일 노벨상 시상식에서 “예전에는 ASI 개발 시기가 훨씬 더 늦을 것이라고 생각했지만 최근의 개발 속도를 보면 5∼20년이면 될 것 같다”며 “AI에 대한 통제력을 유지할 수 있을지 걱정해야 한다”고 지적했다.
김주완 기자 kjwan@hankyung.com
1년 만에 8등급→1등급
15일 업계에 따르면 오픈AI가 지난 5일 정식 출시한 인공지능(AI) 챗봇 ‘챗GPT’의 ‘o1’이 2025학년도 수능 국어 영역에서 모든 문제에 정답을 내놨다. 국내 AI 기업 마커AI는 지난달 o1의 이전 모델인 ‘o1-프리뷰’로 시험한 결과 8번(홀수형 기준)만 틀리고 모두 맞혔다는 분석을 공개했다. o1-프리뷰 모델이 유일하게 틀린 문제는 수험생의 이번 수능 문제 중 오답률(81.5%)이 가장 높았다. 하지만 한국경제신문이 최신 o1 모델의 챗GPT에 해당 문제를 입력했더니 정답을 찾아냈다. o1-프리뷰 모델을 분석한 마커AI의 진민성 연구원은 관련 블로그에 “LLM의 한국어 언어 능력이 인간을 뛰어넘을 시기가 머지않았음을 보여준다”고 설명했다.업계에선 무엇보다 AI의 성능 향상 속도에 주목하고 있다. 마커AI에 따르면 2025학년도 수능 국어 영역을 기준으로 2023년 11월에 나온 ‘GPT-3.5 터보’ 모델은 16점을 득점하는 데 그쳤다. 지난 5월 출시된 ‘GPT-4o’ 모델은 75점까지 성적을 높였다. 이달 초 나온 o1 모델이 만점을 받으면서 챗GPT는 1년 만에 한국어 열등생에서 우등생 대열에 합류했다. 수능 등급으로 따지면 8등급이 1등급이 된 셈이다.
최근 오픈AI뿐만 아니라 다른 해외 AI 기업의 AI 수준도 급격히 높아졌다. 오픈AI는 5일부터 주말을 제외하고 12일 연속으로 AI 관련 새로운 내용을 발표하고 있다. 메타도 6일 차세대 LLM인 ‘라마 3.3 70B’를 발표했다. 5일에는 아마존웹서비스(AWS)가 생성형 AI 모델 노바를 선보였다. 구글은 12일 차세대 AI 비서 ‘제미나이 2.0 플래시’를 공개했다. AI 스타트업 달파의 김도균 대표는 “오픈AI 등 해외 빅테크 기업의 AI 개발 속도가 너무 빨라 차별성을 가진 AI 서비스를 개발하기 어려워졌다”고 말했다.
“인간을 뛰어넘는 AI 초읽기”
업계에선 지금 같은 추세라면 초인공지능(ASI·Artificial Super Intelligence)이 등장할 수 있다는 분석이 나온다. ASI는 인간을 능가하는 역량을 갖춘 AI를 뜻하는 말이다. 최근까지 업계에서 논란이 된 일반인공지능(AGI·Artificial General Intelligence)보다 한 단계 더 발전한 AI를 뜻하는 말이다. AGI는 인간 수준의 지적 능력을 갖춘 AI를 일컫는다.이미 일부 빅테크 기업의 AI는 AGI 수준에 다다랐다는 분석도 나온다. 이번에 오픈AI가 내놓은 o1 등이 여기에 해당한다. 최근 오픈AI는 AGI를 달성할 경우 마이크로소프트(MS)도 이를 이용할 수 있도록 하는 방안을 논의 중이다. 앞서 오픈AI는 MS와의 기존 계약에서 ‘AGI의 상업적 및 지식재산권(IP) 라이선스 제외’ 조항을 뒀다. 애초 오픈AI가 비영리 목적으로 설립됐기 때문에 AGI가 상업적 목적으로 오용되는 것을 막기 위해서다. 하지만 오픈AI가 MS의 투자를 계속 받기 위해 관련 규정 삭제를 추진 중인 것으로 알려졌다.
AGI와 ASI가 인류의 위협이 될 것이라는 우려도 커지고 있다. 올해 노벨 물리학상 수상자인 제프리 힌턴 캐나다 토론토대 교수는 10일 노벨상 시상식에서 “예전에는 ASI 개발 시기가 훨씬 더 늦을 것이라고 생각했지만 최근의 개발 속도를 보면 5∼20년이면 될 것 같다”며 “AI에 대한 통제력을 유지할 수 있을지 걱정해야 한다”고 지적했다.
김주완 기자 kjwan@hankyung.com