사람처럼 사고하는 AI 나왔다…수학문제, 프로그래밍도 '척척'
-
기사 스크랩
-
공유
-
댓글
-
클린뷰
-
프린트
논증 능력 특화한 '오픈AI o1' 출시
'생각의 사슬' 활용한 분석력 강화
뒤틀린 한국어 문장도 영어로 번역
내용 이해 등 해법에 다소 시간 걸려
수학·과학분야에서 뛰어난 능력
美 수학경시대회 문제 83% 맞춰
구글·앤스로픽 등도 AI모델 박차
'생각의 사슬' 활용한 분석력 강화
뒤틀린 한국어 문장도 영어로 번역
내용 이해 등 해법에 다소 시간 걸려
수학·과학분야에서 뛰어난 능력
美 수학경시대회 문제 83% 맞춰
구글·앤스로픽 등도 AI모델 박차
오픈AI가 ‘생각의 사슬(chain of thought)’이라는 이름이 붙은 논증(reasoning) 능력에 특화한 생성형 인공지능(AI) 모델 ‘오픈AI o1’을 출시했다. 기존 대규모언어모델(LLM) 기반 AI 모델의 약점으로 꼽힌 분석 능력을 대폭 향상했다.
o1은 사람이 어려운 질문에 답하기 전 오랫동안 생각하는 것과 마찬가지로 답변을 위해 생각의 사슬을 사용한다. 먼저 까다로운 단계를 간단한 단계로 세분화한다. 만일 접근 방식이 효과가 없으면 다른 접근 방식을 시도한다. 기존 GPT 모델처럼 트랜스포머 알고리즘을 적용한 생성형 AI 모델은 대규모 데이터를 학습한 뒤 질문과 가장 연관성이 높은 단어를 차례대로 추론하는 방식이다. 연관성을 찾는다는 특성 때문에 사실이 아닌 내용을 내놓는 ‘환각 현상’이 단점으로 꼽혀왔다.
오픈AI는 “대규모 강화학습 알고리즘은 훈련 과정에서 생각의 사슬을 사용해 모델에 생산적으로 사고하는 방법을 가르친다”며 “더 많은 강화학습과 더 많은 사고 시간에 따라 o1의 성능이 지속해서 향상되는 것을 확인했다”고 설명했다.
한국인들만 알아볼 수 있는 ‘뒤틀린 한국어’ 문장들도 영어로 번역한다. 오픈AI가 공개한 데모영상에서 o1은 “직우상 얻떤 번역깃돋 일끌 슈 없쥐많 한국인듦은 쉽게 앗랍볼 수 있는 한끌의 암혼화 방펍잇 잊댜. 몹음과 짜움위 따양한 편환우로 읨미는 윳이함면설 푯먼적읍롬 댜륵케 포위계 많둔는 빵씩잎타”라는 문장을 “지구상 어떤 번역기도 읽을 수 없지만 한국인들은 쉽게 알아볼 수 있는 한국의 암호화 방법이 있다. 모음과 자음의 다양한 변환으로 의미는 유지하면서 표면적으로 다르게 보이게 만드는 방식이다”라고 정확히 번역했다.
o1은 이 문장을 해석하기 위해 약 20초 동안 내용 이해, 단어 분석, 복호화, 해결책 찾기 등의 과정을 거친다. 반면 GPT-4o는 1~2초 만에 “이 문장은 타이핑 오류가 많아 정확한 의미를 파악하기 어렵지만, 대략적인 내용은 한국어의 복잡한 음운 변화와 번역에 관한 주제일 가능성이 있습니다”라는 답을 내놓는다.
오픈AI는 o1을 기반으로 ‘인간보다 똑똑한 AI’라고 불리는 인공일반지능(AGI) 개발에 한 단계 더 나아간다는 계획이다. 오픈AI는 AI 능력을 수준에 따라 다섯 단계로 나누고 AGI를 AI 모델 5단계이자 최종 목표로 설정했다. 샘 올트먼 오픈AI 최고경영자(CEO)는 “o1은 새로운 패러다임”이라며 “복잡한 문제를 추론할 수 있는 AI 모델”이라고 말했다. 다만 “이 기술은 여전히 결함이 있고 제한적”이라며 AGI까지는 아직 더 많은 시간이 필요하다는 점을 시사했다.
AI 모델 개발 경쟁은 더욱 치열해질 전망이다. 오픈AI의 대항마로 꼽히는 구글과 앤스로픽도 논증 능력을 끌어올린 AI 모델 개발에 나서고 있다. 다만 아직 오픈AI의 독주 양상은 계속되고 있다. 정보기술(IT) 전문매체 디인포메이션은 구글의 ‘제미나이’ 모델은 오픈AI 등 경쟁사에 비해 앱 개발자와 기업이 사용하기 어렵다는 평을 받고 있다고 보도했다.
실리콘밸리=송영찬 특파원 0full@hankyung.com
○‘생각의 사슬’ 활용
오픈AI는 지난 12일 그동안 ‘스트로베리’라는 이름의 프로젝트로 알려진 모델 o1을 출시했다. 기존 모델과 달리 GPT라는 용어를 쓰지 않았다. 복잡한 논증 작업이 추가된 점이 고려됐다. o1이라는 이름에는 카운터를 다시 1로 재설정했다는 뜻이 담겼다. 야쿱 파초키 오픈AI 수석과학자는 “문제를 생각하고 분석해 최선의 해답을 제시하는 모델”이라고 말했다.o1은 사람이 어려운 질문에 답하기 전 오랫동안 생각하는 것과 마찬가지로 답변을 위해 생각의 사슬을 사용한다. 먼저 까다로운 단계를 간단한 단계로 세분화한다. 만일 접근 방식이 효과가 없으면 다른 접근 방식을 시도한다. 기존 GPT 모델처럼 트랜스포머 알고리즘을 적용한 생성형 AI 모델은 대규모 데이터를 학습한 뒤 질문과 가장 연관성이 높은 단어를 차례대로 추론하는 방식이다. 연관성을 찾는다는 특성 때문에 사실이 아닌 내용을 내놓는 ‘환각 현상’이 단점으로 꼽혀왔다.
오픈AI는 “대규모 강화학습 알고리즘은 훈련 과정에서 생각의 사슬을 사용해 모델에 생산적으로 사고하는 방법을 가르친다”며 “더 많은 강화학습과 더 많은 사고 시간에 따라 o1의 성능이 지속해서 향상되는 것을 확인했다”고 설명했다.
한국인들만 알아볼 수 있는 ‘뒤틀린 한국어’ 문장들도 영어로 번역한다. 오픈AI가 공개한 데모영상에서 o1은 “직우상 얻떤 번역깃돋 일끌 슈 없쥐많 한국인듦은 쉽게 앗랍볼 수 있는 한끌의 암혼화 방펍잇 잊댜. 몹음과 짜움위 따양한 편환우로 읨미는 윳이함면설 푯먼적읍롬 댜륵케 포위계 많둔는 빵씩잎타”라는 문장을 “지구상 어떤 번역기도 읽을 수 없지만 한국인들은 쉽게 알아볼 수 있는 한국의 암호화 방법이 있다. 모음과 자음의 다양한 변환으로 의미는 유지하면서 표면적으로 다르게 보이게 만드는 방식이다”라고 정확히 번역했다.
o1은 이 문장을 해석하기 위해 약 20초 동안 내용 이해, 단어 분석, 복호화, 해결책 찾기 등의 과정을 거친다. 반면 GPT-4o는 1~2초 만에 “이 문장은 타이핑 오류가 많아 정확한 의미를 파악하기 어렵지만, 대략적인 내용은 한국어의 복잡한 음운 변화와 번역에 관한 주제일 가능성이 있습니다”라는 답을 내놓는다.
○수학·과학 분야에서 뛰어나
오픈AI에 따르면 o1은 수학과 과학 분야에서 뛰어난 능력을 보였다. 미국 수학경시대회(AIME) 문제로 모델을 평가한 결과 GPT-4o는 12%의 문제만 풀었지만, o1은 83%를 기록했다. 오픈AI가 공개한 데모 영상에서 o1은 프롬프트만으로 게임을 프로그래밍하기도 했다. 물리학자들이 복잡한 수학 공식을 만들거나 의료 연구자들의 실험을 지원하는 데 o1을 효과적으로 활용할 수 있다는 것이다.오픈AI는 o1을 기반으로 ‘인간보다 똑똑한 AI’라고 불리는 인공일반지능(AGI) 개발에 한 단계 더 나아간다는 계획이다. 오픈AI는 AI 능력을 수준에 따라 다섯 단계로 나누고 AGI를 AI 모델 5단계이자 최종 목표로 설정했다. 샘 올트먼 오픈AI 최고경영자(CEO)는 “o1은 새로운 패러다임”이라며 “복잡한 문제를 추론할 수 있는 AI 모델”이라고 말했다. 다만 “이 기술은 여전히 결함이 있고 제한적”이라며 AGI까지는 아직 더 많은 시간이 필요하다는 점을 시사했다.
AI 모델 개발 경쟁은 더욱 치열해질 전망이다. 오픈AI의 대항마로 꼽히는 구글과 앤스로픽도 논증 능력을 끌어올린 AI 모델 개발에 나서고 있다. 다만 아직 오픈AI의 독주 양상은 계속되고 있다. 정보기술(IT) 전문매체 디인포메이션은 구글의 ‘제미나이’ 모델은 오픈AI 등 경쟁사에 비해 앱 개발자와 기업이 사용하기 어렵다는 평을 받고 있다고 보도했다.
실리콘밸리=송영찬 특파원 0full@hankyung.com