말만 잘하던 AI…이젠 박사급 수학 문제까지 척척 푼다
-
기사 스크랩
-
공유
-
댓글
-
클린뷰
-
프린트
오픈AI, 새모델 'o1' 출격
취약했던 논증 기능도 강화
복잡한 수학·과학 영역 접근
대신 해법 찾는데 시간 걸려
'AGI 도전' 한걸음 더 다가서
취약했던 논증 기능도 강화
복잡한 수학·과학 영역 접근
대신 해법 찾는데 시간 걸려
'AGI 도전' 한걸음 더 다가서
오픈AI가 새롭게 내놓은 ‘오픈AI o1’의 가장 큰 특징은 ‘생각의 사슬’(chain of thought)이라는 이름이 붙은 논증(reasoning) 기능이다. 회사 측은 “대규모 강화학습 알고리즘은 훈련 과정에서 생각의 사슬을 사용해 모델에 생산적으로 사고하는 방법을 가르친다”며 “더 많은 강화학습과 더 많은 사고 시간에 따라 o1의 성능이 지속해서 향상되는 것을 확인했다”고 설명했다.
반면 논증 기능이 적용된 o1은 사람이 어려운 질문에 답하기 전 오랫동안 생각하는 것과 마찬가지로 답변을 위해 생각의 사슬을 사용한다. 까다로운 단계를 간단한 단계로 세분화하고, 현재의 접근 방식이 효과가 없을 때 다른 접근 방식을 시도한다.
예를 들어 “직우상 얻떤 번역깃돋 일끌 슈 없쥐많 한국인듦은 쉽게 앗랍볼 수 있는 한끌의 암혼화 방펍잇 잊댜. 몹음과 짜움위 따양한 편환우로 읨미는 윳이함면설 푯먼적읍롬 댜륵케 포위계 많둔는 빵씩잎타”라는 문장을 GPT-4o에 입력하면 1~2초 만에 “이 문장은 타이핑 오류가 많아 정확한 의미를 파악하기 어렵지만, 대략적인 내용은 한국어의 복잡한 음운 변화와 번역에 관한 주제일 가능성이 있습니다”라는 답이 나온다.
반면 같은 내용을 o1에 제시하면 약 20초 동안 내용 이해, 단어 분석, 복호화, 해결책 찾기 등의 과정을 거쳐 “지구상 어떤 번역기도 읽을 수 없지만 한국인들은 쉽게 알아볼 수 있는 한국의 암호화 방법이 있다. 모음과 자음의 다양한 변환으로 의미는 유지하면서 표면적으로 다르게 보이게 만드는 방식이다”라고 정확한 답을 내놓는다.
오픈AI는 논증 능력 덕분에 o1이 수학과 과학 분야에서 뛰어난 능력을 보였다고 설명했다. 미국 수학경시대회(AIME) 문제로 모델을 평가한 결과 GPT-4o는 12%의 문제만 풀었지만, o1은 83%를 기록했다. 오픈AI가 공개한 데모 영상에서 o1은 프롬프트만으로 게임을 프로그래밍하기도 했다. 물리학자들이 복잡한 수학 공식을 만들거나 의료 연구자들의 실험을 지원하는 데 o1을 효과적으로 활용할 수 있다는 것이다.
o1은 기본 모델 ‘o1-프리뷰’와 소형 모델 ‘o1-미니’ 두 종류로 출시됐다. o1-미니는 모델 크기가 작아 가격이 저렴한 대신 코딩에 적합하다. 챗GPT 유료 이용자는 12일(현지시간)부터 새 모델을 바로 써볼 수 있다. 아직 웹 검색이나 파일·이미지 업로드 같은 기능은 제공하지 않는다.
오픈AI는 o1을 기반으로 ‘인간보다 똑똑한 AI’라고 불리는 인공일반지능(AGI) 개발에 한 단계 더 나아간다는 계획이다. 오픈AI는 AI 능력을 수준에 따라 다섯 단계로 나누고 AGI를 AI 모델 5단계이자 최종 목표로 설정했다. 샘 올트먼 오픈AI 최고경영자(CEO)는 “o1은 새로운 패러다임”이라며 “복잡한 문제를 추론할 수 있는 AI 모델”이라고 말했다. 다만 “이 기술은 여전히 결함이 있고 제한적”이라며 AGI까지는 아직 더 많은 시간이 필요하다는 점을 시사했다.
AI 모델 개발 경쟁은 더욱 치열해질 전망이다. 오픈AI의 대항마로 꼽히는 구글과 앤스로픽도 논증 능력을 끌어올린 AI 모델 개발에 나서고 있다. 다만 아직 오픈AI의 독주 양상은 계속되고 있다. 오픈AI는 최근 65억달러(약 8조600억원) 규모의 자금 조달에 나섰다. 오픈AI에 계속 투자해온 마이크로소프트(MS)뿐 아니라 애플과 엔비디아도 오픈AI에 대한 참여를 검토 중인 것으로 알려졌다. 월스트리트저널(WSJ)에 따르면 아랍에미리트(UAE)의 한 국영 기업도 오픈AI에 투자하기 위해 협의하고 있다. 현재 오픈AI의 기업가치는 1500억달러(약 200조원) 수준으로 평가받는다.
이승우 기자/실리콘밸리=송영찬 특파원 leeswoo@hankyung.com
○“사람처럼 숙고”
트랜스포머 알고리즘을 적용한 생성형 인공지능(AI)은 기본적으로 대규모 데이터를 학습한 뒤 질문과 가장 연관성이 높은 단어를 차례대로 추론(inference)해 내놓는다. 실제 사실 여부를 따지기보다는 연관성을 찾기 때문에 사실이 아닌 내용을 뻔뻔하게 내놓는 ‘환각 현상’에서 자유로울 수 없다.반면 논증 기능이 적용된 o1은 사람이 어려운 질문에 답하기 전 오랫동안 생각하는 것과 마찬가지로 답변을 위해 생각의 사슬을 사용한다. 까다로운 단계를 간단한 단계로 세분화하고, 현재의 접근 방식이 효과가 없을 때 다른 접근 방식을 시도한다.
예를 들어 “직우상 얻떤 번역깃돋 일끌 슈 없쥐많 한국인듦은 쉽게 앗랍볼 수 있는 한끌의 암혼화 방펍잇 잊댜. 몹음과 짜움위 따양한 편환우로 읨미는 윳이함면설 푯먼적읍롬 댜륵케 포위계 많둔는 빵씩잎타”라는 문장을 GPT-4o에 입력하면 1~2초 만에 “이 문장은 타이핑 오류가 많아 정확한 의미를 파악하기 어렵지만, 대략적인 내용은 한국어의 복잡한 음운 변화와 번역에 관한 주제일 가능성이 있습니다”라는 답이 나온다.
반면 같은 내용을 o1에 제시하면 약 20초 동안 내용 이해, 단어 분석, 복호화, 해결책 찾기 등의 과정을 거쳐 “지구상 어떤 번역기도 읽을 수 없지만 한국인들은 쉽게 알아볼 수 있는 한국의 암호화 방법이 있다. 모음과 자음의 다양한 변환으로 의미는 유지하면서 표면적으로 다르게 보이게 만드는 방식이다”라고 정확한 답을 내놓는다.
오픈AI는 논증 능력 덕분에 o1이 수학과 과학 분야에서 뛰어난 능력을 보였다고 설명했다. 미국 수학경시대회(AIME) 문제로 모델을 평가한 결과 GPT-4o는 12%의 문제만 풀었지만, o1은 83%를 기록했다. 오픈AI가 공개한 데모 영상에서 o1은 프롬프트만으로 게임을 프로그래밍하기도 했다. 물리학자들이 복잡한 수학 공식을 만들거나 의료 연구자들의 실험을 지원하는 데 o1을 효과적으로 활용할 수 있다는 것이다.
o1은 기본 모델 ‘o1-프리뷰’와 소형 모델 ‘o1-미니’ 두 종류로 출시됐다. o1-미니는 모델 크기가 작아 가격이 저렴한 대신 코딩에 적합하다. 챗GPT 유료 이용자는 12일(현지시간)부터 새 모델을 바로 써볼 수 있다. 아직 웹 검색이나 파일·이미지 업로드 같은 기능은 제공하지 않는다.
○치열해지는 AGI 경쟁
o1처럼 논증 기능이 발전하면 생성형 AI가 단순히 답변을 주는 수준을 넘어 명령에 필요한 업무를 수행하는 ‘AI 에이전트’로 진화할 수 있다. 지금은 “휴가 계획을 세워줘”라고 입력하면 추천하는 여행지와 가볼 만한 곳을 알려주는 정도에 그치지만 AI 에이전트가 되면 비행기 표 예매와 호텔 예약 같은 업무까지 알아서 할 수 있다.오픈AI는 o1을 기반으로 ‘인간보다 똑똑한 AI’라고 불리는 인공일반지능(AGI) 개발에 한 단계 더 나아간다는 계획이다. 오픈AI는 AI 능력을 수준에 따라 다섯 단계로 나누고 AGI를 AI 모델 5단계이자 최종 목표로 설정했다. 샘 올트먼 오픈AI 최고경영자(CEO)는 “o1은 새로운 패러다임”이라며 “복잡한 문제를 추론할 수 있는 AI 모델”이라고 말했다. 다만 “이 기술은 여전히 결함이 있고 제한적”이라며 AGI까지는 아직 더 많은 시간이 필요하다는 점을 시사했다.
AI 모델 개발 경쟁은 더욱 치열해질 전망이다. 오픈AI의 대항마로 꼽히는 구글과 앤스로픽도 논증 능력을 끌어올린 AI 모델 개발에 나서고 있다. 다만 아직 오픈AI의 독주 양상은 계속되고 있다. 오픈AI는 최근 65억달러(약 8조600억원) 규모의 자금 조달에 나섰다. 오픈AI에 계속 투자해온 마이크로소프트(MS)뿐 아니라 애플과 엔비디아도 오픈AI에 대한 참여를 검토 중인 것으로 알려졌다. 월스트리트저널(WSJ)에 따르면 아랍에미리트(UAE)의 한 국영 기업도 오픈AI에 투자하기 위해 협의하고 있다. 현재 오픈AI의 기업가치는 1500억달러(약 200조원) 수준으로 평가받는다.
이승우 기자/실리콘밸리=송영찬 특파원 leeswoo@hankyung.com