AI에게 내 얼굴 보여주자…0.3초 만에 "좋은일 있어?"
입력
수정
지면A2
오픈AI 'GPT-4o' 공개챗GPT 개발사 오픈AI가 새로운 인공지능(AI) 모델과 챗봇을 내놨다. 사람처럼 보고 듣고 말하며 사용자와 실시간 대화를 할 수 있다. 업계에선 10여 년 전 개봉한 공상과학(SF) 영화 ‘그녀(Her)’에서 묘사한 ‘인격형 AI’가 현실화했다는 평가가 나온다. 오픈AI는 새로운 AI 모델을 무료 공개할 계획이다.
인간 수준으로 응답속도 높여
실시간 '보고 듣고 말하기' 가능
표정·말투로 기분 즉각 알아채
수학문제 푸는 모습 보여주자
선생님처럼 풀이방법 알려줘
한국어 등 50개 언어 실시간 통역
오픈AI는 13일(현지시간) 온라인으로 진행된 ‘스프링 업데이트’ 행사를 통해 최신 대규모언어모델(LLM) ‘GPT-4o’를 공개하고 성능을 시연했다. 작년 11월 GPT-4터보를 공개한 지 6개월여 만이다. ‘o’는 모든 것을 뜻하는 ‘옴니(Omni)’에서 따왔다.GPT-4o는 텍스트 위주로 대화하는 기존 챗봇에서 한 단계 더 나아갔다. 사용자와 실시간으로 대화하는 것은 기본이다. 사용자의 말투와 억양을 분석해 현재의 기분을 파악하고, 이미지를 분석해 수학 문제의 답을 맞힌다. 미라 무라티 최고기술책임자(CTO)는 “GPT-4o는 GPT-4의 성능을 보다 빨리 구현하는 데 초점을 맞춘 모델”이라며 “텍스트, 시각, 청각 데이터를 종합적으로 분석하고 처리할 수 있도록 했다”고 설명했다.
이날 시연에 참석한 엔지니어들이 스마트폰을 통해 GPT-4o에 “오늘 발표가 있어서 긴장했는데 어떻게 해야 할까”라고 묻자 “깊이 심호흡하면 도움이 될 것”이란 답이 돌아왔다. 엔지니어가 휴대폰을 들고 숨을 거칠게 몰아쉬자 챗봇은 “그렇게 숨을 쉬면 도움이 되지 않는다”며 “천천히 숨을 들이마시고 내뱉어야 한다”고 조언했다. 또 다른 엔지니어는 “수면장애가 있는데 잠이 잘 오는 이야기를 들려달라”고 요청했다. 이에 GPT-4o는 이야기를 들려줬고, 엔지니어들이 다양한 분위기와 감정으로 이야기해달라고 하자 챗봇은 구연동화 톤의 목소리는 물론 로봇과 같은 소리로도 이야기를 들려줬다.
엔지니어가 휴대폰의 카메라로 종이를 비춘 뒤 ‘3x+1=4’라는 수학 문제를 직접 써 내려가자 GPT-4o는 이를 실시간으로 지켜본 뒤 x의 값을 구하는 방법을 알려줬다. ‘나는 GPT를 사랑한다’는 문장을 쓰자 이를 본 뒤 “너무나 감동적이야. 고마워”라는 감탄사를 내뱉기도 했다.이번 시연은 주로 휴대폰을 통해 이뤄졌다. 모바일로 챗봇과 대화하듯이 다양한 정보를 찾고 생성할 수 있게 된 것이다. GPT-4o는 한국어 등 50개 언어 실시간 통역 기능도 갖췄다. 이탈리아계 미국인인 무라티 CTO가 이탈리아어로 얘기하고, 다른 엔지니어가 영어로 대화하며 GPT-4o의 실시간 통역 기능을 활용했다. 반응 시간이 빨라 무리 없이 대화할 수 있었다.
오픈AI에 따르면 GPT-4o의 평균 응답 시간은 최소 232밀리초(ms·1000분의 1초), 평균 320밀리초다. 사람의 반응 시간과 비슷한 수준이다. 이전 모델인 GPT-3.5(2.8초), GPT-4(5.4초)와는 비교가 되지 않는다.
GPT-4o는 이날부터 사용할 수 있다. 오픈AI가 더욱 빨라지고 휴대폰으로도 사용하기 편한 AI 모델을 무료로 내놓음으로써 빅테크 시장의 AI 모델 경쟁이 더욱 달아오를 전망이다. GPT-4o 사용자가 급증할 경우 구글 검색 엔진이 위협받을 수 있다는 관측도 나온다. GPT-4o도 한 번에 입력할 수 있는 정보량이 다섯 배 많은 유료 상품이 있지만, 무료 서비스로도 대부분의 요청 처리가 가능하다.이번 행사는 미국 캘리포니아 마운틴뷰 본사에서 열리는 구글의 연례 개발자 회의 I/O 행사 하루 전에 기습적으로 열렸다. AI 시장의 최대 경쟁자인 두 회사가 힘겨루기하는 모양새다. 구글도 이번 행사를 통해 이전보다 업그레이드한 AI 모델을 내놓을 예정이다.
실리콘밸리=최진석 특파원 iskra@hankyung.com