"도쿄 거리 걷는 여성" 텍스트 입력했더니…동영상이 '뚝딱' [영상]
입력
수정
"이젠 영상이다" 오픈AI, 텍스트로 비디오 만드는 AI ‘소라’ 공개챗GPT 개발사 오픈AI가 15일(현지시간) 텍스트를 입력하면 동영상으로 만들어주는 인공지능(AI) 모델 ‘소라(Sora)’를 공개했다.
프롬프트 정확하게 해석해 생생한 감정 표현
제한된 창작자만 사용 허용…안전성 여부 평가
월가, 뜨거운 AI 투자 열기…엔비디아 보유한 AI주 67% 급등
오픈AI는 소라에 대해 "여러 캐릭터와 특정 유형의 동작, 복잡한 장면을 생성할 수 있다"며 "언어에 대한 깊은 이해를 갖고 있어 프롬프트를 정확하게 해석하고 생생한 감정을 표현하는 매력적인 캐릭터를 생성할 수 있다"고 설명했다. 소라는 현재 최대 1분 길이의 동영상을 만들수 있다.오픈AI는 이어 "사용자가 프롬프트에서 요구한 것뿐만 아니라 그런 것(프롬프트)이 물리적 세계에 어떻게 존재하는지 이해한다"고 전했다.
오픈AI는 소라를 활용한 영상도 몇가지 공개했다. "스타일리한 여성이 따뜻하게 빛나는 네온사인과 움직이는 도시 간판으로 가득한 도쿄 거리를 걷고 있습니다. 그녀는 검은색 가죽 재킷, 긴 빨간색 드레스, 검은색 부츠를 착용하고 검은색 지갑을 들고 있습니다."라고 텍스트를 입력한 후 생성된 영상이 가장 먼저 소개됐다.
소라는 이처럼 텍스트만으로 동영상을 생성할 수 있고 기존의 이미지를 동영상으로도 생성할 수도 있다. 기존 동영상을 확장하거나 누락된 프레임을 채울 수도 있다.샘 올트먼 오픈AI 최고경영자(CEO)는 엑스(X·옛 트위터)에서 처음에는 '제한된 수의 창작자'만 사용할 수 있도록 허용된다고 밝혔다. 또한 오픈AI는 소라를 회사의 제품에 통합하기 전에 전문가팀에 맡겨 안전성 여부를 평가할 계획이다.
앞서 페이스북 모회사 메타와 구글, 스타트업 런어웨이 AI 등도 '텍스트 투 비디오'(Text to Video) 모델을 개발한 바 있다. 오픈AI의 소라는 다른 텍스트 투 비디오 모델보다 시각적 품질이 좋고 프롬프트의 내용에 충실한 그림을 그려준다고 평가받고 있다.
한편 월가(월스트리트)에서는 AI에 대한 투자 열기가 식지 않고 있다. 이날 뉴욕 증시에서 엔비디아가 공개한 보유주식 현황보고서(13F)에 등록된 사운드하운드·리커젼 파마슈티컬스·나노 엑스 이미징·투심플·ARM홀딩스 등이 일제히 상승했다.특히 엔비디아가 367만달러의 지분을 가진 AI 서비스 개발 업체 사운드하운드는 무려 66.74% 급등했다. 반도체 설계회사(팹리스)인 ARM홀딩스 주가 역시 5.76% 올랐다.
신정은 기자 newyearis@hankyung.com