사진=테크크런치
사진=테크크런치
멀티모달 성능을 한층 강화한 대규모언어모델(LLM) 제미나이가 공개된 후 반응이 엇갈린 가운데 “제미나이의 기능을 소개하는 홍보 영상이 가짜”라는 주장이 나왔다.

미국의 정보기술(IT) 전문매체 테크크런치는 7일(현지시간) ‘구글의 제미나이 데모 영상은 페이크였다’라는 제목의 기사를 통해 이같이 보도했다. 이 매체는 “우리는 다양한 과제에 대한 제미나이의 능력을 시험하기 위해 영상을 캡처한 뒤, 텍스트를 통해 제미나이에 메시지를 표시했다”며 “그 결과 동영상에서 보여주는 것과 같은 작업을 수행할 수 없었다”고 말했다.

예를 들어 영상에서 사용자가 말없이 손으로 가위바위보를 내미는 동작을 취한 부분이 있다. 제미나이는 이를 본 뒤 “당신이 무슨 일을 하는지 알아요. 가위바위보 놀이를 하고 있군요”라고 말했다.
사진=테크크런치
사진=테크크런치
하지만 실제 제미나이는 개별 손모양을 보고 가위바위보를 추론하지 못했다고 테크크런치는 지적했다. 세 가지 동작을 모두 동시에 표시해야 하며, 질문도 상세하게 해야 한다는 것이다. 즉, 가위바위보 사진 3장을 모두 입력하고 “내가 뭘 하는 것 같나요? 힌트 : 이건 게임이에요.”라고 물어봐야 제미나이가 “당신은 가위바위보를 하고 있다”고 답변했다는 것이다.

태양, 토성, 지구 그림이 그려진 메모지 3장을 말없이 보여줬을 때 실제 우주 속 배치 순서와 맞게 수정해주는 영상도 있었다. 실제로는 “이것이 올바른 순서인가? 태양으로부터의 거리를 고려해서 순서를 설명해봐”라고 질문해야 제대로 된 답변을 한다고 테크크런치는 설명했다.

이 매체는 “구글의 제미나이 홍보 영상은 모든 기능의 효과를 보여주기 위해 과장됐다고 봐야 한다”며 “영상은 현실을 전혀 반영하지 않았다. 그것은 가짜였다”고 지적했다.

이에 대해 구글 측은 “동영상이 제미나이의 실제 결과물을 보여준다”며 “우리는 데모를 편집했다”고 설명했다. 구글의 이와 같은 입장에 대해 테크크런치는 “영상은 실제와 매우 다른 상호 작용을 보여준다”고 밝혔다.

실리콘밸리=최진석 특파원 iskra@hankyung.com