글만 알던 토종AI, 이미지도 읽는다…한층 진화된 클로바X
-
기사 스크랩
-
공유
-
댓글
-
클린뷰
-
프린트
네이버 클로바X, 이달 말 업데이트
이미지 이해 기능 추가…활용도↑
"발전된 AI, 다양한 서비스에 적용"
이미지 이해 기능 추가…활용도↑
"발전된 AI, 다양한 서비스에 적용"
![네이버 초대규모 인공지능(AI) 하이퍼클로바X의 이미지 이해 기능을 토대로 대화형 AI 에이전트 '클로바X'와 대화를 나누는 모습. 사진=네이버 제공](https://img.hankyung.com/photo/202408/01.37768776.1.png)
22일 네이버에 따르면 클로바X는 오는 27일 업데이트를 통해 이미지 이해 기능을 갖추게 된다. 사용자가 클로바X 대화창에 올린 이미지의 내용과 질의를 바탕으로 대화를 나눌 수 있는 것이다. 클로바X는 사진 속 현상을 묘사하거나 상황을 추론하는 등의 다양한 지시를 수행할 수 있다.
예컨대 이미지 형식으로 된 표나 그래프를 클로바X가 이해하고 분석한 다음 이를 토대로 질문과 대화를 주고받는 것이 가능해진다. 그간 글쓰기, 코드 작성, 번역 작업 중심으로 활용돼 왔지만 이미지 이해 능력이 더해질 경우 다양한 용도로 활용될 수 있다.
이 기능은 네이버 초대규모 AI '하이퍼클로바X'의 기술력을 바탕으로 정확도·신뢰도를 갖췄다는 설명이다. 실제 국내 초·중·고등학교 검정고시 총 1480개 문항을 AI 모델에 이미지 형태로 입력한 다음 문제를 풀게 한 결과 정답률 84%를 기록했다. 정답률 78%에 그친 오픈AI의 GPT-4o보다 높은 점수다.
![네이버 초대규모 인공지능(AI) 하이퍼클로바X의 이미지 이해 기능을 토대로 대화형 AI 에이전트 '클로바X'와 대화를 나누는 모습. 사진=네이버 제공](https://img.hankyung.com/photo/202408/01.37768794.1.png)
네이버는 이 기술을 실시간 음성 번역, 언어 학습, 상담 등 다양한 서비스에 활용할 수 있다고 강조했다.
성낙호 네이버클라우드 하이퍼스케일 AI 기술 총괄은 “거대언어모델로 출발한 하이퍼클로바X는 이미지 이해 능력을 더한 거대시각언어모델, 나아가 음성 멀티모달 언어 모델로 발전하고 있다”며 “하이퍼클로바X의 발전된 능력은 클로바X 등 여러 네이버 서비스에 도입해 새로운 사용자 가치를 창출하고, 기업용 AI 솔루션으로도 제공해 하이퍼클로바X 생태계를 더 확장할 것”이라고 말했다.
김대영 한경닷컴 기자 kdy@hankyung.com