본문 바로가기

    ADVERTISEMENT

    LG, 이미지 설명하는 '캡셔닝 AI' 국제 학회서 첫 공개

    • 공유
    • 댓글
    • 클린뷰
    • 프린트
    처음 보는 이미지도 자연어로 설명…이미지 1만장 2일 내 작업
    LG, 이미지 설명하는 '캡셔닝 AI' 국제 학회서 첫 공개
    LG AI연구원은 캐나다 밴쿠버에서 열리는 세계 최대 컴퓨터 비전 학회 'CVPR 2023'에서 이미지를 설명하는 '캡셔닝 인공지능(AI)'을 공개했다고 19일 밝혔다.

    연구원이 처음 외부에 공개한 캡셔닝 AI는 처음 보는 이미지도 자연어로 설명할 수 있는 AI다.

    이미지 검색에 활용할 수 있는 정보인 문장이나 키워드 등 메타 데이터를 생성한다.

    AI가 인간처럼 처음 보는 물체나 장면에 대해서도 이전의 경험과 지식을 활용해 이해하고 설명할 수 있도록 '제로샷 이미지 캡셔닝' 기술을 적용했다.

    이 기술은 AI가 기존에 학습한 대량의 이미지와 텍스트 데이터를 기반으로 배경·인물·행동 등 이미지상 다양한 특징을 인식하고 그 관계를 설명하게 한다.

    캡셔닝 AI는 평균적으로 문장 5개와 키워드 10개를 10초 안에 생성한다.

    이미지 범위를 1만 장으로 확장하면 2일 이내에 작업을 끝낼 수 있다.

    따라서 이미지를 대량으로 관리해야 하는 기업들의 업무 효율성과 생산성을 높일 수 있다고 연구원은 설명했다.

    LG AI연구원은 캡셔닝 AI 개발을 위해 세계 최대 콘텐츠 플랫폼 기업 셔터스톡과 긴밀하게 협력했다.

    세잘 아민 셔터스톡 최고기술책임자(CTO)는 "현재 글로벌 고객사 10곳을 대상으로 '얼리 액세스'(앞서 해보기) 프로그램을 진행하며 캡셔닝 AI 기술을 발전시켜 나가고 있다"고 전했다.

    LG AI연구원은 캡셔닝 AI의 기반 기술인 제로샷 이미지 캡셔닝을 주제로 서울대 AI대학원, 셔터스톡과 함께 워크숍도 열었다.

    김승환 LG AI연구원 비전랩장은 "이미지 캡셔닝 분야의 글로벌 연구 리더십을 확보하기 위해 다양한 파트너와 유기적인 협력 체계를 구축해 새로운 평가 지표 개발과 신기술 연구를 계속 추진할 계획"이라고 말했다.

    /연합뉴스

    ADVERTISEMENT

    1. 1

      "지금 아니면 못 먹어요"…11만원 호텔케이크 10만개 팔린 비결

      롯데호텔앤리조트의 프리미엄 딸기 케이크가 11만원을 웃도는 가격에도 출시 5년 만에 10만개 이상 팔려나갔다. 딸기 디저트를 단일 상품이 아닌 '시즌 콘텐츠'로 확장한 게 먹혀들었다.11일 업계에 따르...

    2. 2

      주병기 "쿠팡 영업정지 검토…손해 전가는 약탈적 사업 행태"

      주병기 공정거래위원회 위원장은 개인정보 유출 사태와 관련 쿠팡의 영업정지를 "검토하고 있는 중"이라고 12일 말했다.주 위원장은 이날 유튜브 채널 '김어준의 겸손은힘들다 뉴스공장'에 출연해 "지금 과기...

    3. 3

      '채비' 업계 최초 전기차 충전 리워드 서비스 '번개' 런칭

      국내 전기차 급속 충전 인프라(CPO) 1위 기업 채비가 업계 최초 전기차 충전 리워드 서비스 ‘번개’를 새로 선보였다고 12일 발표했다. 채비 브랜드 구매 시 크레딧으로 사용할 수 있는 &ls...

    ADVERTISEMENT

    ADVERTISEMENT