가상인간 로지·메이브 제작 AI 기술로 CCTV 만든다
입력
수정
UST-ETRI 연구진, 인공지능 CCTV 프레임워크 개발방화나 주거지 침입 등 범죄 관련 행동이나 실신 등 긴급 상황을 사람과 유사하게 인식할 수 있는 인공지능(AI) CCTV 기술이 개발됐다. 챗GPT로 글로벌 AI 산업 판도를 뒤흔들고 있는 오픈AI사가 보유한 '포스트 딥러닝' 기술과 유사한 기법이다.
적은 데이터로 고성능 AI 구현하는 '제로샷 러닝' 적용
오픈AI의 챗GPT 등에 적용되는 포스트 딥러닝 기술
과학기술연합대학원대학교(UST)는 본교 한국전자통신연구원(ETRI) 캠퍼스 김도형 교수와 김형민 전호범 박사과정 연구원이 이런 기술을 개발해 국제특허를 출원했다고 11일 밝혔다.UST에 따르면 행정안전부 관할 국내 공공 CCTV 대수는 2020년 초 114만여 대에서 계속 증가해 왔다. 그러나 관제인력은 턱없이 부족한 상태다. 관제인력 1명당 관리하는 평균 CCTV 대수가 271대에 달한다. 서울은 관제인력 1명당 관리하는 CCTV 대수가 1000대에 육박한다. 각종 범죄 및 이태원 참사 등 재난에 대한 사전적 대응에 CCTV 무용론이 나오는 배경이다.
UST ETRI 연구팀은 배회, 침입, 쓰러짐, 싸움, 유기, 방화, 붐빔 등 7가지 행동을 감지할 수 있는 AI 모델을 개발했다. 시각적 이미지와 언어를 결합해 취득한 정보를 토대로 컴퓨터가 스스로 추론하고 판단하는 '제로샷 학습(Zero-shot Learning)' 기법을 썼다.
제로샷 학습은 빅데이터 없이 적은 데이터만으로 고성능 AI를 만드는 포스트 딥러닝 기술이다. 진짜와 가짜를 구분하며 똑똑해지는 딥러닝 모델인 생성 적대 신경망(GAN)이 더욱 진화한 버전이라고 볼 수 있다. 약간의 텍스트를 넣으면 알아서 그림과 이미지를 그리는 오픈AI의 '달리(DALL-E)' 개발에 제로샷 학습이 활용됐다. 달리는 스페인의 초현실주의 화가 살바도르 달리의 이름을 따서 지었다.GPT-3에서 달리, 그리고 챗GPT로 이어지고 있는 오픈AI의 파괴적 혁신에 제로샷 학습이 있다. 실제 사람과 구분하기 힘든 가상인간, 가상 걸그룹 등이 최근 마케팅 용도로 우후죽순처럼 나오게 된 것도 제로샷 학습 같은 포스트 딥러닝 기술 덕분이다.
연구팀이 개발한 AI 모델은 세계 최대 3차원 시각 데이터셋을 보유한 싱가포르 난양공대의 RGB+D 기준 성능평가에서 실제와 94.66% 일치하는 인식률을 보였다. 예를 들면 방화 감지의 경우 연기, 불 등 화재 장면과 기름 뿌리기, 불 지피기 등 사람의 행동을 동시에 탐지할 수 있다.또 점포 내 난동, 반려동물 유기, 독거노인 쓰러짐 등 각종 이상 상황을 관제인력에게 바로 알려줄 수 있다. 마트 계산대, 매표소, 골목길 등 특정 구역에 사람이 과도하게 몰릴 때를 감지해 적절히 대처하는 용도로도 사용이 가능하다. UST 관계자는 "복합적으로 발생하는 이상 상황을 컴퓨터가 능동적으로 감지하기 때문에 적은 인력으로 효율적으로 관제할 수 있다"고 말했다.연구팀은 국제학회 두 곳에 해당 기술을 담은 논문을 내고 국내외 특허를 출원했다. 기업 기술이전도 진행중이다. UST는 과학기술정보통신부 직할 교육기관으로 ETRI, 한국항공우주연구원 등 30개 연구소 현장에서 석·박사 과정을 운영하고 있다. 42개 전공이 개설돼 있으며 박사급 연구원 1200여 명이 교수로 일하고 있다.
이해성 기자 ihs@hankyung.com