인공지능 기술로 코로나19 해외유입 확진자 수 예측한다
입력
수정
KAIST, 통신사 로밍 고객수 등 활용해 분석…정확도 기존보다 35% 높아 국내 연구진이 해외 각국에서 유입되는 신종 코로나바이러스 감염증(코로나19) 확진자 수를 예측할 수 있는 기술을 개발했다. 한국과학기술원(KAIST)은 산업·시스템공학과 이재길 교수 연구팀이 코로나19 해외유입 확진자 수를 예측하는 인공지능(AI) 모델을 개발했다고 19일 밝혔다.
중앙재난안전대책본부에 따르면 국내 코로나19 누적 확진자 수는 전날 0시 기준 1만5천761명에 달한다.
이 가운데 해외유입 감염자 수는 2천662명으로 전체 확진자의 16.9%를 차지한다. 대륙별로 보면 아시아(중국 외), 미주, 유럽, 아프리카 등 순이다.
연구팀은 해외 각국의 확진자 수와 사망자 수, 국내로의 일일 항공편 수, 국내로의 로밍 고객 입국자 수 등의 데이터를 바탕으로 앞으로 2주 동안의 해외유입 확진자 수를 예측할 수 있는 모델을 개발했다. 해외 각국의 코로나19 위험도를 산출하기 위해 보고된 확진자·사망자 수 자료 외에도 코로나19 관련 키워드 검색 빈도를 입력 데이터로 활용했다. 이재길 교수는 "코로나19 진단검사 수 자체가 적은 국가의 경우 정확한 위험도를 판단하기 어렵기 때문에 구글 트렌드에 공개된 코로나19 증상 관련 검색 키워드를 활용했다"고 말했다.
이와 함께 실시간 입국자 수는 외부에 공개되지 않기 때문에 KT에서 받은 로밍 고객 입국자 수 데이터를 활용했다.
KT 고객만을 포함하는 한계를 해소하기 위해 국내에 도착하는 일일 항공편 수도 함께 고려했다. 국가 간 지리적 연관성과 교류 정도 등도 중요한 요인으로 포함했다.
예를 들어 서로 연관성이 큰 이탈리아와 프랑스를 함께 묶는 등 지리적 계층구조를 학습해 해외유입 확진자 수를 예측하도록 했다. 연구팀은 이 인공지능 모델을 'Hi-COVIDNet'(하이코비드넷)이라 이름 붙였다.
연구팀이 하이코비드넷을 활용해 지난 3월 22일부터 5월 5일까지 학습한 데이터를 바탕으로 이후 2주 동안(5월 6∼19일)의 해외유입 확진자 수를 예측한 결과 실제 확진자 수(하루 3∼11명)와의 오차가 2∼3명 정도밖에 나지 않았다.
기존 주가 동향 분석에 쓰이는 시계열 데이터 기반 기계학습·딥러닝 기반 예측 모델에 비해 정확도가 평균 35% 더 높았다고 연구팀은 설명했다.
제1저자인 김민석 박사과정 학생은 "이번에 개발한 AI기술을 코로나19 방역에 적용하면 K-방역의 위상을 높이는 데 기여할 것"이라고 기대했다. 이번 연구 성과는 오는 24일 열리는 컴퓨터 분야 권위 있는 국제 학술대회 'ACM KDD'에서 발표될 예정이다.
/연합뉴스
중앙재난안전대책본부에 따르면 국내 코로나19 누적 확진자 수는 전날 0시 기준 1만5천761명에 달한다.
이 가운데 해외유입 감염자 수는 2천662명으로 전체 확진자의 16.9%를 차지한다. 대륙별로 보면 아시아(중국 외), 미주, 유럽, 아프리카 등 순이다.
연구팀은 해외 각국의 확진자 수와 사망자 수, 국내로의 일일 항공편 수, 국내로의 로밍 고객 입국자 수 등의 데이터를 바탕으로 앞으로 2주 동안의 해외유입 확진자 수를 예측할 수 있는 모델을 개발했다. 해외 각국의 코로나19 위험도를 산출하기 위해 보고된 확진자·사망자 수 자료 외에도 코로나19 관련 키워드 검색 빈도를 입력 데이터로 활용했다. 이재길 교수는 "코로나19 진단검사 수 자체가 적은 국가의 경우 정확한 위험도를 판단하기 어렵기 때문에 구글 트렌드에 공개된 코로나19 증상 관련 검색 키워드를 활용했다"고 말했다.
이와 함께 실시간 입국자 수는 외부에 공개되지 않기 때문에 KT에서 받은 로밍 고객 입국자 수 데이터를 활용했다.
KT 고객만을 포함하는 한계를 해소하기 위해 국내에 도착하는 일일 항공편 수도 함께 고려했다. 국가 간 지리적 연관성과 교류 정도 등도 중요한 요인으로 포함했다.
예를 들어 서로 연관성이 큰 이탈리아와 프랑스를 함께 묶는 등 지리적 계층구조를 학습해 해외유입 확진자 수를 예측하도록 했다. 연구팀은 이 인공지능 모델을 'Hi-COVIDNet'(하이코비드넷)이라 이름 붙였다.
연구팀이 하이코비드넷을 활용해 지난 3월 22일부터 5월 5일까지 학습한 데이터를 바탕으로 이후 2주 동안(5월 6∼19일)의 해외유입 확진자 수를 예측한 결과 실제 확진자 수(하루 3∼11명)와의 오차가 2∼3명 정도밖에 나지 않았다.
기존 주가 동향 분석에 쓰이는 시계열 데이터 기반 기계학습·딥러닝 기반 예측 모델에 비해 정확도가 평균 35% 더 높았다고 연구팀은 설명했다.
제1저자인 김민석 박사과정 학생은 "이번에 개발한 AI기술을 코로나19 방역에 적용하면 K-방역의 위상을 높이는 데 기여할 것"이라고 기대했다. 이번 연구 성과는 오는 24일 열리는 컴퓨터 분야 권위 있는 국제 학술대회 'ACM KDD'에서 발표될 예정이다.
/연합뉴스