통계분류에 AI 활용, 처리속도 17배 빨라져
-
기사 스크랩
-
공유
-
댓글
-
클린뷰
-
프린트
=통계청, 인공지능(AI) 기반 통계분류 자동화 시스템 구축 업무혁신·생산성 증대
=시스템 도입 이후 통계분류 예측 정확도 기존 69%→84%로 크게 향상
통계청이 국가통계 분야에서 인공지능(AI)을 활용해 업무혁신을 꾀하고 있다.
통계청은 2020년부터 ‘통계분류 텍스트 정보를 이용한 AI 기반 통계분류 자동화’ 연구를 추진해 오고 있다.
인구총조사·전국사업체 조사 등 대용량 자료를 처리하는 5개 조사를 대상으로 AI 기반 통계분류 자동화 시스템을 구축해 활용하고 있다.
24일 통계청에 따르면 기존의 통계분류 시스템은 규칙과 조건 기반으로 구축돼 분류 항목이 많아지거나 검토해야 하는 사례가 증가하면 시스템 관리를 위한 시간과 비용이 많이 늘어나는 단점이 있었다.
또한 분류된 자료의 검토가 사람에 의한 수작업에 상당 부분 의존하게 돼 오류율 및 일관성 결여 문제가 발생하곤 했다.
AI 통계분류 시스템은 신경망 언어모델인 RoBERTa 모델을 활용해 통계분류 텍스트를 인식하고 과거 공표데이터에 대한 학습을 토대로 통계분류 코드를 추론해 제공한다. 인공지능 통계분류 자동화 시스템 개념도. 통계청 제공
통계청은 이와 같은 AI 통계분류 시스템을 통해 통계 자료 처리의 정확성 및 효율성이 크게 개선될 것으로 기대하고 있다.
과거 2020년 인구총조사 산업분류 자료를 분석한 결과 기존 색인 DB를 활용한 분류 예측 정확도는 69.2%이지만 AI를 이용했을 경우 정확도가 84.2%로 크게 높아지며 처리 속도도 최대 17배 향상됨을 확인했다.
이에 2023년부터는 전국사업체 조사 등 일부 조사에서 AI 통계분류 결과를 내검 우선순위 선정 및 중요도 판단에 활용하고 있다.
학습데이터 갱신 및 재학습을 통한 AI 통계분류 예측 정확도 향상을 위해 지속해서 시스템과 운영방식을 업데이트 중이다. 인공지능 통계분류를 활용한 내검 효율성 제고 및 재학습을 통한 정확도 개선. 통계청 제공
통계청의 AI 기반 통계분류 자동화시스템은 공공행정 분야 혁신을 위한 AI 기술 개발 및 실증 선도사례로 2022년 한국지능정보사회진흥원(NIA) ‘ICT 융합사업 우수사례’로 선정됐다.
지난해 9월에는 정부 관계부처 합동회의에서 결정한 ‘전 국민 AI 일상화 실행계획’ 중 통계청 실행과제로도 지정됐다.
올해는 일본 및 영국 통계 협력 양자 회의에서 국가통계 분야 AI 기술 활용 사례로 한국의 AI 통계분류 시스템을 소개해 국제적으로도 높은 관심을 받고 있다.
지난달 ‘AI 시대, 국가통계의 대응과 발전 방향’을 주제로 개최된 국가통계발전포럼에서 최인경 UN 유럽경제위원회(UNECE) 공식통계 현대화를 위한 고위급그룹(HLG-MOS) 사무국장은 “한국 통계청의 AI 통계분류 자동화 시스템 개발 및 운영은 고품질을 요구하는 공공재인 국가통계에 AI 기술을 본격 도입한 성공적인 사례”로 평가했다.
이어 “앞으로 세계 주요국 통계청의 AI 기술 활용 전문가 그룹에 한국 통계청의 적극적인 참여를 희망한다”고 말했다.
통계청은 향후 통계조사를 통한 신뢰성 검증 등을 거친 AI 통계분류 시스템을 중앙부처와 지자체에 제공하는 등 서비스 지원을 강화할 방침이다.
통계청 관계자는 “AI 통계분류 시스템뿐 아니라 초거대 AI를 활용한 통계 챗봇 서비스 등 국가통계에 AI 활용과 확산을 위해 더욱 노력하겠다”고 말했다.
대전=임호범 기자
=시스템 도입 이후 통계분류 예측 정확도 기존 69%→84%로 크게 향상
통계청이 국가통계 분야에서 인공지능(AI)을 활용해 업무혁신을 꾀하고 있다.
통계청은 2020년부터 ‘통계분류 텍스트 정보를 이용한 AI 기반 통계분류 자동화’ 연구를 추진해 오고 있다.
인구총조사·전국사업체 조사 등 대용량 자료를 처리하는 5개 조사를 대상으로 AI 기반 통계분류 자동화 시스템을 구축해 활용하고 있다.
24일 통계청에 따르면 기존의 통계분류 시스템은 규칙과 조건 기반으로 구축돼 분류 항목이 많아지거나 검토해야 하는 사례가 증가하면 시스템 관리를 위한 시간과 비용이 많이 늘어나는 단점이 있었다.
또한 분류된 자료의 검토가 사람에 의한 수작업에 상당 부분 의존하게 돼 오류율 및 일관성 결여 문제가 발생하곤 했다.
AI 통계분류 시스템은 신경망 언어모델인 RoBERTa 모델을 활용해 통계분류 텍스트를 인식하고 과거 공표데이터에 대한 학습을 토대로 통계분류 코드를 추론해 제공한다. 인공지능 통계분류 자동화 시스템 개념도. 통계청 제공
통계청은 이와 같은 AI 통계분류 시스템을 통해 통계 자료 처리의 정확성 및 효율성이 크게 개선될 것으로 기대하고 있다.
과거 2020년 인구총조사 산업분류 자료를 분석한 결과 기존 색인 DB를 활용한 분류 예측 정확도는 69.2%이지만 AI를 이용했을 경우 정확도가 84.2%로 크게 높아지며 처리 속도도 최대 17배 향상됨을 확인했다.
이에 2023년부터는 전국사업체 조사 등 일부 조사에서 AI 통계분류 결과를 내검 우선순위 선정 및 중요도 판단에 활용하고 있다.
학습데이터 갱신 및 재학습을 통한 AI 통계분류 예측 정확도 향상을 위해 지속해서 시스템과 운영방식을 업데이트 중이다. 인공지능 통계분류를 활용한 내검 효율성 제고 및 재학습을 통한 정확도 개선. 통계청 제공
통계청의 AI 기반 통계분류 자동화시스템은 공공행정 분야 혁신을 위한 AI 기술 개발 및 실증 선도사례로 2022년 한국지능정보사회진흥원(NIA) ‘ICT 융합사업 우수사례’로 선정됐다.
지난해 9월에는 정부 관계부처 합동회의에서 결정한 ‘전 국민 AI 일상화 실행계획’ 중 통계청 실행과제로도 지정됐다.
올해는 일본 및 영국 통계 협력 양자 회의에서 국가통계 분야 AI 기술 활용 사례로 한국의 AI 통계분류 시스템을 소개해 국제적으로도 높은 관심을 받고 있다.
지난달 ‘AI 시대, 국가통계의 대응과 발전 방향’을 주제로 개최된 국가통계발전포럼에서 최인경 UN 유럽경제위원회(UNECE) 공식통계 현대화를 위한 고위급그룹(HLG-MOS) 사무국장은 “한국 통계청의 AI 통계분류 자동화 시스템 개발 및 운영은 고품질을 요구하는 공공재인 국가통계에 AI 기술을 본격 도입한 성공적인 사례”로 평가했다.
이어 “앞으로 세계 주요국 통계청의 AI 기술 활용 전문가 그룹에 한국 통계청의 적극적인 참여를 희망한다”고 말했다.
통계청은 향후 통계조사를 통한 신뢰성 검증 등을 거친 AI 통계분류 시스템을 중앙부처와 지자체에 제공하는 등 서비스 지원을 강화할 방침이다.
통계청 관계자는 “AI 통계분류 시스템뿐 아니라 초거대 AI를 활용한 통계 챗봇 서비스 등 국가통계에 AI 활용과 확산을 위해 더욱 노력하겠다”고 말했다.
대전=임호범 기자