'데이터댐' 구축위한 AI학습용 데이터 구축 사업 20개 과제 발표

과학기술정보통신부가 21일 '인공지능(AI) 학습용 데이터 구축 사업'의 20개 과제를 발표했다. '디지털 뉴딜'의 핵심으로 꼽히는 '데이터 댐' 구축을 위해서다.

AI 학습용 데이터 구축 사업은 AI 고도화에 필요한 각종 데이터를 수집하기 위해 2017년부터 시작됐다. 올해는 KDX의 '대용량 동영상 콘텐츠 AI데이터(동영상 내 객체 탐지, 상황 이해, 행동 분석을 위한 데이터)', 국립암센터의 '질병진단 이미지 AI데이터(유방암 및 부비동 질환의 진단을 위한 의료 영상 이미지 데이터)' 등 20개가 선정됐다. 자연어 처리 분야, 자율주행기술 분야, 음성·시각·언어 융합 분야와 헬스케어 분야, 딥페이크 방지 기술 분야 등 산업적 활용 가치가 크고 사회 문제를 해결할 수 있는 분야 등이 높은 점수를 받았다. 사업 규모는390억원이다. 정부는 2925억원의 추경예산을 통해 올 하반기 안에 학습용 데이터를 150종 추가로 구축할 계획이다. 과기정통부 관계자는 "AI 학습용 데이터 구축을 대규모로 확대해 ‘데이터 댐’에 모으고 다양한 기술, 서비스 개발에 활용되도록 지원하겠다"고 말했다.

조수영 기자 delinews@hankyung.com

핫이슈