과기정통부, AI 데이터 품질 표준 만든다

내년 6월 확정…국제 표준 추진
인공지능(AI)의 학습 재료인 데이터 품질 표준이 내년 6월께 마련될 전망이다.

과학기술정보통신부는 AI 데이터 품질의 개념과 범위, 세부 요구사항 등을 담은 표준안을 개발하겠다고 5일 발표했다. 이를 한국정보통신기술협회(TTA) 단체표준으로 제안하고, 국제 표준이 될 수 있게 지원하겠다고 했다. 과기정통부 관계자는 “전문가 의견 수렴 절차를 거쳐 표준안을 내년 6월 최종 확정할 것”이라고 말했다.AI 데이터 품질은 원시데이터 취득→정제→데이터 가공(라벨링)→활용 등 전 단계에서 요구된다. 이번 표준안에서 AI 데이터 품질은 ‘데이터가 정확성, 다양성, 유효성 등을 확보해 사용자에게 유용한 가치를 줄 수 있는 수준’으로 정의됐다.

구체적으로는 △원시데이터 수집의 다양성·사실성 △원시데이터 파일 포맷·해상도 등의 기술 적합성 △정제 단계에서 데이터 중복 방지 및 비식별화 조치 △가공 단계의 분류체계 및 라벨링 규격 △품질 검수 및 활용 유효성 등의 내용이 담겼다.

이승우 기자 leeswoo@hankyung.com