스타트업·중소기업·대기업 등 누구나 활용가능
경상·전라·충청·강원·제주 사투리 등 AI 학습용데이터 개방
정부가 지난해부터 구축한 인공지능(AI) 학습용 데이터 170종을 개방한다.

과학기술정보통신부와 한국지능정보사회진흥원은 포털 'AI허브'로 학습용 데이터 4억8천만 건을 개방한다고 18일 밝혔다.

AI 학습용 데이터는 AI 개발에 사용된다.

그간 AI 기업들은 해외에서 개방한 데이터를 활용했다.

그러나 이런 해외 데이터는 한국어나 국내 도로 환경 등을 반영하지 못해 국내 AI 서비스 개발에 활용하기 어렵다는 단점이 있었다.

이번에 개방되는 데이터에는 한국 지역별 방언과 국내 주요도로, 국내 환자 의료영상 등이 포함된다.

이달 30일 공개될 경상·전라·충청·강원·제주 등 한국어 방언 발화 데이터는 음성기반 AI 서비스에 적용할 수 있다.

이달 18∼30일 차례로 공개되는 자율주행 데이터 21종은 국내 도로주행 영상과 주차 장애물·이동체 인지영상·버스 노선 주행영상 등을 포함해 자율주행차 개발을 앞당길 것으로 전망된다.

헬스케어 데이터 27종과 개인정보·민감정보가 포함될 우려가 있는 59종의 데이터는 최종검증을 거친 후 이달 30일에 개방한다.

개방 데이터는 스타트업이나 중소기업, 대기업 등 누구나 사용할 수 있다.

이날 과기정통부는 'AI 데이터 활용협의회' 출범식을 열고 데이터를 활용하는 기업·기관의 의견도 들었다.

AI 데이터 활용협의회는 데이터 품질관리 전문기관인 한국정보통신기술협회(TTA)와 이번 데이터 활용 검토에 참여한 기업·기관을 중심으로 구성됐다.

협의회는 AI 허브 데이터 활용 성과를 공유하고 데이터 품질 제고에 협력할 계획이다.

임혜숙 과기정통부 장관은 "댐의 물이 대지 곳곳으로 스며들어 꽃을 피우듯이 이번에 공개되는 데이터들이 산업 곳곳에서 활용돼 혁신의 열매를 맺기를 바란다"고 말했다.

경상·전라·충청·강원·제주 사투리 등 AI 학습용데이터 개방
/연합뉴스