[데이터 정책제안] 세금으로 모은 공공데이터, 쓰지 말라고요?
입력
수정
뉴스래빗 데이터 정책제안 1회
"이 데이터는 쓰지 말아 주세요?"
'공공데이터=국민의 알 권리'
공공기관부터 입법 취지 되새겼으면
[편집자 주] '데이터 정책제안'은 뉴스래빗이 오랫동안 고심한 콘텐츠입니다. 뉴스래빗은 지난 1년여 간 [DJ 래빗], [데이터텔링] 등 데이터랩 산하 데이터저널리즘 콘텐츠를 지속 생산해왔습니다. 특히 국민 생활과 밀접한 미세먼지, 지하철 대중교통, 흡연구역, 식품업소, 프랜차이즈, 표준어 등 관련 공공데이터를 확보해 30편이 넘는 데이터저널리즘 콘텐츠를 선보였습니다.그러나 매번 아쉬움이 남습니다. 공공데이터를 공개하는 정부나 지자체, 기관 등은 최근 늘고 있지만 접근성 및 사용성은 여전히 기대 이하인 탓입니다. 합법적 정보공개청구로 데이터를 얻는 것 역시 문턱은 높죠.
질 좋은 데이터저널리즘 콘텐츠는 양질의 데이터를 확보할 때 비로소 완성됩니다. 뉴스래빗이 공공데이터 수집 및 정제, 분석 등 과정에서 겪은 문제점이나 애로사항을 바탕으로 데이터 관련 정책을 정부 및 지자체, 공기업 등 공공부문에 제안합니다.
[데이터 정책제안] 첫 번째. 세금·인력 들여 공개한 공공데이터를 쓰지 말아달라고 요청했던, 한국도로공사 편 입니다.
뉴스래빗은 지난 10월 추석 연휴 고속도로 교통량을 분석했습니다.
질 좋은 데이터저널리즘 콘텐츠는 양질의 데이터를 확보할 때 비로소 완성됩니다. 뉴스래빗이 공공데이터 수집 및 정제, 분석 등 과정에서 겪은 문제점이나 애로사항을 바탕으로 데이터 관련 정책을 정부 및 지자체, 공기업 등 공공부문에 제안합니다.
[데이터 정책제안] 첫 번째. 세금·인력 들여 공개한 공공데이터를 쓰지 말아달라고 요청했던, 한국도로공사 편 입니다.
뉴스래빗은 지난 10월 추석 연휴 고속도로 교통량을 분석했습니다.
추석 명절 급증한 교통량의 면면을 분석한 단독 기사였죠. 명절 연휴 통행료 면제가 처음인 만큼 들여다볼 가치가 컸습니다.
해당 기사 >> [단독] '최장 연휴'에 '통행료 무료' 올 추석 더 밀렸다
고속도로 통행량 데이터는 고속도로 공공데이터 포털(이하 포털)에서 확보했습니다. 한국도로공사는 고속도로 교통 데이터를 가공해 온라인에 공개하고 있죠. 포털엔 교통량, 통행속도, 편의시설, 대기오염도까지 고속도로 상황이 속속들이 담겨 있습니다.
#1. "그 데이터는 쓰지 말아주세요"고속도로 통행량 데이터는 방대하고 복잡합니다. 시스템이 측정한 데이터인 만큼 해석이 쉽지 않아 더 어렵습니다. 뉴스래빗은 포털 데이터를 시각화해 살펴본 후 도로공사 담당자를 전화 인터뷰했습니다.
문제는 도로공사 담당자의 협조 요청이었습니다. "이 포털 데이터를 기사에 쓰지 말아달라"는 요구였거든요. 포털에 공개한 데이터가 공식 발표한 교통량과 다르다는 게 이유였습니다. 포털이 제공하는 교통량 데이터는 크게 '톨게이트 교통량'과 '도로상 교통량'으로 나뉩니다. 도로공사 상급 부처인 국토교통부는 공식 발표 때 톨게이트 교통량을 사용합니다. 설이나 추석마다 국토교통부가 발표하는 명절 교통량 데이터가 그 예입니다. 뉴스래빗은 시간별 도로별 통행량 변화를 GIF(움직이는 그림파일, 위 GIF) 및 영상 기법으로 시각화해 독자에게 제공했습니다. 그러러면 톨게이트 교통량뿐 만 아니라 도로상 교통량을 시간대별로 수집해야 합니다. 그래야 언제 어디 도로에 차량 정체의 흐름이 나타났는지 더 쉽게 파악할 수 있으니까요.그러나 도로공사 담당자는 도로상 교통량 데이터 사용엔 여러 문제가 있다고 항변했습니다. 그는 "노면에 심은 센서가 특정 범위를 측정하는 방식으로 측정한 데이터"라며 "센서 감지 범위가 겹칠 수도 있고, 사각지대도 우려돼 정확도가 100%라고 확신하기 어렵다고 주장했습니다. 그러니 데이터를 사용하지 말아달라"고 재차 요청했습니다.
그럼 톨게이트 교통량 포털 데이터는 써도 될까요. 담당자는 이 역시 쓰지 말아달라고 했습니다. 마찬가지로 정확도가 100%가 아니라는 이유였습니다. 도로공사가 공개하는 포털 데이터는 톨게이트 데이터이든, 도로상 데이터이든 보정을 거치지 않은 로데이터(raw data)입니다.
이 로데이터를 일일이 후보정한 공식 발표 자료만 보도에 써달라는 요청인 셈입니다. 도로공사 관계자는 "공식 발표하는 톨게이트 교통량은 포털 데이터(시스템 측정값)를 바탕으로 추가 보정한 수치"라며 "로데이터를 보도에 사용할 경우 공식 자료와 혼돈을 일으킬 수 있다"는 입장이었습니다. 들어오기만 하고 나가지는 않은 자동차, 혹은 그 반대 등 톨게이트를 정상적으로 통과하지 않은 차량 수를 거른다는 이유였습니다.
#2. 공공데이터=국민 알 권리, 법 취지 되새겨야
공공데이터법(공공데이터의 제공 및 이용 활성화에 관한 법률) 1조는 그 취지를 이렇게 정하고 있습니다.
도로공사 공공데이터는 아직 '국민의 알 권리'와는 멀어보입니다. 세금을 들여 공개한 데이터가 법 취지에 맞는 제 역할을 못 하고 있는 셈입니다.
도로공사가 공공데이터의 신뢰도를 걱정하는 점은 이해합니다. 공공데이터가 국민의 알권리를 충족하려면 데이터의 신뢰성부터 담보해야 하니까요. 그러나 법이 정한 바 처럼 공공데이터는 국민의 이용권을 보장하고, 데이터를 민간에 적극 공개해 민관이 함께 사회적 질을 높이는 결과를 함께 도출할 수 있습니다.
데이터를 통해 국민의 알권리가 충족되면 많은 것이 바뀝니다. 정부, 지자체, 공공기관 등이 일방적으로 발표하던 사실을 민간에서 검증해볼 계기가 마련됩니다. 이 과정에서 공공이 발견하지 못한 더 나은 가치를 창출할 수도 있죠.
그래서 데이터는 끊임없는 질문을 낳아야 합니다. 그 질문과 문제를 해결해하는 과정이 공공데이터 생태계와 국민의 알 권리와 사회를 발전시킵니다. 데이터 수집 주체인 공공기관이 데이터 외부 공개와 활용에 방어적으로 접근하면 안 되는 이유입니다. "보정한 데이터를 이용해달라"던 도로공사 담당자가 법의 취지에 공감하지 못했다는 아쉬움이 든 이유입니다.
'데이터로 돌아가는 세상(data-driven world)'입니다. 모두가 데이터를 이야기합니다. 굴지의 글로벌 기업도, 정부도, 학교도, 병원도, 언론사도, 배달업체도, 스타트업(startup)도, 미래를 선점코자 하는 모든 진영이 데이터를 갈구합니다. 하지만 어떤 데이터를 어떤 효율적 방식으로 모아, 어떤 방식으로 공개하고 활용성과 접근성을 높일 수 있는지에 대해 고민하는 공공기관은 많지 않아 보입니다. 데이터 저널리스트인 기자마저 접근 및 활용이 어렵다는 좌절감을 느낄만큼 조악하고 허술한 공공데이터가 태반입니다.
이런 공공데이터가 과연 국민의 알권리를 충족할 수 있을까요. 정부, 지자체, 공공기관 등 공공영역 종사자부터 공공데이터법의 취지를 되돌아봐야 할 때입니다 !.!# 데이터 정책제안 ? 질 좋은 데이터저널리즘 콘텐츠는 양질의 데이터를 확보할 때 비로소 완성됩니다. 뉴스래빗이 공공데이터 수집 및 정제, 분석 등 과정에서 겪은 문제점이나 애로사항을 바탕으로 데이터 관련 정책을 정부 및 지자체, 공기업 등 공공부문에 제안합니다.
책임= 김민성, 연구= 강종구 한경닷컴 기자 jonggu@hankyung.com
뉴스래빗 페이스북 facebook.com/newslabit
기사제보 및 보도자료 newslab@hankyung.com
#1. "그 데이터는 쓰지 말아주세요"고속도로 통행량 데이터는 방대하고 복잡합니다. 시스템이 측정한 데이터인 만큼 해석이 쉽지 않아 더 어렵습니다. 뉴스래빗은 포털 데이터를 시각화해 살펴본 후 도로공사 담당자를 전화 인터뷰했습니다.
문제는 도로공사 담당자의 협조 요청이었습니다. "이 포털 데이터를 기사에 쓰지 말아달라"는 요구였거든요. 포털에 공개한 데이터가 공식 발표한 교통량과 다르다는 게 이유였습니다. 포털이 제공하는 교통량 데이터는 크게 '톨게이트 교통량'과 '도로상 교통량'으로 나뉩니다. 도로공사 상급 부처인 국토교통부는 공식 발표 때 톨게이트 교통량을 사용합니다. 설이나 추석마다 국토교통부가 발표하는 명절 교통량 데이터가 그 예입니다. 뉴스래빗은 시간별 도로별 통행량 변화를 GIF(움직이는 그림파일, 위 GIF) 및 영상 기법으로 시각화해 독자에게 제공했습니다. 그러러면 톨게이트 교통량뿐 만 아니라 도로상 교통량을 시간대별로 수집해야 합니다. 그래야 언제 어디 도로에 차량 정체의 흐름이 나타났는지 더 쉽게 파악할 수 있으니까요.그러나 도로공사 담당자는 도로상 교통량 데이터 사용엔 여러 문제가 있다고 항변했습니다. 그는 "노면에 심은 센서가 특정 범위를 측정하는 방식으로 측정한 데이터"라며 "센서 감지 범위가 겹칠 수도 있고, 사각지대도 우려돼 정확도가 100%라고 확신하기 어렵다고 주장했습니다. 그러니 데이터를 사용하지 말아달라"고 재차 요청했습니다.
그럼 톨게이트 교통량 포털 데이터는 써도 될까요. 담당자는 이 역시 쓰지 말아달라고 했습니다. 마찬가지로 정확도가 100%가 아니라는 이유였습니다. 도로공사가 공개하는 포털 데이터는 톨게이트 데이터이든, 도로상 데이터이든 보정을 거치지 않은 로데이터(raw data)입니다.
이 로데이터를 일일이 후보정한 공식 발표 자료만 보도에 써달라는 요청인 셈입니다. 도로공사 관계자는 "공식 발표하는 톨게이트 교통량은 포털 데이터(시스템 측정값)를 바탕으로 추가 보정한 수치"라며 "로데이터를 보도에 사용할 경우 공식 자료와 혼돈을 일으킬 수 있다"는 입장이었습니다. 들어오기만 하고 나가지는 않은 자동차, 혹은 그 반대 등 톨게이트를 정상적으로 통과하지 않은 차량 수를 거른다는 이유였습니다.
#2. 공공데이터=국민 알 권리, 법 취지 되새겨야
공공데이터법(공공데이터의 제공 및 이용 활성화에 관한 법률) 1조는 그 취지를 이렇게 정하고 있습니다.
이 법은 공공기관이 보유·관리하는 데이터의 제공 및 그 이용 활성화에 관한 사항을 규정함으로써 국민의 공공데이터에 대한 이용권을 보장하고, 공공데이터의 민간 활용을 통한 삶의 질 향상과 국민경제 발전에 이바지함을 목적으로 한다.
도로공사 공공데이터는 아직 '국민의 알 권리'와는 멀어보입니다. 세금을 들여 공개한 데이터가 법 취지에 맞는 제 역할을 못 하고 있는 셈입니다.
도로공사가 공공데이터의 신뢰도를 걱정하는 점은 이해합니다. 공공데이터가 국민의 알권리를 충족하려면 데이터의 신뢰성부터 담보해야 하니까요. 그러나 법이 정한 바 처럼 공공데이터는 국민의 이용권을 보장하고, 데이터를 민간에 적극 공개해 민관이 함께 사회적 질을 높이는 결과를 함께 도출할 수 있습니다.
데이터를 통해 국민의 알권리가 충족되면 많은 것이 바뀝니다. 정부, 지자체, 공공기관 등이 일방적으로 발표하던 사실을 민간에서 검증해볼 계기가 마련됩니다. 이 과정에서 공공이 발견하지 못한 더 나은 가치를 창출할 수도 있죠.
그래서 데이터는 끊임없는 질문을 낳아야 합니다. 그 질문과 문제를 해결해하는 과정이 공공데이터 생태계와 국민의 알 권리와 사회를 발전시킵니다. 데이터 수집 주체인 공공기관이 데이터 외부 공개와 활용에 방어적으로 접근하면 안 되는 이유입니다. "보정한 데이터를 이용해달라"던 도로공사 담당자가 법의 취지에 공감하지 못했다는 아쉬움이 든 이유입니다.
'데이터로 돌아가는 세상(data-driven world)'입니다. 모두가 데이터를 이야기합니다. 굴지의 글로벌 기업도, 정부도, 학교도, 병원도, 언론사도, 배달업체도, 스타트업(startup)도, 미래를 선점코자 하는 모든 진영이 데이터를 갈구합니다. 하지만 어떤 데이터를 어떤 효율적 방식으로 모아, 어떤 방식으로 공개하고 활용성과 접근성을 높일 수 있는지에 대해 고민하는 공공기관은 많지 않아 보입니다. 데이터 저널리스트인 기자마저 접근 및 활용이 어렵다는 좌절감을 느낄만큼 조악하고 허술한 공공데이터가 태반입니다.
이런 공공데이터가 과연 국민의 알권리를 충족할 수 있을까요. 정부, 지자체, 공공기관 등 공공영역 종사자부터 공공데이터법의 취지를 되돌아봐야 할 때입니다 !.!# 데이터 정책제안 ? 질 좋은 데이터저널리즘 콘텐츠는 양질의 데이터를 확보할 때 비로소 완성됩니다. 뉴스래빗이 공공데이터 수집 및 정제, 분석 등 과정에서 겪은 문제점이나 애로사항을 바탕으로 데이터 관련 정책을 정부 및 지자체, 공기업 등 공공부문에 제안합니다.
책임= 김민성, 연구= 강종구 한경닷컴 기자 jonggu@hankyung.com
뉴스래빗 페이스북 facebook.com/newslabit
기사제보 및 보도자료 newslab@hankyung.com