AI시대 핵심인 데이터…韓선 '가명정보 활용'마저 막힐판
-
기사 스크랩
-
공유
-
댓글
-
클린뷰
-
프린트
'데이터 3법' 유명무실 우려
개인정보 익명 처리한 가명정보
法 "동의 없이는 활용 안돼"
개인정보 익명 처리한 가명정보
法 "동의 없이는 활용 안돼"
“미래 산업의 원유는 데이터입니다. 적극적인 데이터 개방과 공유로 새로운 산업을 도약시켜야 합니다.”
문재인 전 대통령이 2018년 8월 가명정보를 활용해 데이터 이용 규제를 완화하겠다는 방침을 밝히며 한 말이다. ‘데이터 경제’ 시대가 본격화하는 흐름에 따라 신속하게 대응해야 한다는 취지였다. 정부 차원에서 청사진을 내놓고 6년이 지났지만 한국의 데이터산업은 제자리걸음을 이어가고 있다. 데이터산업의 핵심 도구인 가명정보 처리와 활용이 어렵다는 게 관련 업계의 이구동성이다.
소송의 쟁점은 개인정보를 가명정보로 처리하는 데 대한 동의 여부다. 가명정보는 추가 정보 없이는 특정 개인을 알아볼 수 없도록 안전하게 조치한 정보다. 정부는 2020년 8월 개인정보보호법을 개정해 가명 처리를 통해 개인정보를 보호하되 개인정보 처리자가 ‘정보 주체의 동의 없이’ 개인정보를 가명 처리해 활용할 수 있도록 허용(개인정보보호법 제28조 2항)했다. 시장조사 등 상업적 목적과 연구, 공익 기록 보존 등 통계 작성에 쓰이는 데 한해서다.
하지만 지난해 1·2심에선 개인이 ‘처리 정지’를 요구하면 가명정보를 이용할 수 없다고 판결했다. 재판부는 ‘정보 주체는 개인정보 처리자에게 자신의 개인정보 처리 정지를 요구할 수 있다’고 규정한 개인정보보호법 제37조 1항을 판결 근거로 제시했다.
업계에선 “개개인의 동의를 받아야 데이터를 활용할 수 있던 2020년 이전으로 후퇴하는 셈”이라고 입을 모았다. 정부가 정보 주체의 동의 없이 가명정보를 처리하는 제도를 도입해놓고도 허술한 법 개정으로 ‘이도 저도 아닌’ 상황에 이르게 됐다는 지적이다. 개인정보를 가명 처리하는 데 대한 정보 주체 동의 의무를 면제하는 조항은 없다.
김민호 성균관대 법학전문대학원 교수는 “가명정보로 개인정보를 식별하지 못하도록 하는 기술과 규제는 충분히 갖춰져 있다”며 “애초에 정부가 데이터 3법 취지에 모순되는 법 조항을 남겨둔 채 허술한 가이드라인을 꾸려온 게 문제”라고 말했다. 그는 “입법 취지를 무시하고 문언과 해설서 해석에만 치중한 법원 판결도 아쉽다”고 덧붙였다.
정부가 2018년 데이터 관련 규제 완화를 들고나온 것은 이런 사정을 감안했기 때문이다. 당시 국내엔 활용도 높은 공공데이터가 2만5000개에 불과했다. 미국(23만3000개)에 비하면 9분의 1 수준이었다. 빅데이터 활용과 분석 수준도 세계 63개국 중 56위에 그쳤다.
활용할 수 있는 데이터 양을 늘리고 질을 높이는 것을 목표로 추진한 게 데이터 3법과 가명정보 제도다. 이 제도를 도입하던 시기에도 개인정보 유출 우려는 상당했다. 가명정보는 개인정보 보유자가 추가 정보를 갖고 있기 때문에 ‘마음만 먹으면’ 특정 개인을 식별할 수 있다는 게 논란거리였다.
업계 관계자는 “개인정보를 캐내기 위해 가명정보를 재식별하는 시도는 과징금과 형사 처벌 등을 통해 막는 게 정석”이라며 “무조건 막기만 하면 AI 등의 분야에서 선진국을 따라잡기 힘들다”고 말했다. 미국 AI 개발업체 AIPRM에 따르면 한국과 미국의 AI 수준 격차는 447년이다. 미국이 2040년에 도달할 AI 기술 수준을 한국이 따라잡기까지 약 447년의 시간이 필요하다고 분석했다.
■ 가명·익명 정보란
개인정보는 이름·전화번호·주민등록번호 등이 등장하는 원본정보, 개인을 식별할 수 있는 항목을 일련번호 등으로 대체한 가명정보로 나뉜다. 다른 정보와 결합해도 누구에 대한 데이터인지 추측할 수 없도록 속성값까지 바꾼 정보는 익명정보로 불린다. 특정인의 4월 스마트폰 데이터 사용량 ‘56MB’를 ‘100MB 미만’으로 바꾸는 식으로 속성값을 범주화하는 게 일반적이다.
정지은 기자 jeong@hankyung.com
문재인 전 대통령이 2018년 8월 가명정보를 활용해 데이터 이용 규제를 완화하겠다는 방침을 밝히며 한 말이다. ‘데이터 경제’ 시대가 본격화하는 흐름에 따라 신속하게 대응해야 한다는 취지였다. 정부 차원에서 청사진을 내놓고 6년이 지났지만 한국의 데이터산업은 제자리걸음을 이어가고 있다. 데이터산업의 핵심 도구인 가명정보 처리와 활용이 어렵다는 게 관련 업계의 이구동성이다.
○모순되는 법 조항이 발목
26일 업계에 따르면 SK텔레콤이 개인정보를 가명 처리하지 말라고 요구한 이용자가 제기한 소송 1·2심에서 잇달아 패소한 뒤 ‘데이터산업 위기론’이 거세지고 있다.소송의 쟁점은 개인정보를 가명정보로 처리하는 데 대한 동의 여부다. 가명정보는 추가 정보 없이는 특정 개인을 알아볼 수 없도록 안전하게 조치한 정보다. 정부는 2020년 8월 개인정보보호법을 개정해 가명 처리를 통해 개인정보를 보호하되 개인정보 처리자가 ‘정보 주체의 동의 없이’ 개인정보를 가명 처리해 활용할 수 있도록 허용(개인정보보호법 제28조 2항)했다. 시장조사 등 상업적 목적과 연구, 공익 기록 보존 등 통계 작성에 쓰이는 데 한해서다.
하지만 지난해 1·2심에선 개인이 ‘처리 정지’를 요구하면 가명정보를 이용할 수 없다고 판결했다. 재판부는 ‘정보 주체는 개인정보 처리자에게 자신의 개인정보 처리 정지를 요구할 수 있다’고 규정한 개인정보보호법 제37조 1항을 판결 근거로 제시했다.
업계에선 “개개인의 동의를 받아야 데이터를 활용할 수 있던 2020년 이전으로 후퇴하는 셈”이라고 입을 모았다. 정부가 정보 주체의 동의 없이 가명정보를 처리하는 제도를 도입해놓고도 허술한 법 개정으로 ‘이도 저도 아닌’ 상황에 이르게 됐다는 지적이다. 개인정보를 가명 처리하는 데 대한 정보 주체 동의 의무를 면제하는 조항은 없다.
김민호 성균관대 법학전문대학원 교수는 “가명정보로 개인정보를 식별하지 못하도록 하는 기술과 규제는 충분히 갖춰져 있다”며 “애초에 정부가 데이터 3법 취지에 모순되는 법 조항을 남겨둔 채 허술한 가이드라인을 꾸려온 게 문제”라고 말했다. 그는 “입법 취지를 무시하고 문언과 해설서 해석에만 치중한 법원 판결도 아쉽다”고 덧붙였다.
○후퇴하는 데이터 경쟁력
인공지능(AI) 기술 고도화 등에 필요한 데이터를 축적하려면 개인정보를 처리하는 시스템이 필요하다. 정부와 공공기관, 기업 등이 생성하는 데이터의 75%가 개인정보를 포함하고 있어서다.정부가 2018년 데이터 관련 규제 완화를 들고나온 것은 이런 사정을 감안했기 때문이다. 당시 국내엔 활용도 높은 공공데이터가 2만5000개에 불과했다. 미국(23만3000개)에 비하면 9분의 1 수준이었다. 빅데이터 활용과 분석 수준도 세계 63개국 중 56위에 그쳤다.
활용할 수 있는 데이터 양을 늘리고 질을 높이는 것을 목표로 추진한 게 데이터 3법과 가명정보 제도다. 이 제도를 도입하던 시기에도 개인정보 유출 우려는 상당했다. 가명정보는 개인정보 보유자가 추가 정보를 갖고 있기 때문에 ‘마음만 먹으면’ 특정 개인을 식별할 수 있다는 게 논란거리였다.
업계 관계자는 “개인정보를 캐내기 위해 가명정보를 재식별하는 시도는 과징금과 형사 처벌 등을 통해 막는 게 정석”이라며 “무조건 막기만 하면 AI 등의 분야에서 선진국을 따라잡기 힘들다”고 말했다. 미국 AI 개발업체 AIPRM에 따르면 한국과 미국의 AI 수준 격차는 447년이다. 미국이 2040년에 도달할 AI 기술 수준을 한국이 따라잡기까지 약 447년의 시간이 필요하다고 분석했다.
■ 가명·익명 정보란
개인정보는 이름·전화번호·주민등록번호 등이 등장하는 원본정보, 개인을 식별할 수 있는 항목을 일련번호 등으로 대체한 가명정보로 나뉜다. 다른 정보와 결합해도 누구에 대한 데이터인지 추측할 수 없도록 속성값까지 바꾼 정보는 익명정보로 불린다. 특정인의 4월 스마트폰 데이터 사용량 ‘56MB’를 ‘100MB 미만’으로 바꾸는 식으로 속성값을 범주화하는 게 일반적이다.
정지은 기자 jeong@hankyung.com