AI시대 핵심인 데이터…韓선 '가명정보 활용'마저 막힐판

'데이터 3법' 유명무실 우려

개인정보 익명 처리한 가명정보
法 "동의 없이는 활용 안돼"
“미래 산업의 원유는 데이터입니다. 적극적인 데이터 개방과 공유로 새로운 산업을 도약시켜야 합니다.”

문재인 전 대통령이 2018년 8월 가명정보를 활용해 데이터 이용 규제를 완화하겠다는 방침을 밝히며 한 말이다. ‘데이터 경제’ 시대가 본격화하는 흐름에 따라 신속하게 대응해야 한다는 취지였다. 정부 차원에서 청사진을 내놓고 6년이 지났지만 한국의 데이터산업은 제자리걸음을 이어가고 있다. 데이터산업의 핵심 도구인 가명정보 처리와 활용이 어렵다는 게 관련 업계의 이구동성이다.

○모순되는 법 조항이 발목

26일 업계에 따르면 SK텔레콤이 개인정보를 가명 처리하지 말라고 요구한 이용자가 제기한 소송 1·2심에서 잇달아 패소한 뒤 ‘데이터산업 위기론’이 거세지고 있다.

소송의 쟁점은 개인정보를 가명정보로 처리하는 데 대한 동의 여부다. 가명정보는 추가 정보 없이는 특정 개인을 알아볼 수 없도록 안전하게 조치한 정보다. 정부는 2020년 8월 개인정보보호법을 개정해 가명 처리를 통해 개인정보를 보호하되 개인정보 처리자가 ‘정보 주체의 동의 없이’ 개인정보를 가명 처리해 활용할 수 있도록 허용(개인정보보호법 제28조 2항)했다. 시장조사 등 상업적 목적과 연구, 공익 기록 보존 등 통계 작성에 쓰이는 데 한해서다.하지만 지난해 1·2심에선 개인이 ‘처리 정지’를 요구하면 가명정보를 이용할 수 없다고 판결했다. 재판부는 ‘정보 주체는 개인정보 처리자에게 자신의 개인정보 처리 정지를 요구할 수 있다’고 규정한 개인정보보호법 제37조 1항을 판결 근거로 제시했다.

업계에선 “개개인의 동의를 받아야 데이터를 활용할 수 있던 2020년 이전으로 후퇴하는 셈”이라고 입을 모았다. 정부가 정보 주체의 동의 없이 가명정보를 처리하는 제도를 도입해놓고도 허술한 법 개정으로 ‘이도 저도 아닌’ 상황에 이르게 됐다는 지적이다. 개인정보를 가명 처리하는 데 대한 정보 주체 동의 의무를 면제하는 조항은 없다.

김민호 성균관대 법학전문대학원 교수는 “가명정보로 개인정보를 식별하지 못하도록 하는 기술과 규제는 충분히 갖춰져 있다”며 “애초에 정부가 데이터 3법 취지에 모순되는 법 조항을 남겨둔 채 허술한 가이드라인을 꾸려온 게 문제”라고 말했다. 그는 “입법 취지를 무시하고 문언과 해설서 해석에만 치중한 법원 판결도 아쉽다”고 덧붙였다.

○후퇴하는 데이터 경쟁력

인공지능(AI) 기술 고도화 등에 필요한 데이터를 축적하려면 개인정보를 처리하는 시스템이 필요하다. 정부와 공공기관, 기업 등이 생성하는 데이터의 75%가 개인정보를 포함하고 있어서다.

정부가 2018년 데이터 관련 규제 완화를 들고나온 것은 이런 사정을 감안했기 때문이다. 당시 국내엔 활용도 높은 공공데이터가 2만5000개에 불과했다. 미국(23만3000개)에 비하면 9분의 1 수준이었다. 빅데이터 활용과 분석 수준도 세계 63개국 중 56위에 그쳤다.

활용할 수 있는 데이터 양을 늘리고 질을 높이는 것을 목표로 추진한 게 데이터 3법과 가명정보 제도다. 이 제도를 도입하던 시기에도 개인정보 유출 우려는 상당했다. 가명정보는 개인정보 보유자가 추가 정보를 갖고 있기 때문에 ‘마음만 먹으면’ 특정 개인을 식별할 수 있다는 게 논란거리였다.업계 관계자는 “개인정보를 캐내기 위해 가명정보를 재식별하는 시도는 과징금과 형사 처벌 등을 통해 막는 게 정석”이라며 “무조건 막기만 하면 AI 등의 분야에서 선진국을 따라잡기 힘들다”고 말했다. 미국 AI 개발업체 AIPRM에 따르면 한국과 미국의 AI 수준 격차는 447년이다. 미국이 2040년에 도달할 AI 기술 수준을 한국이 따라잡기까지 약 447년의 시간이 필요하다고 분석했다.

■ 가명·익명 정보란

개인정보는 이름·전화번호·주민등록번호 등이 등장하는 원본정보, 개인을 식별할 수 있는 항목을 일련번호 등으로 대체한 가명정보로 나뉜다. 다른 정보와 결합해도 누구에 대한 데이터인지 추측할 수 없도록 속성값까지 바꾼 정보는 익명정보로 불린다. 특정인의 4월 스마트폰 데이터 사용량 ‘56MB’를 ‘100MB 미만’으로 바꾸는 식으로 속성값을 범주화하는 게 일반적이다.

정지은 기자 jeong@hankyung.com

핫이슈