[단독] 통신·OTT·유통도 '마이데이터' 표준화…내달 검증 마무리
입력
수정
전 산업 넘나드는 '디지털 발자국' 뜬다‘정보 주체인 사용자가 직접 데이터 가치 창출에 나선다.’ 난해하기만 했던 마이데이터가 또 한번의 도약을 준비하고 있습니다. 한경 긱스(Geeks)가 정부의 ‘이종산업간 마이데이터 전송을 위한 표준화 가이드라인’ 초안을 단독 입수했습니다. 앞으로 어떤 미래가 오게 되고, 또 사업 안착을 위한 선결 과제는 무엇인지 짚었습니다.
앞으로 정보통신(IT)·교육·유통·교통·문화 서비스 등을 이용하면서 남긴 개인 데이터를 사용자 동의하에 다른 기업에도 전송해 쓸 수 있게 된다. 이를 위해 통신사·포털·온라인동영상서비스(OTT) 등의 이용자 데이터 형식이 모두 표준화될 예정이다. 그동안 국내에선 금융권을 제외하고는 이용자 데이터를 각각 다른 형태로 수집하고 있어 서비스 간 통용이 어려웠다.
넷플릭스 시청기록으로 왓챠가 영화 추천
24일 윤주경 국민의힘 의원실이 확보한 ‘이종산업간 마이데이터 전송을 위한 표준화 가이드라인’ 초안(4차 표준안)에 따르면 IT·교육·유통·국토교통·문화여가 5개 분야 71개 이상의 마이데이터 항목 표준화 작업이 막바지 단계에 돌입했다. 주무부처인 개인정보보호위원회(개보위)가 지난해 7월 열었던 3차 표준화 협의회 결과물을 바탕으로, 통신정보·개인식별정보·위치정보·앱 활동정보 등의 수집 방식을 표준화하는 작업을 거치고 있다. 항목은 현재도 수정이 진행 중이며, 이르면 다음달 공통 표준 항목에 대한 결과 검증(감리)이 종료될 예정이다.해당 사업은 지난해 4월부터 추진됐다. 개인정보보호위원회를 중심으로 금융위원회·교육부·과학기술정보통신부·보건복지부 등이 범부처 협의회에 참여해 데이터의 공통 표준항목을 정하고 전송 방식을 지정해왔다. 개인의 요청이 있을 경우에, 의료·통신·교육 등 서비스를 쓰며 남긴 사용자 정보를 다양한 기업에 넘겨 활용할 수 있도록 하는 것이 요지다. 넷플릭스의 콘텐츠 시청일시나 검색어 데이터를 이전해 왓챠에서 맞춤형 서비스를 받아볼 수 있고, 네이버에 남은 백신 접종 기록을 이전해 카카오에서 신규 예약 서비스를 이용할 수도 있는 셈이다. 이용자의 ‘디지털 발자취’를 쫓는, 이른바 ‘대체 데이터’ 활용이 정보기술(IT) 업계 화두로 떠오르며 기업들의 수요도 커진 상태다. 개보위 관계자는 “2020년 공공 분야 마이데이터 도입 이래, 이종 산업에도 맞춤형 데이터 서비스를 늘리기 위한 취지”라고 전했다. 다만 세부내역 기준 856가지 상당의 광범위한 개인정보가 전송 대상에 오르게 되면서, 데이터의 안전성을 우려하는 목소리도 동시에 나온다. 오·남용을 막고, 데이터의 질을 끌어올릴 대책도 수반돼야 한다는 지적이 나온다.
의미 확장 데이터, 표준으로 묶다
온라인동영상서비스(OTT) 넷플릭스에는 시청기록이 남는다. 첫 화면 세 번째 칸에, 붉은색 표시선과 함께 시청 시간과 콘텐츠 종류 등이 표시된다. ‘함께 시청된 콘텐츠’는 선호 드라마 장르를 ‘정주행’할 수 있는 추천 기능이다. 비슷한 기능은 경쟁사인 왓챠에도 있다. 다만 왓챠 앱 내의 시청기록에 의해서만 콘텐츠를 추천받을 수 있다.앞으론 이런 경계가 무너진다. 마이데이터 분류 기준 ‘통신정보’의 ‘콘텐츠 시청정보’ 6가지(선호 콘텐츠·검색어·시청시간 등)가 국가 표준안으로 통합되기 때문이다. 사용자의 ‘디지털 발자국(Digital footprint)’이 OTT를 비롯해 통신사·포털 등을 넘나들게 되며, 업체들의 맞춤형 서비스도 활황을 맞게 될 전망이다.개인정보보호위원회(개보위)의 이종산업간 마이데이터 표준 가이드라인에 따르면, 초안의 핵심을 차지하는 정보통신분야 정보맵 및 공통항목(중분류)엔 통신사(13종)·포털(17종)·OTT(2종)이 포함돼 있다. 대상 기업은 SK텔레콤·KT 등 통신 3사와 네이버·카카오, OTT인 넷플릭스·왓챠·티빙 등이다. 세부 항목에서 통신사는 이용자의 통신비 납부액과 연체기간, 소액결제정보와 한도, 포인트 사용일시, 위치정보 등 66개 정보를 통합한다. 포털은 검색어와 검색일시, 웹과 앱의 서비스 접속정보와 상품 및 구매금액 등 56가지 정보를 묶는다. 백신예약 결과 등도 포함됐다. OTT와 마찬가지로 이용자의 정보전송 요구가 있으면 타사로 이전이 가능해진다.
가이드라인을 통해 통합되는 정보는 일종의 ‘대체 데이터’에 속한다. 과거엔 상업적 가치가 없었지만, 최근 기술 발달로 기업들 수요가 커졌다. 내비게이션 서비스 티맵의 ‘T지금’의 누적 이용자 수는 약 1060만 명에 달한다. T지금은 1900만 명에 달하는 티맵 사용자들의 전국 실시간 주행데이터를 5분 단위로 분석한 결과물을 내놓는다. 지역별로 500m에서 10km까지 몇 대의 차량이 몰리고 있는지 내놓기 때문에 그날의 인기 관광지‧음식점‧카페‧은행 등을 확인하거나, 반대로 복잡한 장소를 피할 수 있다. 데이터 규격 통합이 이뤄지면, 이런 서비스의 고도화도 봇물을 이룰 토대가 마련된다.이정환 한양대 경제금융학과 교수는 “마이데이터의 활용은 결국 얼마나 쓰고자 하는 기업에 맞춤형 정보를 제공하느냐에 달려있다”며 “다만 관리 방식이 정형화되지 않은 데이터가 대부분이라, 이용자 정보와 투자금을 바탕으로 얼마나 데이터의 질을 고급화할 수 있는지가 서비스 성패를 가를 것”이라고 말했다.
800종 넘는 세부내역 관리 관건
가이드라인 안착을 위한 선결 과제도 산적해 있다. 대표적으로 불거질 문제가 개인정보 유출 문제다. 개인의 동의를 구하지만, 일단 데이터를 주고받는 기업체 자체가 증가하게 된다. 정보의 민감도는 크다. 통신사 ‘감면정보’ 항목엔 장애등급·장애정도·장애등록번호·기초생활수급자 정보를 다루고 있고, 교육업체의 ‘성적정보’ 항목엔 내신성적과 입학성적, 모의고사 성적과 수능성적까지도 포함된 상태다. 음식업 ‘주문정보’에는 무엇을 언제 먹었는지와 같은 정보도 있다. 그만큼 사고가 발생할 때 여파도 큰 셈이다.윤주경 국민의힘 의원은 “마이데이터 활용의 편리함과 확장 추세에도 불구하고, 데이터의 안전성과 민감한 개인정보 유출에 대한 우려가 커지고 있다"며 "사용자 동의 여부와 식별 가능성도 명확하게 규정하면서 개인정보 보호 장치에 대해서도 면밀하게 검토해야 한다”고 강조했다.
사업자 간 데이터 전송비 문제도 있다. 이용자가 데이터 이전을 요청했을 때 전송비를 감당하는 것은 업체 몫이다. 데이터와 이용자를 많이 보유한 대형 업체일수록 적정 수수료를 받지 못하면 손해가 발생하는 구조다. 반면 후발주자는 과도한 수수료를 산정해서는 안 된다는 입장이다. 마이데이터 사업을 먼저 시작한 금융권에서도 구체적 과금 기준을 마련하지 못하면서 논란이 되고 있다.
이상직 법무법인 태평양 변호사는 “개인의 데이터가 서비스가 되는 ‘협력 정보’ 시대 자체를 막을 순 없다”며 “정부의 후견적 사업자 관리와 업체의 개인정보 이용 내역 통지 구체화 등 추가 조치도 필요하다”고 전했다. 개보위 측은 “이해관계자의 다양한 의견 수렴과 보안 방비책을 기반으로 사업을 결론지을 예정”이라고 밝혔다.
참, 한 가지 더
'경영 선생님'된 소셜 데이터, 거시경제 지표까지 제시“수익과 직결되는 서비스에만 활용할 수 있는 것이 아닙니다. 거시경제 지표 역시 이용자의 ‘디지털 발자국’이 선명하게 남습니다.”
빅데이터 경제학자인 최재성 성균관대 글로벌경제학과 교수의 말이다. 최 교수는 페이스북·트위터 게시글 등 소셜 데이터와 파이선·R 등 프로그래밍 언어를 경제학에 접목한 전문가로 꼽힌다. 그는 최근 한국경제신문과의 인터뷰에서 “빅데이터 영역이 넓어지면서 경제적 가치도 커지고 있다”며 “경영환경 변화를 나타내는 데이터 지표가 늘고 있어 기업들이 주목해야 한다”고 말했다.
최 교수는 “기업이 좋은 제품을 만들고 마케팅을 펼치더라도 경기에 대한 정보와 소비 심리를 이해하지 못하면 성과를 얻기 힘들다”고 지적했다. 통계청은 지난해 소셜 데이터를 활용해 ‘나우캐스트 포털’을 선보이기도 했다. 이 서비스는 가계‧사업체‧일자리‧공중보건 등 4개 부문 지표를 빠르게 보여준다. 신한카드, SK텔레콤 등이 신용카드 거래 정보, 모바일 통신 위치정보 등을 제공한다. 미국에선 클리블랜드연방은행의 ‘인플레이션 나우캐스팅’, 애틀랜타연방은행의 실질 국내총생산(GDP) 예측 모델 ‘GDP 나우’ 등이 주목받고 있다.
소셜 데이터에 기반한 경기 지표는 다양해지고 있다. 한국은행의 뉴스심리지수, 한국개발연구원의 경제불확실성지수 등은 언론사의 뉴스 속 텍스트를 근간으로 한다. 보도 키워드를 종합적으로 추출해 경제 심리 변화를 포착하는 원리다. 최 교수는 “기존 지표 발표는 정기 조사된 데이터를 기반으로 1년에 네 번 정도 공표하는 형태가 많았지만 이제는 실시간 데이터를 반영하는 체계가 일반화되고 있다”고 설명했다.최 교수는 데이터 기반 프로그램 평가방법론으로 유명한 페트라 토드 미 펜실베이니아대 교수의 제자다. 그는 “영미권에선 영어 기반 자연어처리(NLP) 도구가 발전하면서 범용성 있는 분석 도구가 지속적으로 등장하고 있다”며 “국내 기업들은 한글에 기반한 NLP 분석 기술을 효율화해 이용자의 디지털 발자국을 얼마나 잘 활용하느냐가 중요해질 것”이라고 말했다.
이시은 기자 see@hankyung.com