구글 '독감예보' 는 수많은 클릭의 조합
-
기사 스크랩
-
공유
-
댓글
-
클린뷰
-
프린트
넘치는 정보 엮어 미래 예측 '빅데이터'
IBM·오라클…고객관리 등에 활용
IBM·오라클…고객관리 등에 활용
구글이 독감을 예보한다. 그것도 미국 보건당국보다 더 빠르게.
황당하게 들릴 수 있지만 사실이다. 구글은 독감 증세 환자가 늘면 ‘감기’와 관련된 단어를 검색하는 빈도가 함께 증가한다는 패턴을 발견했다. 이를 미국 질병통제예방센터 데이터와 비교해본 결과 검색 빈도와 실제 독감 증세를 보인 환자 숫자 사이에 밀접한 상관관계가 있다는 사실을 밝혀냈다. 구글은 이 같은 분석을 바탕으로 웹사이트를 통해 시간 및 지역별 독감 유행 정보를 미국 보건당국보다 한발 앞서 제공하고 있다.
구글이 이처럼 정부 당국보다 앞서 정보를 분석할 수 있는 이유는 수많은 사용자들이 인터넷에 온갖 종류의 흔적을 남기기 때문이다. 인터넷에 접속해 이뤄지는 모든 행동은 일종의 상호작용이다. 가령 특정 웹사이트에 로그인을 하거나 게시물을 읽을 경우 해당 웹사이트 서버에 요청 기록이 남는다. 실로 막대한 양의 정보들이 쌓이는 것이다. 기업들 사이에서는 이 같은 정보를 분석해 유의미한 정보를 만들어내려는 시도가 이어지고 있다. 기본적인 통계는 물론 미래를 예측하려는 움직임도 있다. 이른바 ‘빅 데이터’의 시대다.
○‘빅 데이터’의 시대
소셜네트워크서비스(SNS) 이용자가 급증하고 스마트폰, 태블릿PC 등 모바일 기기가 보편화하면서 사람들이 인터넷에 접속하는 시간의 총량도 크게 늘어났다. 이들이 남기는 데이터 역시 ‘폭증’한 상황이다. 글로벌 정보기술(IT) 기업인 EMC가 지난 6월 발표한 자료에 따르면 올 한 해 생성 및 복제되는 디지털 정보의 양은 1.8제타바이트에 이를 것이라고 한다. 32기가바이트 용량의 아이패드 575억개가 필요한 숫자다. 이 아이패드를 늘어 놓으면 서울 전체를 두 번 덮고도 남는다. 이 같은 정보량은 2년마다 2배씩 늘어나 2020년에는 관리해야 할 정보량이 지금보다 50여배 늘어날 것이란 예측까지 나오고 있다.
막대한 정보의 홍수 속에서 의미있는 정보를 찾아 미래를 예측하려는 분석은 이미 시도되고 있다. IBM, 오라클, EMC, SAS 등의 업체들이 이런 흐름을 이끌어 나가고 있다. ‘빅 데이터’로 통칭되는 이 작업은 모바일 센서, 소셜 미디어, CCTV, 의학 영상 자료, 스마트그리드 등 데이터가 폭발적으로 늘어날 수 있는 분야에서 일부 활용되고 있기도 하다.
미국의 한 모바일 통신업체는 이 같은 빅데이터 분석을 통해 고객이 이탈하는 이유와 경로를 밝혀내기도 했다. 이 통신업체는 자사의 고객이 타사로 옮겨가거나 계약을 해지하는 주된 원인을 밝혀내기 위해 일정 기간 계약 해지자의 데이터를 추출해 분석했다. 그 결과 인적 네트워크가 넓고 통화량이 많은 사람이 계약을 해지하면 그와 네트워크를 맺은 고객 가운데 추가 이탈 고객이 많이 나타난다는 사실을 밝혀냈다. 이 통신업체는 인적 네트워크가 넓고 통화량이 많은 고객을 중점적으로 관리하는 정책을 도입해 잠재적 고객 이탈률을 크게 낮출 수 있었다.
미국 온라인 쇼핑몰 이베이에서는 6000여명의 직원이 고객 데이터를 분석·가공하는 일을 하고 있다. 맥킨지의 최근 보고서는 “미국 내에서만 14만~19만명의 정보분석 전문인력이 필요할 것”이라고 내다보기도 했다. IT 전문지 인포월드는 올해 미국에서 가장 각광받는 신종 IT 직업 6가지 가운데 하나로 데이터 과학자를 꼽기도 했다. 활동 범위가 크게 늘어날 것이란 이유에서다. 김경진 한국EMC 대표는 “단순히 정보와 지식을 쌓기만 하는 저장의 시대를 넘어 활용 가치에 집중하는 분석의 시대로 나아가야 한다”고 강조했다.
○새로운 ‘빅 브러더’ 등장?
하지만 데이터 분석이 세분화, 전문화할수록 프라이버시 침해에 대한 불안감이 늘어나는 것도 사실이다. 빅 데이터가 새로운 ‘빅 브러더’의 등장을 예고하는 것이란 우려도 있다. 특히 올해 들어 네이트·싸이월드, 넥슨 메이플스토리, 현대캐피탈 등이 잇따라 해킹당하며 대규모 개인정보가 유출되기도 했다. 앞서 구글의 독감 예보처럼 빅 데이터를 통해 사회의 공익 증진 등 공공선에 기여할 수 있는 것은 사실이다. 하지만 구글을 비롯한 수많은 기업들은 개인들의 데이터를 수집해 맞춤 광고, 특화 서비스 등을 제공하며 매출 증진에 힘을 쏟는 것도 사실이다. 임종인 고려대 정보보호대학원장은 “빅 데이터를 통해 더 편리한 정보를 접할 수 있지만 그 뒤편에서 누가 어떻게 정보를 관리하는지에 대해서도 관심을 가져야 한다”고 말했다.
이승우 기자 leeswoo@hankyung.com
황당하게 들릴 수 있지만 사실이다. 구글은 독감 증세 환자가 늘면 ‘감기’와 관련된 단어를 검색하는 빈도가 함께 증가한다는 패턴을 발견했다. 이를 미국 질병통제예방센터 데이터와 비교해본 결과 검색 빈도와 실제 독감 증세를 보인 환자 숫자 사이에 밀접한 상관관계가 있다는 사실을 밝혀냈다. 구글은 이 같은 분석을 바탕으로 웹사이트를 통해 시간 및 지역별 독감 유행 정보를 미국 보건당국보다 한발 앞서 제공하고 있다.
구글이 이처럼 정부 당국보다 앞서 정보를 분석할 수 있는 이유는 수많은 사용자들이 인터넷에 온갖 종류의 흔적을 남기기 때문이다. 인터넷에 접속해 이뤄지는 모든 행동은 일종의 상호작용이다. 가령 특정 웹사이트에 로그인을 하거나 게시물을 읽을 경우 해당 웹사이트 서버에 요청 기록이 남는다. 실로 막대한 양의 정보들이 쌓이는 것이다. 기업들 사이에서는 이 같은 정보를 분석해 유의미한 정보를 만들어내려는 시도가 이어지고 있다. 기본적인 통계는 물론 미래를 예측하려는 움직임도 있다. 이른바 ‘빅 데이터’의 시대다.
○‘빅 데이터’의 시대
소셜네트워크서비스(SNS) 이용자가 급증하고 스마트폰, 태블릿PC 등 모바일 기기가 보편화하면서 사람들이 인터넷에 접속하는 시간의 총량도 크게 늘어났다. 이들이 남기는 데이터 역시 ‘폭증’한 상황이다. 글로벌 정보기술(IT) 기업인 EMC가 지난 6월 발표한 자료에 따르면 올 한 해 생성 및 복제되는 디지털 정보의 양은 1.8제타바이트에 이를 것이라고 한다. 32기가바이트 용량의 아이패드 575억개가 필요한 숫자다. 이 아이패드를 늘어 놓으면 서울 전체를 두 번 덮고도 남는다. 이 같은 정보량은 2년마다 2배씩 늘어나 2020년에는 관리해야 할 정보량이 지금보다 50여배 늘어날 것이란 예측까지 나오고 있다.
막대한 정보의 홍수 속에서 의미있는 정보를 찾아 미래를 예측하려는 분석은 이미 시도되고 있다. IBM, 오라클, EMC, SAS 등의 업체들이 이런 흐름을 이끌어 나가고 있다. ‘빅 데이터’로 통칭되는 이 작업은 모바일 센서, 소셜 미디어, CCTV, 의학 영상 자료, 스마트그리드 등 데이터가 폭발적으로 늘어날 수 있는 분야에서 일부 활용되고 있기도 하다.
미국의 한 모바일 통신업체는 이 같은 빅데이터 분석을 통해 고객이 이탈하는 이유와 경로를 밝혀내기도 했다. 이 통신업체는 자사의 고객이 타사로 옮겨가거나 계약을 해지하는 주된 원인을 밝혀내기 위해 일정 기간 계약 해지자의 데이터를 추출해 분석했다. 그 결과 인적 네트워크가 넓고 통화량이 많은 사람이 계약을 해지하면 그와 네트워크를 맺은 고객 가운데 추가 이탈 고객이 많이 나타난다는 사실을 밝혀냈다. 이 통신업체는 인적 네트워크가 넓고 통화량이 많은 고객을 중점적으로 관리하는 정책을 도입해 잠재적 고객 이탈률을 크게 낮출 수 있었다.
미국 온라인 쇼핑몰 이베이에서는 6000여명의 직원이 고객 데이터를 분석·가공하는 일을 하고 있다. 맥킨지의 최근 보고서는 “미국 내에서만 14만~19만명의 정보분석 전문인력이 필요할 것”이라고 내다보기도 했다. IT 전문지 인포월드는 올해 미국에서 가장 각광받는 신종 IT 직업 6가지 가운데 하나로 데이터 과학자를 꼽기도 했다. 활동 범위가 크게 늘어날 것이란 이유에서다. 김경진 한국EMC 대표는 “단순히 정보와 지식을 쌓기만 하는 저장의 시대를 넘어 활용 가치에 집중하는 분석의 시대로 나아가야 한다”고 강조했다.
○새로운 ‘빅 브러더’ 등장?
하지만 데이터 분석이 세분화, 전문화할수록 프라이버시 침해에 대한 불안감이 늘어나는 것도 사실이다. 빅 데이터가 새로운 ‘빅 브러더’의 등장을 예고하는 것이란 우려도 있다. 특히 올해 들어 네이트·싸이월드, 넥슨 메이플스토리, 현대캐피탈 등이 잇따라 해킹당하며 대규모 개인정보가 유출되기도 했다. 앞서 구글의 독감 예보처럼 빅 데이터를 통해 사회의 공익 증진 등 공공선에 기여할 수 있는 것은 사실이다. 하지만 구글을 비롯한 수많은 기업들은 개인들의 데이터를 수집해 맞춤 광고, 특화 서비스 등을 제공하며 매출 증진에 힘을 쏟는 것도 사실이다. 임종인 고려대 정보보호대학원장은 “빅 데이터를 통해 더 편리한 정보를 접할 수 있지만 그 뒤편에서 누가 어떻게 정보를 관리하는지에 대해서도 관심을 가져야 한다”고 말했다.
이승우 기자 leeswoo@hankyung.com