[한경에세이] 길보드와 빅데이터
긴장을 하면서 카세트 플레이어의 녹음 버튼에 손을 대고 있다가 라디오 진행자의 곡 소개가 끝나자마자 재빠르게 녹음 버튼을 누른다. 하지만 아뿔싸! 갑자기 끼어든 진행자의 내레이션 때문에 낭패감과 함께 분노의 감정이 일곤 했다. 1980년대 용돈이 궁했던 학창시절 우리 또래가 음악을 소비하는 방식이자 추억 속의 풍경이었다. 또 다른 대안은 리어카 행상이 파는 불법 복제된 음악 테이프를 구매하는 것이었다. 단돈 1000~2000원이면 최신가요가 빼곡하게 들어 있는 노래 테이프를 살 수 있었다.

불법 복제 테이프에 담긴 노래들은 1~2주 후면 텔레비전 인기가요 순위 프로그램에서 종종 1등을 차지하곤 해 ‘길보드 차트’라는 명성을 얻기도 했다. 지금 생각해보면 정식으로 유통되던 음반보다 불법 복제 테이프들이 훨씬 더 많이 팔렸고, 이 데이터의 힘으로 대중이 선호하는 음악을 찾아낼 수 있었던 게 아닐까 싶다. 일종의 빅데이터의 승리였다고 봐도 될 것이다.

최근 빅데이터가 경제 분야는 물론이고 우리의 일상을 크게 바꾸고 있다. 인터넷 검색 결과를 분석해 독감 유행을 사전에 예측하고, 운전자들이 수집한 막대한 교통정보를 활용해 명절에 막히지 않는 도로를 알려주기도 한다. 미국 보스턴 테러범을 체포할 때도 사진, 동영상, 통화기록 등의 빅데이터 분석이 큰 역할을 했다고 한다. 하지만 빅데이터라고 하면 ‘빅브러더’가 연상된다고도 하고, ‘나는 네가 지난 여름에 한 일을 알고 있다’는 식으로 개인의 프라이버시 침범에 이용될 수 있다는 우려도 있다.

데이터 자체는 규모가 아무리 커도 가치가 없다. 그것을 분석하고 이용하는 사람이 가치를 만들기도 하고 악용하기도 하는 것이다. 빅데이터의 투명성을 확보하면서 활용 범위 확대와 개인정보 보호 사이의 균형을 찾는 노력이 필요한 이유다. 통계청은 현재 ‘빅데이터 연구회’를 운영 중이며, 안전행정부와 함께 정부부처가 공동으로 활용할 수 있는 빅데이터 공통 기반을 구축하고 있다.

현재 빅데이터에서 다루고 있는 데이터 규모는 10의 15승, 즉 1000조 바이트로 해운대 백사장의 모래알 전체 개수 정도다. ‘사람의 생각으로는 이루 헤아릴 수 없다’는 뜻을 가진 한자 불가사의(不可思議)를 숫자로 표현하면 10의 64승이라고 한다.

미래의 빅데이터가 다루는 규모가 불가사의 수준까지 이르렀을 때 세상은 어떻게 변할 것인가. 불가사의하다.

박형수 통계청장 hspark23@korea.kr