[한경에세이] '빅 데이터'와 '딥 데이터'
입력
수정
지면A37
분야별로 특화된 딥 데이터…거대한 잡동사니 빅 데이터살아온 시간의 스펙트럼이 넓어질수록 세상에 대한 시선이 달라진다. 눈에만 보이는 것보다 만질 수는 없어도 숨겨진 가치가 더 큰 것들이 보이기 시작한다.
사이버 세계의 새로운 자원…관심 갖고 개발 적극 나서야
윤종록 < 정보통신산업진흥원장 jonglok.yoon@nipa.kr >
유형의 제품은 무료로 제공하고, 무형의 서비스가 매매 대상이 되는 세상으로 바뀌고 있다. 사람들은 이제 더 이상 정수기를 사지 않는다. 그 대신 때가 되면 알아서 필터 교환과 살균 등을 해주는 정수기 관리 서비스를 구매한다.자원도 마찬가지다. 그동안은 손에 잡히는 천연자원이 중요했다. 이젠 눈에 보이지 않는 새로운 자원에 관심을 가질 때가 왔다. 이 같은 이치는 사이버 세상에서도 똑같이 적용된다.
우리는 원석을 가공해 철 백금 구리 등 자원을 뽑아낸다. 온라인 세계에선 여기저기 흩어진 거대한 데이터를 채굴, 가공해 ‘쓸모 있는 서비스’로 탈바꿈시킨다. 스마트폰 소지자의 이동 경로를 파악하면 버스 노선을 최적화할 수 있다. 방대한 건강 진료 데이터는 국민 건강의 현재와 미래를 예측할 수 있는 자원으로 재탄생한다. 이런 공공 데이터는 질이 높은 광석이다. 필자는 이를 “깊은 가치가 담겨 있다”는 의미로 ‘딥 데이터(deep data)’라고 부른다.
반면 수십억명이 이용하는 소셜네트워크서비스(SNS)에 떠도는 온갖 정보는 엄청난 규모의 노천광산에 비유할 수 있다. 노천광산에는 추출할 자원이 많은 원석부터 그렇지 않은 것까지 한꺼번에 몰려 있다. 이것이 빅 데이터다. 그래도 빅 데이터는 매우 중요하다. 미량이지만 다양한 성분이 함유돼 있기 때문이다.미국 뉴저지주립대에선 컴퓨터공학과 언론학 전공을 융합한 신규 학과를 개설했다. 거기서 개발한 프로그램으로 버락 오바마 대통령이 국정연설을 하는 동안 소통되는 대량의 SNS를 분석한다. 연설이 끝나는 순간, 연설에 언급된 수십 가지 주제에 대한 미국인의 반응을 성별 나이별 지역별로 정확히 분석한다.
세계인이 이용하는 SNS에서 내뿜는 거대한 ‘잡동사니 데이터’는 정제하는 데 많은 에너지가 필요하다. 그렇지만 이를 통해 다양한 서비스를 창출해 낸다. 반면 의료와 교통, 세금, 교육 등 분야별로 특화된 데이터는 마치 순도 높은 고농축 원석과도 같은 존재다. 이것이 빅 데이터와 딥 데이터의 차이다. 이제 디지털 세상에 또 하나의 자원 경제가 기다리고 있다.
윤종록 < 정보통신산업진흥원장 jonglok.yoon@nipa.kr >