[책마을] 맥락 없이 분석만 한다면, 당신이 바로 '데이터맹'
가중평균, 표준편차, 결정 계수(R값)…. 통계 프로그램을 돌려 나온 결과값들이다. 비전문가들이 볼 땐 그저 숫자에 불과하다. 데이터를 두고도 의미를 찾지 못한다. 4차 산업혁명 시대에 핵심 기술로 떠오르는 빅데이터. 어떻게 접근해야 할까.

《데이터 리터러시》를 딜로이트컨설팅의 강양석 컨설턴트가 데이터를 해석해 통찰을 얻는 방법을 설명한 책이다. 데이터를 어떻게 이해하고 확보해서, 의사결정을 할 때 설득 도구로 쓰는지를 소개한다. 이론 설명에 그치지 않고 16가지 실제 사례를 들어 구체적으로 해석해준다.

저자는 데이터는 수리 영역이 아니라 언어 영역에 속한다고 단언한다. 언어를 배우듯 익혀야 한다는 것이다. 그는 “데이터는 분석 대상이 아니라 소통 도구”라며 “외국어를 배울 때 문법을 배우는 것처럼 데이터 리터러시(문해력)가 필요하다”고 강조한다.

까막눈이 되지 않기 위해선 데이터를 걸러내야 한다. 분석에 앞서 불필요한 정보를 제거하라는 것이다. 저자는 “2019년 글로벌 컨설팅 업체 포레스터의 연구 결과에 따르면 기업들이 보유한 전체 데이터 중 60%는 사용되지 않고 쌓여만 있다”며 “서버 유지 비용만 늘리는 셈이다. 디지털 전환의 핵심은 쌓는 게 아니라 쓰는 데 있다”고 설명한다.

쓸데없는 정보를 모으는 이유는 뭘까. 불통 때문이다. 그는 “데이터를 소수가 독점하려는 욕심 탓에 공유하지 않는다”며 “공유가 안 되면 검증할 길이 막히고 활용률도 떨어진다”고 지적한다.

데이터가 언어처럼 널리 전파돼야 정제된다는 설명이다. 담금질할 때 가장 중요한 건 맥락을 파악하는 능력이다. 저자는 “데이터 자체는 답이 아니다”고 꼬집는다. 맥락에 맞게 바라보고 해석할 때 데이터는 역할을 발휘한다는 것. 데이터 분석 툴만 학습 대상으로 삼는 건 지양해야 한다는 얘기다.

저자에 따르면 데이터 분석 과정의 끝은 설득이다. 이야기를 어떻게 풀어가는지의 역량이 중요하다. 그는 “좋은 데이터를 가져와도 상대가 듣지 않으면 성공할 수 없다”며 “집중도를 높이려면 스토리텔링이 필요하다. 결과값들로 상대를 겁먹게 하지 말고 논리 구조를 구축해서 이야기에 빠져들게 해야 한다”고 역설한다.

오현우 기자 ohw@hankyung.com