[한경에세이] 빅데이터 개념 다시 쓰기
입력
수정
지면A37
강형준 < 클라우데라코리아 지사장 akang@cloudera.com >나는 종종 빅데이터를 주제로 강의를 한다. 몇 해 전 한 청강자가 빅데이터는 데이터 크기를 말하는 것 아니냐며 스몰(작은) 데이터와 미들(중간) 데이터를 설명해 달라고 했다. 나는 이런 질문을 받을 때마다 빅데이터 개념을 다시 말해주곤 한다. 빅데이터는 모든 유형의 데이터를 진정으로 활용할 수 있게 하는 것이지 결코 데이터 크기를 말하는 것이 아니라고. 사실, 빅데이터는 크기를 따지지 않는다.
세계는 코로나 팬데믹을 겪으면서 데이터 공유와 활용의 중요성을 절감하고 있다. 코로나19에 대한 치료법을 관리, 진단, 개발하기 위해 빅데이터 분석을 활용하며, 백신 접종 과정에서 발생한 데이터도 빅데이터를 통해 관리된다. 그렇다면 포스트 코로나 시대의 빅데이터는 어떨까? 최근 정부와 기업들의 행보에서 그 중요성을 쉽게 알 수 있다. 빅데이터는 분명 미래의 성장동력이다.IDC 보고서에 따르면 전 세계 데이터 생성의 총합이 2025년에 175제타바이트(ZB, 1ZB=1000조바이트)에 달할 것이라고 한다. 엄청난 양이기도 하고, 매년 61% 늘어난다고 하는데, 그 증가세가 가히 ‘데이터 폭풍’이다. 그렇다 보니 데이터를 이해하고 관리하는 것이 중요한 과제로 떠오르게 된다. 여기에 더해 빅데이터 개념이 점점 변화됐기 때문에 활용 방법 또한 달라져야 한다는 목소리도 있다.
한 예로 데이터 분석에 인공지능(AI)과 머신 러닝을 활용하는 것이다. 빅데이터 사용 목적은 대부분 비즈니스의 미래 예측이다. 기하급수적으로 증가하는 데이터의 양으로 인해 기존 방식으로는 미래 고객에게 더 나은 서비스를 제공할 수 없어 머신 러닝과 AI를 이용한다. 이처럼 불확실성의 시대에 접어들면서 기업 비즈니스에 미칠 악영향을 최소화하고 고객에게 최적화된 서비스를 제공하려면 데이터 활용 방식과 영역을 적극적으로 확장할 필요가 있다.
데이터가 늘어나는 만큼 위험 수위도 높아진다. 고객은 기업이 보유한 데이터에 점차 민감해지고 있다. 데이터를 잘못 관리하면 기업에 심각한 위험을 초래한다는 사실을 뉴스로 접해 봤을 것이다. 거버넌스(조직 운용의 제반 장치)가 중요해진 이유다. 이제 데이터 보안과 거버넌스 문제를 기업 회의실로 들여와야 한다. 개인의 데이터가 어떻게 사용됐는지 알 권리가 강조돼야 한다.
각국의 정부는 데이터의 잠재적인 위험을 입법으로 해결하려 한다. 대표적으로 유럽연합(EU)을 필두로 세계 60여 개 국가가 엄격한 개인 정보보호 규정을 제정해 시행하고 있다. 이제 데이터 보안과 거버넌스는 기업 과제이자 경쟁 우위 요소다. 데이터는 지하창고에 쌓아 놓는 것이 아니다. 꺼내서 사용해야 하는 움직이는 자산이다. 데이터라는 이 자산이 무엇을 담고 있는지, 어떻게 사용할지에 대한 해답을 찾는 것이 빅데이터의 가장 큰 역할 중 하나인 것이다.