"분석역량 가진 데이터 전문가 확보 경쟁 치열해 진다"
“이제 데이터 분석 능력은 선택이 아닌 필수입니다.”
국내 빅데이터 전문가 김진호 교수는 “앞으로 분석적역량(analytical talent)를 갖춘 데이터 전문가를 확보하려는 기업 간 경쟁이 더욱 치열해질 것”이라며 이같이 말했다.

데이터엔 내가 한 모든 행동이 담긴다. 오늘 아침 지하철에서 들은 음악부터 식사를 위해 들른 식당까지···. 기업 입장에서 데이터는 시장과 고객에 대한 모든 정보가 담겨있는 보물창고다. 세계는 이제 어느 산업에 있든, 어느 조직에서 일하든 ‘데이터’로 넘쳐나고 있다. 숫자로 말하는 사람이 성공하는 데이터분석 경영 시대가 도래한 것이다. 4차 산업혁명 시대 핵심 기술로 사물인터넷(IoT), 빅데이터, 인공지능이 꼽힌다. 데이터를 적재적소에 활용하는 기업은 경쟁 우위를 점하기 시작했고 관련 인재를 채용하기 위한 경쟁도 심화하고 있다. 데이터 분석 능력은 비단 데이터 전문 직종에만 요구되지 않는다. 이제 데이터를 활용하는 능력은 직업인이 미래 사회에서 살아남기 위한 필수 역량이다.

한경 잡아라 기자단은 국내 최초로 서울과학종합대학원(aSSIST)에 AI 관련 학과를 창설한 빅데이터 전문가 김진호 교수(현 스위스 경영대학 교수)를 만나 취업 시장에서 데이터 분석 능력의 중요성을 물었다 .

◆데이터 활용할 줄 아는 인재, 기업이 모셔간다
사회 곳곳에서 데이터의 중요성이 강조되고 있다. 최근 업종을 가리지 않고 여러 분야에서 데이터를 사용하면서 데이터 분야 개발자의 몸값이 오르고 있다. 한국경제 긱스(Geeks) 보도에 따르면, 올해 시니어급 데이터사이언티스트 최대 연봉은 5500만원에서 7000만원으로 뛸 것으로 전망됐다. 김 교수는 이와 같은 현상에 대해 “데이터 활용 능력이 기업의 생존과 직결되고 있기 때문이다”고 말했다. 현재 빅데이터는 거의 모든 산업과 경영의 기능을 변화시키고 있다. 따라서 데이터에서 추출한 정보를 기업 의사결정에 잘 활용할 수 있는가가 중요해졌다는 것이다. 김 교수는 “진화론의 창시자인 찰스 다윈에 따르면 ‘살아남는 종은 가장 강한 것도 아니고 가장 똑똑한 것도 아니라 변화에 가장 잘 적응하는 종’이다”라며 “기업이 변화에 적응하지 못한다면 경쟁에서 낙오될 수밖에 없다”고 말했다. 기업 경쟁에 살아남기 위해선 데이터 활용 능력은 필수란 것이다.

현재 여러 기업에선 채용 시 데이터 분석 능력을 가진 지원자를 우대하고 있다. 캐논코리아, 케이씨씨 등 주요 대기업은 문과 직무에서 데이터분석능력이 있는 지원자를 우대하거나 데이터분석 직무를 따로 채용하고 있다. 김 교수에 따르면 AI, 빅데이터 시대는 한 마디로 말하면 ‘데이터 기반 의사결정(data-driven decision making)’의 시대라고 할 수 있다. 간단히 말하면 기업의 모든 결정을 데이터 기반으로 한다는 것이다. 기업은 관련된 데이터가 있다면 이를 분석해 의사결정에 활용한다. 관련 데이터가 없다면 또다른 데이터를 파악/수집/분석해 의사결정에 활용한다.

"분석역량 가진 데이터 전문가 확보 경쟁 치열해 진다"
◆예견된 미래 ‘데이터의 시대’
김진호 교수는 2015년 국내 최초로 AI 빅데이터 관련 학과를 창설했다. 데이터가 지배하는 경영은 예견된 미래였기 때문이다. 그는 학부 시절 소비자 계량선택 모델과 통계학을 전공했다. 당시 우연히 빅데이터 분석에 필요한 포트란(Fortran)이란 프로그램을 독학으로 배우면서 AI 빅데이터 전문학과를 설립을 위한 준비를 시작했다. 데이터는 경영학의 시작부터 중요하게 활용돼 왔다. 그러나 정보의 양이 폭발적으로 증가하면서 그 양상이 변화하기 시작했다. 오픈소스가 확산되면서 과거에 비해 데이터 분야 진입장벽이 낮아지고 있다. 그는 “이제 빅데이터 분야에서의 경쟁은 ‘분석적 역량’에 좌우되고 있다”고 말했다. 다만 빅데이터 분야는 폭도 넓고 깊이도 넓기 때문에 한 사람이 모든 것을 정통하기는 불가능하다. 따라서 동료들과의 협력적인 작업이 매우 중요하다. 김 교수는 “AI 빅데이터 석박사 과정으로 협력하는 역량을 강화하고자 했다”고 말했다.

데이터는 어디에나 있지만 스스로 정보를 뱉어내지 않는다는 특징이 있다. 이 특징으로 인해 데이터 관련 직종은 더욱 각광받는다. 김 교수는 “데이터는 우리가 충분히 노력해야 비로소 데이터 속에 들어 있는 사실을 토해 놓는다”며 “데이터 사이언티스트가 유망 직종인 이유는 바로 데이터 기술자, 즉 데이터를 모으고 저장하고 분석하고 그 결과를 해석해서 의사결정에 활용하는 전문가들이기 때문이다”고 말했다. 기업 간 경쟁의 핵심은 바로 데이터 확보 및 분석의 경쟁이며, 그 선봉에 데이터 사이언티스트가 있는 것이다. 그는 “데이터의 양은 앞으로도 더욱 가파르게 늘어날 것이며 이러한 추세는 돌이킬 수 없을 것이다”라며 “데이터 관련 직종에 대한 수요는 항상 공급을 넘어설 것이다”라고 말했다. 실제로 소프트웨어정책연구소(SPRI)의 ‘인공지능 산업 실태조사’에 따르면 2021년 기준 AI데이터 분석가 부족 인력은 160명, AI 개발자 부족 인력은 2885명인 것으로 드러났다.

◆문과생도 데이터 활용 충분히 가능
데이터를 다루는 일이 익숙치 않은 문과생이라면 데이터에 관해 거리감을 느낄 수 있다. 그러나김 교수는 “스스로 명확한 동기만 있다면 데이터 분석 능력에 전공은 큰 문제가 되지 않는다”고 말했다. 그에 따르면 현재 활동하고 있는 데이터 사이언티스트들의 전공은 다양하다. 그는 “데이터 사이언티스트도 구체적으로 들어가보면 하는 역할이 다르다”고 말했다. 데이터 사이언티스트는 크게 세 종류로 구분된다. 데이터 분석가(Business Analyst), 데이터 엔지니어(Data Engineer), 머신 러닝 엔지니어(Machine Learning Engineer)다. 데이터 분석가는 경영학적 문제 해결을 위한 분석에 초점을 맞춘다. 따라서 문과 전공자도 도전할 수 있다. 데이터 엔지니어는 데이터 저장과 처리에 정통하다. 따라서 컴퓨터공학 전공자에게 유리하다. 머신 러닝 엔지니어는 통계나 기계학습 모델을 적용하는 직업이다. 따라서 통계학이나 산업공학 전공자에게 유리하다. 김 교수는 “자신의 배경에 맞는 데이터 사이언티스트로 성장하면 된다”며 “필요에 따라 충분히 영역을 넓혀갈 수도 있다”고 말했다.

취업준비생이라면 데이터에 대한 이해와 분석 능력을 다져야 한다. 김 교수는 “데이터 기반 경영의 시대에 기업에서 가장 필요로 하는 인재는 ‘데이터 기반 의사결정’을 할 수 있는 사람”이라 말했다. 이어 “앞으로는 어느 분야에서 어떤 경력을 쌓고 있건 간에 개인의 성공은 데이터 분석능력에 따라 크게 좌우될 것이다”라며 “취업준비생이라면 분석에 대한 이해뿐만 아니라 폭넓은 안목과 분석능력을 배양하도록 노력해야 한다”고 강조했다.
한경 잡아라 기자단 박재현·김가은 대학생 기자

-----------------------------------------------------------
<데이터 분석능력을 기르는 방법>
그렇다면 데이터 분석 능력은 어떻게 기를 수 있을까. 김 교수는 “데이터 분석 능력은 자기계발의 블루오션”이라며 “문맹보다 무서운 수맹(數盲)에서 벗어나라”고 말했다. 데이터 분석의 6단계를 짚어보며 데이터 분석에 대해 알아보자.

-1단계 : 문제인식
문제가 무엇인지 파악하고 왜 이 문제를 해결해야 하는지, 문제 해결을 통해 무엇을 달성할 것인지 파악한다.
-2단계 : 관련연구조사
문제와 관련된 지식을 각종 문헌(잡지, 책, 보고서, 논문 등)을 통해 조사한다. 문제와 관련된 주요 변수들, 예를 들어 사람, 상황, 행위 등을 나타내는 지능지수, 나이, 방 안 온도 등을 파악한다. 분석에서 가장 중요한 단계이다.
-3단계 : 모형화(변수 선정)
문제와 본질적으로 관련된 변수를 추려 재구성한다. 이 과정은 캐리커처를 그리는 것과 유사하다. 캐리커처에서 의도적으로 인물이 가진 중요한 코, 눈, 머리 등의 특징을 강조하고 나머지는 무시하는 것처럼 모형화에서도 불필요한 변수를 버린다.
-4단계 : 자료수집(변수 측정)
변수가 선정되면 해당 변수들을 측정해야 한다. 문제라고 인식된 것들을 주요 변수로 재구성하고 측정이란 자료를 거쳐 자료로 만든다.
-5단계 : 자료분석
자료분석은 나열된 숫자에서 변수 간에 규칙적인 패턴, 즉 변수 간 관련성을 파악하는 것이다. 예를 들어 유권자의 투표 성향을 분석하기 위해 지역별, 성별, 나이별로 특정 후보에 대한 지지도를 설문조사로 수집했다고 가정하자. 수집된 자료에서 유권자의 투표 패턴을 파악하는 것이 자료 분석이다.
-6단계 : 결과제시
자료분석을 통해 변수 간 관련성이 파악되면 결과가 의미하는 바를 해석해 의사결정자에게 구체적인 조언을 한다. 연구 과정의 개요, 결과 요약, 문제를 해결하기 위한 권고, 다양한 차트와 그래프의 활용을 포함한다.