[전지선의 4차 산업혁명 시대의 투자, P2P금융] (3)빅데이터 활용이 금융혁신 미래 좌우한다
최근 델라웨어대 연구팀의 빅데이터 분석을 보면 흥미롭다. 연구팀은 미국 P2P(개인 간 거래) 금융회사 프로스퍼(Prosper) 데이터를 분석해 대출자가 대출 목적을 기술할 때 쓰는 특정 단어가 해당 채권의 부실 여부와 통계적으로 유의미한 상관관계가 있다고 분석했다. 구체적으로 ‘믿음, 약속한다, 꼭 갚겠다(will pay)’는 표현이 자주 등장하면 대출자의 상환 가능성이 낮았고, ‘최저임금, 졸업, 세후(after-tax)’의 경우에는 상환 가능성이 높았다.

이런 연구가 가능했던 이유는 해외 P2P 금융회사들이 여러 가지 데이터를 축적하는 데 역량을 기울이면서 투명하게 공개하고 있기 때문이다. 렌딩클럽은 매 분기 100만 건이 넘는 채권에 대해 100개가 넘는 변수를 공개한다. 금융거래 이력, 렌딩클럽이 매긴 등급과 이자율, 채권의 현재 상태, 대출자의 대출 목적 설명 등을 담고 있는 데이터를 통해 잠재적 투자자는 렌딩클럽의 심사 알고리듬(algorithm)을 직접 분석하고 검증할 수 있다. 데이터 분석에 관심이 있는 연구자라면 누구나 알고리듬을 개선할 방안을 모색해 볼 수 있다. 회사는 투자자의 신뢰와 기술 향상이라는 두 마리 토끼를 한 번에 잡는 셈이다.

국내 P2P 금융업의 빅데이터 활용은 시작 단계에 있다. 활용의 잠재력을 가진 다양한 데이터를 효과적으로 축적하는 데 초점을 맞춰야 한다. 정형 정보가 많은 분야에 집중하는 회사는 상대적으로 유리한 위치에 있다. 부동산을 전문으로 하는 일부 회사는 과거 부동산 거래 정보를 바탕으로 다양한 거시 지표와 연동해 부동산 가격 변동을 예측하기 위한 알고리듬을 개발 중이다. 필자가 대표로 있는 모우다는 병·의원의 폐업률과 개별 의사의 부실 가능성 예측을 위해 지역별 인구, 소득, 병·의원 입지, 의사 개인의 채무상황, 대출신청 시 행태정보 등 다양한 원천의 데이터를 축적하고 있다. 국내 P2P 금융이 3~5년 뒤 빅데이터의 효율적인 활용을 통해 금융을 얼마나 혁신했을지 기대된다.

카카오톡에서 ‘WOW스타P2P’를 친구 추가하면 더 많은 정보를 얻을 수 있다.