개인화란 사용자의 과거 시청 이력으로부터 그 취향을 분석하고 이를 토대로 개별 사용자에게 맞춤화된 콘텐츠를 제공하는 것을 말한다. 초기 추천 서비스의 경우 사용자가 입력한 나이, 성별, 거주지와 같은 개인 정보에 따라 미리 준비해 둔 추천이 이뤄졌다. 이는 해당 범주에 속하는 대부분의 사용자에게 만족스러운 추천 결과를 제공해 줄 수는 있겠지만, 개인에 따라 서로 다른 결과를 제공해주는 개인화와는 다른 개념이다. 어도비 설문 조사에 따르면 콘텐츠가 개인화되지 않은 경우 소비자의 42%가 불만을 표출한다고 할 정도로 개인화 서비스는 필수적인 마케팅 전략이 됐다.
개인화에 필요한 데이터는 크게 사용자에 대한 데이터와 콘텐츠에 대한 데이터로 분류할 수 있다. 개인화를 위한 추천에 사용되는 알고리즘은 대표적으로 콘텐츠 기반 추천 방법과 협업 필터링 기반 추천 방법으로 나눌 수 있다. 콘텐츠 기반 추천은 다른 사용자의 데이터가 필요하지 않고, 새로운 아이템이나 인기 없는 콘텐츠도 추천이 가능해 비교적 가볍고, 콜드 스타트 문제(추천 시스템이 새로운 콘텐츠가 추가되는 경우 충분한 정보가 쌓일 때까지 추천이 어려워지는 현상)에 대처하는 데 있어 협업 필터링 기반 모델에 비해 비교적 효율적인 모델이다. 이때 콘텐츠 데이터는 해당 콘텐츠 제목이나 설명으로부터 많이 등장하거나 중요한 단어들을 추출해 벡터로 표현하고 사용자 데이터는 해당 사용자가 시청한 콘텐츠의 제목이나 설명으로부터 많이 등장하거나 중요한 단어들을 추출한 또 다른 벡터로 표현할 수 있다. 이제 두 벡터의 코사인값만 구하면 우리는 두 벡터가 얼마나 비슷한지 -1에서부터 1의 값으로 표현할 수 있게 된다. 즉, 사용자 데이터로 표현된 벡터와 콘텐츠 데이터로 표현된 벡터의 코사인값이 1에 가까울수록 사용자는 해당 콘텐츠를 좋아할 확률이 높다고 것을 의미한다.
이와 반대로 협업 필터링 방식은 대상 사용자와 비슷한 성향의 사용자들이 기존에 좋아했던 항목을 추천하는 기술이다. 콘텐츠 기반 추천 방법에 비해 계산량도 많고 위에서 설명한 콜드 스타트 문제를 가지고 있으나 많은 사용자의 실제 시청 이력 정보를 활용하기에 충분한 데이터가 쌓인 경우 콘텐츠 기반 추천에 비해 보다 더 성능이 높은 것으로 알려져 있어 대부분의 OTT 서비스 업체에서 기본적으로 채택하고 있는 개인화 알고리즘이다.
이렇게 다양한 OTT 서비스에서 활용되고 있는 개인화 방법들은 사용자에게는 내가 미처 알지 못했던 콘텐츠를 볼 수 있는 기회를 제공하고 OTT 업체들에는 사용자의 시청 시간 증대를 통한 매출 증가의 기회를 제공하는 유용한 방법이지만 사용자의 ‘확증 편향’을 증대시킬 수 있다는 위험성을 동시에 지니고 있다. 확증 편향이란 자신의 취향이나 생각과 일치하는 정보만을 지속적으로 받아들이면서 자신의 편향성이 점차 강화되는 것을 의미한다. 특히 유튜브와 같이 큰 영향력을 가진 콘텐츠 플랫폼에서 개인화 서비스를 통해 일어나는 무분별한 ‘취향 편식’은 서로 다른 가치관에 대한 몰이해와 무관심을 증대시키고 궁극적으로 갈등과 혐오를 양산하기도 한다.
√ 기억해주세요
빅데이터와 인공지능의 급격한 발전으로 좋아하는 콘텐츠 시청을 통해 많은 즐거움을 누리고 있다. 그러나 기술이 제공하는 편리함에 갇혀 나도 모르게 편향된 사고를 하고 있는 것은 아닌지 경각심을 가질 필요가 있다. 기술이 발전될수록 우리가 인문학과 세계사에 지속적인 관심을 두고 서로 다른 가치관을 가진 사람들과 지속적으로 소통해야 하는 이유다.한기준 한국전자통신연구원 지능화융합연구소 박사