[스타트업! 스타(29)] 그린라이트, 맞나요 …'빅데이터'에 묻는 '텍스트앳'
-
기사 스크랩
-
공유
-
댓글
-
클린뷰
-
프린트
[ 김효진 기자 ] 사랑도 정보기술(IT)로 풀어내는 시대가 왔다. "보고 싶다"고 직접 표현하지 않아도 메시지 문맥, 행간을 꿰뚫어 숨긴 마음을 읽어낸다. 60만 명이 주고받은 12억 개 이상의 대화 데이터베이스(DB)를 통해서다.
소설 '우리는 사랑일까'에서 알랭 드 보통이 사랑에 철학을 접목했다면, 어플리케이션(앱) '텍스트 앳'은 같은 질문을 '빅 데이터'로 답한다. 정확도는 80% 이상이다.
김종윤(사진·29) 스캐터랩 대표는 "사랑을 얻기 위해 타로점을 보는 시대는 갔다"고 강조한다. '선톡'(먼저 메시지를 보내는 것), '읽씹'(메시지를 읽기만 하고 답장하지 않는 것), '그린라이트'(서로 마음이 통하는 상태) 등 연애 신조어가 난무하는 시대에 걸맞는 해결책을 제시했다.
◆ 카톡·문자 감정 분석하는 최초 앱
"같은 말을 하더라도 관심있는 사람과 관심없는 사람에게 보내는 메시지는 다릅니다. 아무리 마음을 감추려고 해도 내용, 형식, 뉘앙스에서 미묘한 차이들이 드러나죠. 무의식적으로 말이에요. 그 뭔가 다른 부분을 감지하고 읽어내려고 했습니다."
텍스트앳은 모바일 메신저인 카카오톡과 라인, 휴대폰 문자메시지(SMS)에서 주고받은 대화를 바탕으로 사람 감정을 분석해준다. 앱을 다운받아 연인관계 여부 등 간단한 정보를 넣고, 해당 대화 내용을 불러오면 된다.
약 1분만 기다리면 서로에 대한 '애정도' '호감도' '친밀도' 등을 수치로 볼 수 있다. 100점 만점에 70점 이상이면 사귈 가능성이 높다는 식이다. 상대방의 현재 감정 상태뿐 아니라 일별, 주별, 월별로 감정변화 추이도 보여준다. '선톡 비율을 59% 이상으로 높여보세요' 등 조언도 아끼지 않는다. 모두 '빅데이터'의 산물이다.
"데이터를 모으니 사람들이 스스로 인지하지 못했던 차이가 드러나기 시작했습니다. 예를 들어 남여 모두 관심있는 사람에게는 '~할 거예요' 식의 미래지향적인 표현을 자주 씁니다. 남자는 웃는 표시인 'ㅋ'를 최대한 많이 붙이는 경향이 짙고요. 반면 여자는 'ㅋ' 횟수와 감정 표현이 일치하지 않아요. 대신 우는 표시인 'ㅠ'로 공감 받길 원합니다."
◆ 분석모델 개발기간만 2년6개월 … 적용툴 2000개 텍스트앳의 감정분석 모델 'STEAM(Statistics-based Text Emotion Analysis Model)'을 들여다보면 훨씬 더 정교하다. 이 프로그램은 이용자들이 주고 받은 대화를 형태소 단위로 분석하고 비표준어, 오타, 잘못된 띄어쓰기 등을 파악할 수도록 했다.
한 대화를 분석하는데 적용하는 툴은 2000개를 넘는다. 통계학, 언어학, 심리학을 망라한다. 개발 기간만 2년6개월 이상 걸린 야심작이다. 특허출원도 마쳤다.
"대표적인 툴로 '답장시간 표준편차'라는 게 있습니다. 상대방이 답장을 얼마나 빨리하고 늦게하는지도 중요하지만, 외부 환경에 영향을 많이 받거든요. 그래도 사람들은 관심 있는 상대에게는 일정하게 답을 합니다. 대화 평균값에서 표준편차를 계산하면 미세한 차이가 나타나죠."
서비스 정확도를 높이기 위한 내부 테스트도 계속 진행 중이다. 텍스트앳은 기계학습 알고리즘을 사용하고 있다. 데이터의 80%만 입력하고, 나머지 20%는 프로그램이 스스로 알아 맞추도록 하는 방식이다. 이미 알고 있는 정답과 비교하면 서비스의 정확도를 가늠할 수 있다.
뿐만 아니라 데이터가 늘어날수록 더욱 더 정확한 분석이 나온다. 텍스트앳에서 이용자들이 만든 보고서는 하루 평균 4000만~5000만 건에 달한다. 이용자들의 활동 하나하나가 모여 재산이 된다.
◆ "삶의 행복지수 높이겠다"
김 대표는 최근 tvN 예능 프로그램인 '로맨스가 더 필요해'에서 SNS 대화 전문가로도 활약하고 있다. 대학생 때 호기심으로 시작한 일이 그를 '빅데이터 전문가' 겸 '연애 전문가'로 만들었다.
김 대표는 휴대폰 문자메시지가 40자(80바이트)로 제한돼 있던 시절부터 이모티콘, 쓰는 단어에 민감했다. 사회학 한 수업에서는 '문자 메시지와 이성적 호감도의 상관관계 분석'을 연구 주제로 삼았을 정도다. 당시 학생 3000명이 실제 보낸 문자메시지를 그대로 받아 적고, 호감도에 관한 설문 조사를 했다. 이를 역추적한 것이 현재 서비스의 토대가 됐다.
법인은 2011년 세웠다. 중소기업청 예비기술창업자 지원사업에 선정, 5000만 원의 씨드머니(종잣돈)을 마련했다. 텍스트앳은 '당근' 포인트를 통해 수익모델을 확보했다. 대화 내용을 세세히 분석하기 위해선 당근을 구입해야 한다.
김 대표는 이용자들이 당근을 서슴없이 사는 이유가 인간 관계에 목말라 있기 때문이라고 지적했다. "한 사람의 '행복지수'를 결정하는 건 돈이나 명예가 아니에요. 연애나 가까운 사람과의 관계가 행복에 중대한 영향을 미치죠. '텍스트앳'은 연애 만족도를 수치로 표현하고, 더 높일 수 있는 의미있는 서비스로 자리잡아 가겠습니다."
한경닷컴 김효진 기자 jinhk@hankyung.com
소설 '우리는 사랑일까'에서 알랭 드 보통이 사랑에 철학을 접목했다면, 어플리케이션(앱) '텍스트 앳'은 같은 질문을 '빅 데이터'로 답한다. 정확도는 80% 이상이다.
김종윤(사진·29) 스캐터랩 대표는 "사랑을 얻기 위해 타로점을 보는 시대는 갔다"고 강조한다. '선톡'(먼저 메시지를 보내는 것), '읽씹'(메시지를 읽기만 하고 답장하지 않는 것), '그린라이트'(서로 마음이 통하는 상태) 등 연애 신조어가 난무하는 시대에 걸맞는 해결책을 제시했다.
◆ 카톡·문자 감정 분석하는 최초 앱
"같은 말을 하더라도 관심있는 사람과 관심없는 사람에게 보내는 메시지는 다릅니다. 아무리 마음을 감추려고 해도 내용, 형식, 뉘앙스에서 미묘한 차이들이 드러나죠. 무의식적으로 말이에요. 그 뭔가 다른 부분을 감지하고 읽어내려고 했습니다."
텍스트앳은 모바일 메신저인 카카오톡과 라인, 휴대폰 문자메시지(SMS)에서 주고받은 대화를 바탕으로 사람 감정을 분석해준다. 앱을 다운받아 연인관계 여부 등 간단한 정보를 넣고, 해당 대화 내용을 불러오면 된다.
약 1분만 기다리면 서로에 대한 '애정도' '호감도' '친밀도' 등을 수치로 볼 수 있다. 100점 만점에 70점 이상이면 사귈 가능성이 높다는 식이다. 상대방의 현재 감정 상태뿐 아니라 일별, 주별, 월별로 감정변화 추이도 보여준다. '선톡 비율을 59% 이상으로 높여보세요' 등 조언도 아끼지 않는다. 모두 '빅데이터'의 산물이다.
"데이터를 모으니 사람들이 스스로 인지하지 못했던 차이가 드러나기 시작했습니다. 예를 들어 남여 모두 관심있는 사람에게는 '~할 거예요' 식의 미래지향적인 표현을 자주 씁니다. 남자는 웃는 표시인 'ㅋ'를 최대한 많이 붙이는 경향이 짙고요. 반면 여자는 'ㅋ' 횟수와 감정 표현이 일치하지 않아요. 대신 우는 표시인 'ㅠ'로 공감 받길 원합니다."
◆ 분석모델 개발기간만 2년6개월 … 적용툴 2000개 텍스트앳의 감정분석 모델 'STEAM(Statistics-based Text Emotion Analysis Model)'을 들여다보면 훨씬 더 정교하다. 이 프로그램은 이용자들이 주고 받은 대화를 형태소 단위로 분석하고 비표준어, 오타, 잘못된 띄어쓰기 등을 파악할 수도록 했다.
한 대화를 분석하는데 적용하는 툴은 2000개를 넘는다. 통계학, 언어학, 심리학을 망라한다. 개발 기간만 2년6개월 이상 걸린 야심작이다. 특허출원도 마쳤다.
"대표적인 툴로 '답장시간 표준편차'라는 게 있습니다. 상대방이 답장을 얼마나 빨리하고 늦게하는지도 중요하지만, 외부 환경에 영향을 많이 받거든요. 그래도 사람들은 관심 있는 상대에게는 일정하게 답을 합니다. 대화 평균값에서 표준편차를 계산하면 미세한 차이가 나타나죠."
서비스 정확도를 높이기 위한 내부 테스트도 계속 진행 중이다. 텍스트앳은 기계학습 알고리즘을 사용하고 있다. 데이터의 80%만 입력하고, 나머지 20%는 프로그램이 스스로 알아 맞추도록 하는 방식이다. 이미 알고 있는 정답과 비교하면 서비스의 정확도를 가늠할 수 있다.
뿐만 아니라 데이터가 늘어날수록 더욱 더 정확한 분석이 나온다. 텍스트앳에서 이용자들이 만든 보고서는 하루 평균 4000만~5000만 건에 달한다. 이용자들의 활동 하나하나가 모여 재산이 된다.
◆ "삶의 행복지수 높이겠다"
김 대표는 최근 tvN 예능 프로그램인 '로맨스가 더 필요해'에서 SNS 대화 전문가로도 활약하고 있다. 대학생 때 호기심으로 시작한 일이 그를 '빅데이터 전문가' 겸 '연애 전문가'로 만들었다.
김 대표는 휴대폰 문자메시지가 40자(80바이트)로 제한돼 있던 시절부터 이모티콘, 쓰는 단어에 민감했다. 사회학 한 수업에서는 '문자 메시지와 이성적 호감도의 상관관계 분석'을 연구 주제로 삼았을 정도다. 당시 학생 3000명이 실제 보낸 문자메시지를 그대로 받아 적고, 호감도에 관한 설문 조사를 했다. 이를 역추적한 것이 현재 서비스의 토대가 됐다.
법인은 2011년 세웠다. 중소기업청 예비기술창업자 지원사업에 선정, 5000만 원의 씨드머니(종잣돈)을 마련했다. 텍스트앳은 '당근' 포인트를 통해 수익모델을 확보했다. 대화 내용을 세세히 분석하기 위해선 당근을 구입해야 한다.
김 대표는 이용자들이 당근을 서슴없이 사는 이유가 인간 관계에 목말라 있기 때문이라고 지적했다. "한 사람의 '행복지수'를 결정하는 건 돈이나 명예가 아니에요. 연애나 가까운 사람과의 관계가 행복에 중대한 영향을 미치죠. '텍스트앳'은 연애 만족도를 수치로 표현하고, 더 높일 수 있는 의미있는 서비스로 자리잡아 가겠습니다."
한경닷컴 김효진 기자 jinhk@hankyung.com