이루다 말투, 왜 나와 비슷한가 싶더니…카톡 대화 수집 논란
-
기사 스크랩
-
공유
-
댓글
-
클린뷰
-
프린트
업체 측 "데이터 활용에 대한 고지·확인 절차 추가할 것"
인공지능(AI) 챗봇(채팅로봇)을 만든 업체가 자사 서비스 이용자의 카카오톡 대화를 수집해 AI를 만들었다는 사실이 알려지면서 개인정보 침해 논란이 불거지고 있다. 업체 측은 앞으로 데이터 활용에 대한 고지 절차를 보완하겠다고 밝혔지만 이용자 반발은 더욱 거세질 것으로 예상된다.
10일 정보기술(IT) 업계에 따르면 AI 챗봇 스타트업 ‘스캐터랩’의 서비스 ‘연애의 과학’ 이용자들이 반발하고 있다. 스캐터랩에 따르면 이 업체가 최근 출시한 AI 챗봇 서비스 ‘이루다’는 자사의 다른 서비스 ‘연애의 과학’에서 수집한 카카오톡 대화를 바탕으로 만들어졌다. 이루다는 최근 ‘AI 성희롱’으로 논란이 된 바 있다.
연애의 과학은 이용자가 자신의 카카오톡 대화 자료를 넘기면 서비스 업체가 분석해서 연애 조언을 제공하는 서비스다. 이 과정에서 스캐터랩은 카카오톡 대화 100억건을 수집했고, 이를 통해 AI의 성능을 높였다고 홍보한 바 있다. 이로 인해 해당 서비스를 사용한 이용자들의 대화가 카카오톡 대화가 ‘이루다’의 대화에 그대로 나타나고 있는 상황이다. 이루다의 답변에 사람 이름이 나오는 등 개인정보 유출 우려도 커지고 있다. 이용자들은 자신의 대화가 새로운 AI 서비스 개발에 사용될 줄은 몰랐다며 데이터 수집 과정이 잘못됐다는 반응이다. 서비스 개인정보 취급 방침에 ‘수집된 정보는 신규 서비스 개발에 활용한다’는 내용이 있지만, 서비스를 이용할 때 데이터 활용에 관한 고지가 없었다는 이유에서다. 한 이용자는 “챗봇이 기존의 학습 데이터를 바탕으로 계속해서 개인정보를 뱉고 있는 것이 아니냐”며 “이미 유출된 정보에 대해서 이용자들에게 보상해야 한다”고 주장했다.
이에 스캐터랩 측은 이날 오전 데이터 활용에 대한 고지 및 확인 절차를 추가하겠다는 내용의 사과문을 게시했다. 이 업체는 “학습에 사용된 모든 데이터에 대해서는 비식별화가 진행됐다”며 “데이터가 학습에 활용되길 원하지 않으면 삭제할 수 있다”고 밝혔다. 이어 “대화 관련 분석 서비스 사용 전에 다시 한 번 데이터 활용에 대한 고지 및 확인 절차를 추가할 계획”이라고 전했다. 시민단체들은 데이터를 활용하는 산업이 커지면서 프라이버시 침해 문제도 커졌다고 진단하고 있다. 김민 진보네트워크 활동가는 “해당 서비스에는 형식적이고 포괄적인 동의 절차의 문제, 동의하지 않은 정보 주체의 개인정보 침해 가능성, 대화 내용 중 민감정보를 비롯한 추가적 개인정보 수집 가능성 등 AI·빅데이터 시대에 벌어질 수 있는 일반적인 정보인권 침해의 문제가 있어 보인다”며 “비식별화가 이뤄진다고 해도 가명정보가 누적될수록 식별 가능성이 높아질 수 있다”고 했다.
김남영 기자 nykim@hankyung.com
10일 정보기술(IT) 업계에 따르면 AI 챗봇 스타트업 ‘스캐터랩’의 서비스 ‘연애의 과학’ 이용자들이 반발하고 있다. 스캐터랩에 따르면 이 업체가 최근 출시한 AI 챗봇 서비스 ‘이루다’는 자사의 다른 서비스 ‘연애의 과학’에서 수집한 카카오톡 대화를 바탕으로 만들어졌다. 이루다는 최근 ‘AI 성희롱’으로 논란이 된 바 있다.
연애의 과학은 이용자가 자신의 카카오톡 대화 자료를 넘기면 서비스 업체가 분석해서 연애 조언을 제공하는 서비스다. 이 과정에서 스캐터랩은 카카오톡 대화 100억건을 수집했고, 이를 통해 AI의 성능을 높였다고 홍보한 바 있다. 이로 인해 해당 서비스를 사용한 이용자들의 대화가 카카오톡 대화가 ‘이루다’의 대화에 그대로 나타나고 있는 상황이다. 이루다의 답변에 사람 이름이 나오는 등 개인정보 유출 우려도 커지고 있다. 이용자들은 자신의 대화가 새로운 AI 서비스 개발에 사용될 줄은 몰랐다며 데이터 수집 과정이 잘못됐다는 반응이다. 서비스 개인정보 취급 방침에 ‘수집된 정보는 신규 서비스 개발에 활용한다’는 내용이 있지만, 서비스를 이용할 때 데이터 활용에 관한 고지가 없었다는 이유에서다. 한 이용자는 “챗봇이 기존의 학습 데이터를 바탕으로 계속해서 개인정보를 뱉고 있는 것이 아니냐”며 “이미 유출된 정보에 대해서 이용자들에게 보상해야 한다”고 주장했다.
이에 스캐터랩 측은 이날 오전 데이터 활용에 대한 고지 및 확인 절차를 추가하겠다는 내용의 사과문을 게시했다. 이 업체는 “학습에 사용된 모든 데이터에 대해서는 비식별화가 진행됐다”며 “데이터가 학습에 활용되길 원하지 않으면 삭제할 수 있다”고 밝혔다. 이어 “대화 관련 분석 서비스 사용 전에 다시 한 번 데이터 활용에 대한 고지 및 확인 절차를 추가할 계획”이라고 전했다. 시민단체들은 데이터를 활용하는 산업이 커지면서 프라이버시 침해 문제도 커졌다고 진단하고 있다. 김민 진보네트워크 활동가는 “해당 서비스에는 형식적이고 포괄적인 동의 절차의 문제, 동의하지 않은 정보 주체의 개인정보 침해 가능성, 대화 내용 중 민감정보를 비롯한 추가적 개인정보 수집 가능성 등 AI·빅데이터 시대에 벌어질 수 있는 일반적인 정보인권 침해의 문제가 있어 보인다”며 “비식별화가 이뤄진다고 해도 가명정보가 누적될수록 식별 가능성이 높아질 수 있다”고 했다.
김남영 기자 nykim@hankyung.com