'이루다' 개발사 “이용자 카톡 대화 사용 인정"…제3자 피해 언급 없어
-
기사 스크랩
-
공유
-
댓글
-
클린뷰
-
프린트
스캐터랩 "개인을 특정하는 것 불가능"
'데이터 폐기' 청와대 국민청원도 올라와
'데이터 폐기' 청와대 국민청원도 올라와
인공지능(AI) 스타트업이 “AI 학습에 이용자 데이터가 사용된 것은 사실”이라면서도 “개인정보취급방침의 범위 내에서 활용했다”며 개인정보 무단도용 의혹에 대해 재차 해명했다.
12일 스캐터랩은 입장문을 통해 “이루다의 경우, 연애의 과학 텍스트 데이터를 기반으로 학습이 진행됐다”며 이용자 데이터 사용을 인정했다. AI 챗봇(채팅로봇) 서비스 ‘이루다’를 운영한 스캐터랩은 자사의 다른 서비스인 ‘연애의 과학’ 이용자들의 대화 데이터 100억건을 사용해 AI를 학습시킨 것으로 알려졌다.
이들은 “이루다가 하는 답변의 기반이 되는 데이터베이스(DB)는 1억개의 개별적이고 독립적인 문장들로 구성되어 있어, DB의 문장들을 조합하여 개인을 특정하는 것은 불가능하다”고 밝혔다.
이용자 동의 여부와 관련해 스캐터랩 측은 “연애의 과학 사용자 데이터는 사용자의 사전 동의가 이루어진 개인정보취급방침의 범위 내에서 활용했다”며 “연애의 과학 사용자분들 중 AI 학습에 데이터가 활용되기 원치 않으시는 분들은 DB 삭제와 함께 앞으로 이루다의 DB에 활용되지 않도록 추가 조치를 진행할 예정”이라고 덧붙였다.
그러나 스캐터랩 측은 직접 이용한 사용자들뿐만 아니라 이 사용자들과 대화한 연애 상대 등 제3자까지 개인정보 침해를 입은 것에 대해서는 해명하지 않았다.
개인정보 비식별화가 제대로 이뤄지지 않았다는 비판에 대해서 스캐터랩 측은 “이루다가 사용한 대화 정보는 모두 분절화해 있다”며 “특히 숫자·이름과 주소·계좌번호·전화번호 등은 이루다 출시 당시부터 삭제됐었다”고 했다. 이어 “(DB에 있는) 1억건의 개별 문장을 사람이 일일이 검수하기는 어렵기 때문에 알고리즘을 통한 기계적인 필터링을 거쳤다”며 “이 과정에서 되도록 많은 변수를 주려고 노력했으나, 문맥에 따라 인물의 이름이 남아 있다거나 하는 부분들이 발생했다”고 전했다.
스캐터랩은 향후 △실명 필터링 알고리즘 강화 △한글 주소 비노출 △대화 데이터 변형 △민감정보 노출 방지 등으로 기존 알고리즘을 고도화하겠다고 밝혔다.
스캐터랩 직원들이 서비스 이용자의 카카오톡 대화를 돌려봤다는 의혹에 대해선 자체 진상조사위원회를 꾸려 조사 중이라고 밝혔다. 스캐터랩 측은 “진상을 신속히 조사하고, 만에 하나 의혹이 사실로 드러나는 경우에는 관련자들에게 엄중히 책임을 묻고 조속히 필요한 조치를 하도록 하겠다”고 했다. 앞서 스캐터랩에서 근무했다고 주장한 전 직원은 “연인들의 카톡 대화를 돌려보며 웃는 사람들도 있었다”고 폭로했다. 한편 이와 관련해 스캐터랩에 데이터 폐기 및 서비스 전면 종료를 촉구하는 청와대 국민청원도 등장했다. 이날 한 청원인은 ‘스캐터랩은 수집한 이용자 데이터를 모두 폐기해야 하며 나아가 이루다 서비스도 종료돼야 한다’며 청원글을 게시했다.
청원인은 “이용자들의 개인정보를 함부로 다루고 있는 행위를 더 이상 보고 있을 수만은 없다”며 “앞으로 이러한 피해가 생기지 않도록 엄중히 수사하여 합당한 책임과 강력한 처벌을 받을 수 있도록 해달라”고 했다.
김남영 기자 nykim@hankyung.com
이들은 “이루다가 하는 답변의 기반이 되는 데이터베이스(DB)는 1억개의 개별적이고 독립적인 문장들로 구성되어 있어, DB의 문장들을 조합하여 개인을 특정하는 것은 불가능하다”고 밝혔다.
이용자 동의 여부와 관련해 스캐터랩 측은 “연애의 과학 사용자 데이터는 사용자의 사전 동의가 이루어진 개인정보취급방침의 범위 내에서 활용했다”며 “연애의 과학 사용자분들 중 AI 학습에 데이터가 활용되기 원치 않으시는 분들은 DB 삭제와 함께 앞으로 이루다의 DB에 활용되지 않도록 추가 조치를 진행할 예정”이라고 덧붙였다.
그러나 스캐터랩 측은 직접 이용한 사용자들뿐만 아니라 이 사용자들과 대화한 연애 상대 등 제3자까지 개인정보 침해를 입은 것에 대해서는 해명하지 않았다.
개인정보 비식별화가 제대로 이뤄지지 않았다는 비판에 대해서 스캐터랩 측은 “이루다가 사용한 대화 정보는 모두 분절화해 있다”며 “특히 숫자·이름과 주소·계좌번호·전화번호 등은 이루다 출시 당시부터 삭제됐었다”고 했다. 이어 “(DB에 있는) 1억건의 개별 문장을 사람이 일일이 검수하기는 어렵기 때문에 알고리즘을 통한 기계적인 필터링을 거쳤다”며 “이 과정에서 되도록 많은 변수를 주려고 노력했으나, 문맥에 따라 인물의 이름이 남아 있다거나 하는 부분들이 발생했다”고 전했다.
스캐터랩은 향후 △실명 필터링 알고리즘 강화 △한글 주소 비노출 △대화 데이터 변형 △민감정보 노출 방지 등으로 기존 알고리즘을 고도화하겠다고 밝혔다.
스캐터랩 직원들이 서비스 이용자의 카카오톡 대화를 돌려봤다는 의혹에 대해선 자체 진상조사위원회를 꾸려 조사 중이라고 밝혔다. 스캐터랩 측은 “진상을 신속히 조사하고, 만에 하나 의혹이 사실로 드러나는 경우에는 관련자들에게 엄중히 책임을 묻고 조속히 필요한 조치를 하도록 하겠다”고 했다. 앞서 스캐터랩에서 근무했다고 주장한 전 직원은 “연인들의 카톡 대화를 돌려보며 웃는 사람들도 있었다”고 폭로했다. 한편 이와 관련해 스캐터랩에 데이터 폐기 및 서비스 전면 종료를 촉구하는 청와대 국민청원도 등장했다. 이날 한 청원인은 ‘스캐터랩은 수집한 이용자 데이터를 모두 폐기해야 하며 나아가 이루다 서비스도 종료돼야 한다’며 청원글을 게시했다.
청원인은 “이용자들의 개인정보를 함부로 다루고 있는 행위를 더 이상 보고 있을 수만은 없다”며 “앞으로 이러한 피해가 생기지 않도록 엄중히 수사하여 합당한 책임과 강력한 처벌을 받을 수 있도록 해달라”고 했다.
김남영 기자 nykim@hankyung.com