'AI 이루다' 개발사 "데이터베이스·딥러닝 모델 폐기하겠다"(종합)
입력
수정
'연애의 과학' 이용자들 "이루다 DB 아닌 카톡 DB 전체 파기해야" 인공지능(AI) 챗봇 '이루다' 개발사 스캐터랩이 이루다 데이터베이스(DB)와 딥러닝 모델을 폐기하겠다고 15일 밝혔다. 스캐터랩은 이날 보도자료를 내 "이루다 DB와 이루다 학습에 사용된 딥러닝 대화 모델을 폐기하기로 결정했다"고 발표했다.
스캐터랩은 개인정보보호위원회·한국인터넷진흥원(KISA) 합동 조사가 종료되는 즉시 이루다 DB와 딥러닝 대화 모델을 폐기하기로 했다.
스캐터랩 측은 "이루다 DB는 비식별화(익명화) 절차를 거쳐 개별적·독립적인 문장으로 이뤄져 있고, 딥러닝 대화 모델은 대화 패턴만 학습하기 때문에 개인정보 유출 위험은 전혀 없다"면서도 "이용자들 불안감을 고려해 폐기를 결정했다"고 설명했다. 이들은 "기존 '연애의 과학'과 '텍스트앳'에서 이용자 동의를 받고 수집했던 데이터는 데이터 활용을 원하지 않는 이용자들이 신청할 경우 모두 삭제할 것"이라며 "이는 향후 딥러닝 대화 모델에도 이용되지 않는다"고 전했다.
이어 스캐터랩은 "향후 신규 가입 및 서비스 이용 시 개인정보 수집·이용 등의 절차도 강화하겠다"고 덧붙였다. 스캐터랩은 챗봇 이루다를 만드는 과정에 연애 분석 앱 '연애의 과학' 이용자들의 카카오톡 데이터를 가져다 쓰면서 개인정보보호법을 어겼다는 의혹을 받고 있다. 개인정보보호위원회와 한국인터넷진흥원(KISA)이 현장에서 자료를 확보해 조사하고 있다.
연애의 과학 앱 이용자와 이용자의 연인에게 개인정보 이용·활용 동의를 제대로 받지 않은 점, 데이터를 이루다 재료로 쓰는 과정에 익명화(비식별화)를 제대로 하지 않은 점 등이 핵심이다.
연인들 대화 데이터를 사내 메신저에 부적절하게 공유한 직원이 있었다는 의혹도 받고 있으며, 제대로 익명화하지 않은 데이터를 오픈소스 공유 플랫폼 '깃허브'에 공유한 사실도 확인됐다. 연애의 과학 이용자들은 "이루다 DB가 아니라 카톡 데이터 전량을 파기해야 한다"고 요구하고 있다.
스캐터랩은 연애의 과학으로 모은 카톡 데이터 약 100억건에서 1억건을 추려서 이루다 DB로 썼다고 밝힌 바 있다.
스캐터랩 관계자는 이날 MBC 라디오 '김종배의 시선집중'에 출연해 "개인정보 수집·이용 동의 과정의 경우 법률적 검토를 받았는데 법적으로 큰 문제가 없다고 들었다"며 "미흡했던 부분은 서비스 개선에 반영할 것"이라고 말했다.
/연합뉴스
스캐터랩은 개인정보보호위원회·한국인터넷진흥원(KISA) 합동 조사가 종료되는 즉시 이루다 DB와 딥러닝 대화 모델을 폐기하기로 했다.
스캐터랩 측은 "이루다 DB는 비식별화(익명화) 절차를 거쳐 개별적·독립적인 문장으로 이뤄져 있고, 딥러닝 대화 모델은 대화 패턴만 학습하기 때문에 개인정보 유출 위험은 전혀 없다"면서도 "이용자들 불안감을 고려해 폐기를 결정했다"고 설명했다. 이들은 "기존 '연애의 과학'과 '텍스트앳'에서 이용자 동의를 받고 수집했던 데이터는 데이터 활용을 원하지 않는 이용자들이 신청할 경우 모두 삭제할 것"이라며 "이는 향후 딥러닝 대화 모델에도 이용되지 않는다"고 전했다.
이어 스캐터랩은 "향후 신규 가입 및 서비스 이용 시 개인정보 수집·이용 등의 절차도 강화하겠다"고 덧붙였다. 스캐터랩은 챗봇 이루다를 만드는 과정에 연애 분석 앱 '연애의 과학' 이용자들의 카카오톡 데이터를 가져다 쓰면서 개인정보보호법을 어겼다는 의혹을 받고 있다. 개인정보보호위원회와 한국인터넷진흥원(KISA)이 현장에서 자료를 확보해 조사하고 있다.
연애의 과학 앱 이용자와 이용자의 연인에게 개인정보 이용·활용 동의를 제대로 받지 않은 점, 데이터를 이루다 재료로 쓰는 과정에 익명화(비식별화)를 제대로 하지 않은 점 등이 핵심이다.
연인들 대화 데이터를 사내 메신저에 부적절하게 공유한 직원이 있었다는 의혹도 받고 있으며, 제대로 익명화하지 않은 데이터를 오픈소스 공유 플랫폼 '깃허브'에 공유한 사실도 확인됐다. 연애의 과학 이용자들은 "이루다 DB가 아니라 카톡 데이터 전량을 파기해야 한다"고 요구하고 있다.
스캐터랩은 연애의 과학으로 모은 카톡 데이터 약 100억건에서 1억건을 추려서 이루다 DB로 썼다고 밝힌 바 있다.
스캐터랩 관계자는 이날 MBC 라디오 '김종배의 시선집중'에 출연해 "개인정보 수집·이용 동의 과정의 경우 법률적 검토를 받았는데 법적으로 큰 문제가 없다고 들었다"며 "미흡했던 부분은 서비스 개선에 반영할 것"이라고 말했다.
/연합뉴스