본문 바로가기

    ADVERTISEMENT

    [단독] 스캐터랩이 수집한 카톡 대화…'이루다'에만 쓰지 않았다

    • 공유
    • 댓글
    • 클린뷰
    • 프린트
    대화 기반 연구 결과물을 오픈소스 플랫폼에 올려
    '연애의 과학' 이용자 불안 증폭
    스캐터랩이 만든 인공지능(AI) 챗봇(채팅로봇) 이루다.
    스캐터랩이 만든 인공지능(AI) 챗봇(채팅로봇) 이루다.
    스캐터랩이 자사 서비스에서 수집한 메신저 대화를 기반으로 한 연구 결과물을 오픈소스 플랫폼에 올린 것으로 드러났다. 수집된 개인정보를 충분히 필터링하지 하지 않았을 것이라는 지적이 제기되고 있다.
    오픈소스 플랫폼 깃허브 캡처.
    오픈소스 플랫폼 깃허브 캡처.
    12일 관련 업계에 따르면 스캐터랩은 오픈소스 플랫폼 ‘깃허브’에 카카오톡 대화 데이터로 학습한 ‘인공신경망 모델 파일’을 올린 것으로 확인됐다. 인공신경망은 인간 뇌세포를 모방한 머신러닝 기법으로, 이 파일을 활용하면 다른 사람도 ‘이루다’와 유사한 AI 챗봇(채팅로봇)을 만들 수 있다. 이 파일은 지난해 9월에 업로드돼 오픈소스 플랫폼 특성상 상당수 공유됐을 것으로 파악된다.

    스캐터랩은 지난해 8월 자사 블로그를 통해 이 모델을 소개한 바 있다. 스캐터랩 측은 블로그에서 “저희 핑퐁팀은 '연애의 과학' 어플리케이션을 통해 수집한 대량의 대화 데이터를 학습 데이터로 이용했다”고 밝혔다.

    정보기술(IT) 업계 관계자는 “이 파일 자체에서 개인정보를 탈취하긴 어렵다”며 “다만 파일이 개인정보가 필터링되지 않은 채로 학습됐을 가능성을 업체 측이 부정하긴 어려울 것”이라고 했다.

    한편 이날 스캐터랩은 입장문을 통해 “이루다의 경우, 연애의 과학 텍스트 데이터를 기반으로 학습이 진행됐다”며 이용자 데이터 사용을 인정했다. AI 챗봇 서비스 이루다를 운영한 스캐터랩은 자사의 다른 서비스인 ‘연애의 과학’ 이용자들의 대화 데이터 100억건을 사용해 AI를 학습시킨 것으로 알려졌다.

    김남영 기자 nykim@hankyung.com

    ADVERTISEMENT

    1. 1

      삼성 '네오 QLED' TV…低화질 콘텐츠도 8K로 살아난다

      지난 8일 미국 뉴욕 월스트리트 인근에 있는 삼성전자 뉴욕마케팅센터 내 제품 체험장. 2016년 개장한 뒤 하루 1000명 가까이 찾았던 이곳은 코로나19 여파로 작년 3월 폐쇄됐지만 이날만큼은 문을 열었다. 소비자...

    2. 2

      이종결합 향연…버라이즌·UPS·스카이워드 '드론물류 3각 동맹'

      매년 1월 열리는 세계 최대 IT·가전 전시회 ‘CES’는 글로벌 산업의 흐름을 가장 빠르고 정확하게 파악할 수 있는 경연장이다.지난 11일 개막한 ‘CES 2021&rs...

    3. 3

      "5G는 변화 촉매제…교육·스포츠 등 일상 혁신 부르는 플랫폼"

      “5세대(5G) 이동통신은 단순한 기술 혁신이 아닙니다. 다른 산업의 변화를 촉발하는 ‘혁신 플랫폼’입니다.”한스 베스트베리 버라이즌 회장 겸 최고경영자(CEO·...

    ADVERTISEMENT

    ADVERTISEMENT