"글로벌 인기 사이트 10곳 중 1곳은 챗GPT 차단"
입력
수정
글로벌 인기 사이트를 중심으로 챗GPT의 정보 수집을 차단하는 사이트가 증가하고 있다. 생성형 인공지능(AI)의 창작물에 대한 저작권 논란이 커지고 있어, 앞으로 이런 움직임이 더욱 두드러질 것으로 보인다.
27일(현지시간) 가디언과 관련 업계에 따르면 AI 콘텐츠 정보 제공업체 오리지널리티AI는 지난 22일 기준 전 세계에서 가장 인기 있는 사이트 1000개 가운데 챗GPT의 정보 수집 툴인 ‘GPT봇’을 차단한 사이트가 9.2%에 달한다고 밝혔다. GPT봇은 챗GPT를 개발한 오픈AI가 GPT 언어모델 학습에 필요한 데이터를 수집하는 새로운 웹 크롤러다.오픈AI는 지난 7일 GPT봇을 공개하면서 정보 수집·이용을 원하지 않는 사이트 소유자에게 GPT봇의 크롤링을 차단하는 방법을 안내했다. GPT봇 공개 후 첫 주인 지난 15일에 GPT봇 차단율이 5% 미만이었으나, 2주 차에 10%까지 육박했다. 특히, 인기 사이트의 범위를 상위 100개로 좁히면 차단율은 15%까지 치솟았다. 이용자 수가 많은 사이트일수록 차단율이 높은 것이다. 오리지널리티AI는 “GPT봇 접근을 막는 사이트가 일주일에 5% 포인트가량 늘어났다”며 “GPT봇 차단 사이트가 꾸준하게 늘어나고 있다”고 설명했다.
주요 사이트 중에 뉴욕타임스(NYT)와 로이터, 아마존, CNN방송 등이 있었다. 특히 언론사들이 차단에 적극 나섰다. 로이터 통신의 경우 주요 GPT봇 공개 다음 날인 8일 웹 크롤링을 차단해 주요 100개 사이트 중에는 가장 먼저 정보 수집을 막았다. 로이터 관계자는 “지적재산권은 사업의 생명선이기 때문에 콘텐츠의 저작권을 보호하는 것이 필수적”이라고 밝혔다. 구글의 경우 지난 5월 NYT와 뉴스콘텐츠 사용료로 3년에 걸쳐 1억 달러 지급하기로 합의한 것으로 알려졌다.
실리콘밸리=최진석 특파원 iskra@hankyung.com
27일(현지시간) 가디언과 관련 업계에 따르면 AI 콘텐츠 정보 제공업체 오리지널리티AI는 지난 22일 기준 전 세계에서 가장 인기 있는 사이트 1000개 가운데 챗GPT의 정보 수집 툴인 ‘GPT봇’을 차단한 사이트가 9.2%에 달한다고 밝혔다. GPT봇은 챗GPT를 개발한 오픈AI가 GPT 언어모델 학습에 필요한 데이터를 수집하는 새로운 웹 크롤러다.오픈AI는 지난 7일 GPT봇을 공개하면서 정보 수집·이용을 원하지 않는 사이트 소유자에게 GPT봇의 크롤링을 차단하는 방법을 안내했다. GPT봇 공개 후 첫 주인 지난 15일에 GPT봇 차단율이 5% 미만이었으나, 2주 차에 10%까지 육박했다. 특히, 인기 사이트의 범위를 상위 100개로 좁히면 차단율은 15%까지 치솟았다. 이용자 수가 많은 사이트일수록 차단율이 높은 것이다. 오리지널리티AI는 “GPT봇 접근을 막는 사이트가 일주일에 5% 포인트가량 늘어났다”며 “GPT봇 차단 사이트가 꾸준하게 늘어나고 있다”고 설명했다.
주요 사이트 중에 뉴욕타임스(NYT)와 로이터, 아마존, CNN방송 등이 있었다. 특히 언론사들이 차단에 적극 나섰다. 로이터 통신의 경우 주요 GPT봇 공개 다음 날인 8일 웹 크롤링을 차단해 주요 100개 사이트 중에는 가장 먼저 정보 수집을 막았다. 로이터 관계자는 “지적재산권은 사업의 생명선이기 때문에 콘텐츠의 저작권을 보호하는 것이 필수적”이라고 밝혔다. 구글의 경우 지난 5월 NYT와 뉴스콘텐츠 사용료로 3년에 걸쳐 1억 달러 지급하기로 합의한 것으로 알려졌다.
실리콘밸리=최진석 특파원 iskra@hankyung.com