"내 만화 베꼈어요"…AI의 '데이터 탐욕' 어디까지 갈까 [긱스]

고은이 기자

입력2023.12.19 14:46 수정2023.12.19 14:52

AI 저작권 논란은 올 한해 뜨거운 감자였다. 할리우드 배우들과 작가들은 “AI가 자신들의 저작·실연물을 빼앗아 간다”라며 63년 만에 동반 파업했다. 게티이미지는 스태빌리티AI가 자사 이미지 천만 장 이상을 무단 이용했다는 이유로 영국과 미국에서 손해배상소송을 걸었다. GPT3에 깃허브 오픈소스 코드를 학습시킨 코딩 보조 기구 코파일럿은 해당 코드의 오픈소스 라이선스를 준수하지 않았다는 이유로 논란이 일었다.

생성형 AI 저작권 논란이 작가, 뮤지션, 배우 등 미디어·문화 산업을 비롯해 플랫폼 전반에 큰 파장을 일으키는 모습이다. AI가 인간 창작의 영역을 더 풍요롭게 할 수도 있지만, AI가 창작물을 무단 이용하거나 인간 창작 영역을 대체할지도 모른다는 불안감이 기저에 있다. AI 창작과 인간 창작은 대립 관계에 있는 걸까. AI창작과 인간창작이 시너지 효과를 내며 미래 문화를 바꿀 수는 없을까. 한경 긱스(Geeks)가 스타트업얼라이언스가 발행한 이슈페이퍼 '생성형 AI와 저작권 쟁점'을 참고해 주요 이슈를 정리했다.

인간 창작물 배우는 AI

미국의 비소설 저자들은 챗GPT의 개발·운영사인 오픈AI와 투자사 마이크로소프트 등을 상대로 집단 소송을 제기했다. 챗GPT의 생성형 AI 모델을 학습시키는 데 자신들의 저작물이 무단 도용됐다는 게 이들의 주장이다. 이들은 소장에서 “MS 역시 오픈AI가 AI 모델을 개발하고 학습 훈련을 시키는 데 깊이 관여했으며 저작권 침해에 대한 책임이 있다”고 밝혔다. 챗GPT를 개발하고 운영하는 것은 오픈AI지만, 여기에 투자한 MS에도 저작권 침해에 대한 공동의 책임을 물어야 한다는 지적이다.

생성형 AI가 전방위적으로 확산하면서 AI 모델 학습 데이터를 둘러싼 저작권 분쟁 역시 일파만파 커지고 있는 모습이다. 뉴욕타임스(NYT)를 비롯한 미국의 160여 개 언론 매체가 오픈AI, 구글 등을 상대로 뉴스 콘텐츠 저작권 침해를 규탄하는 내용의 성명을 내기도 했다.

한국 상황도 마찬가지다. 최근 한국 만화·웹툰 창작가 단체들은 국회에서 논의 중인 생성형 AI의 저작권 면책에 대해 우려의 목소리를 냈다. 이들은 공동 입장문을 내고 "국회에서 논의 중인 TDM(텍스트와 데이터 마이닝) 면책 규정의 도입이 예상된다. 무분별하게 도입될 경우 웹툰이 AI에 의해 무단으로 학습돼 보상 없이 상업적 AI에 이용될 가능성이 커진다"고 지적했다.이 같은 우려는 최근 산업계에서 생성형 AI 산업 발전을 위해 학습 과정에서의 저작권 침해는 면책해야 한다는 목소리가 커지는 가운데 나왔다. 이들 단체는 면책 규정 도입이 웹툰 작가의 창작 동기 저하와 경제적 손실, 창작자가 감당하기 어려운 저작권 분쟁으로 이어질 수 있다고 주장했다.

법적 논의는

AI 저작권과 얽힌 여러 이슈 중 가장 큰 논란은 AI학습용 데이터로 인간 저작물 활용을 허용할 것인가 하는 문제다. AI 학습을 위해선 수많은 양질의 데이터가 필요하다. 이러한 데이터 중에는 저작물이 상당 부분 포함된다. 학습을 위한 데이터 확보를 위해 저작권자 등과 사전에 권리처리를 하는 경우도 있지만, 크롤링이나 스크래핑등을 통해 권리자와 합의 없이 저작물등을 학습용 데이터로 이용하는 경우도 다반사다. 이를 적법한 이용으로 볼 수 있을까.

대규모 데이터베이스를 AI 학습에 활용할 때 개별 데이터가 저작물에 해당하는지, 또는 데이터베이스권의 대상이 되는지 일일이 판단해 그 권리자를 찾아내 허락을 구하기는 현실적으로 쉽지 않다. 수집된 데이터는 데이터 간의 의미 분석을 위해 라벨링되고 따라서 변형돼 사용되기도 한다. 현재 국회에서는 TDM 면책 규정의 도입이 다수의 저작권법 개정안을 통해 진행 중이다. TDM의 유용성에 대한 공감, 이러한 유용성과 권리자의 권익과의 균형점 모색, 글로벌 규범과의 조화 등의 필요성이 전제다. 그러나 TDM 면책 규정의 내용은 개별 국가마다 약간씩 다르다. 일례로 상업적 이용의 허용 여부, 적법한 접근을 전제로 할 것인지, 보상금을 인정할 것인지, 또한 기술적 보호조치를 어떻게 할 것인지 등에 대하여 각각 차이가 있다.

다만 아무런 기준이 없는 현재 상황에서 일정 수준의 활용 기준을 구축해야한다는 데는 의견이 모이고 있다. AI업계는 기업들이 올해 연달아 선보인 AI 서비스들이 본격적으로 대중과 만나는 내년부터 소송리스크가 터질 것으로 보고 있다. AI 저작권 1호 소송이 등장하고 관련 판례가 나오면 후속 소송전의 속도는 더 빠라질 것이라는 전망도 나온다. 저작권을 보호함으로써 창작 의욕을 고취하는 것도 중요하지만, AI 기능과 효용에 필수적인 면책규정도 도입함으로써 AI가 인간에게 유용한 도구 역할을 할 수 있도록 해야한다는 것이다.

AI 창작물의 주인은 누구

또 다른 AI는 저작권 이슈는 AI가 만든 창작물의 '주인' 문제다. 이미 시, 음악, 영화극본, 신문기사 등 수많은 창작물이 인간이 아닌 인공지능을 통해 양산되고 있다. 그러나 “이러한 창작물들이 모두 저작권법상 보호 대상에 해당하는가, 해당한다면 그러한 창작물을 대상으로 하는 권리는 누구에게 귀속되는가”라는 문제는 여전히 해결되지 않고 있다. 지금까지 창작이나 예술이 단순히 학습과 모방이 아니라 경험이나 감정이 투영된 결과이자 상상력과 표현력의 정수라는 점에서 인간 고유의 영역으로 여겨졌다. 전 세계 대부분의 저작권법에서 저작권자를 인간으로 한정했다. 하지만 생성형 AI가 내놓은 결과물이 인간의 창작활동에 활용되고, 심지어 일부 영역에선 인간의 창작 활동을 대체하면서 인간만이 창작성을 인정받아야 하는지에 대한 의문이 제기되고 있다. 뮤지션 닉 케이브는 그의 팬이 챗GPT를 이용해 작곡한 ‘닉 케이브 스타일’ 곡을 보고 “인간이란 무엇인가에 대한 기괴한 조롱”이라며 “이제 AI 공포의 초기 단계지만 (예술의) 종말이 오고 있다”고 했다.

예를 들어 AI가 만든 창작물, 예를 들어 사람이 최소한 동작만을 해 주면(전원스위치를 넣거나, 아니 면 폴카, 미뉴에트 등 곡의 형식만을 지정해 주면) AI을 가진 컴퓨터가 자동으로 매번 다른 악곡을 작곡해 출력해 주는 경우 그 악곡을 저작물로 볼 수 있을까. 저작권을 부여하는 목적은 인간의 창작 의욕을 고취하고자 하는 것이므로 인간의 정신적인 노력과 아무런 관련이 없는 작품은 저작권법이 보호하는 사상과 감정의 표현이라고 볼 수 없다. 따라서 이와 같은 컴퓨터가 작성한 작품들은 저작물로 보호받지 못한다고 하는 목소리가 있다.

프로그래머가 저작권의 주인이 될 수 있을까. 프로그래머가 AI를 창작하는데 노동력을 비롯한 여러 자원들을 투자한다. 즉 AI를 만듦에 있어서 프로그래머는 상당한 투자를 하게 되고 그에 합당한 보상을 받아야 한다는 주장이 있다. 이에 반해 프로그래머는 AI자체를 판매해 보상을 받을 수 있다는 목소리도 있다. 따라서 프로그래머에게 AI가 만들어 낸 창작물에 대한 저작권을 인정하는 것은 이중보상이 될 수 있다는 주장이다. 김현경 서울과학기술대 IT정책전문대학원 교수는 이슈페이퍼에서 "AI 창작산업의 발달은 전통적 저작권 기반의 수익모델을 위협할 것"이라며 "혼란과 의문 속에서 가장 중요한 것은 저작권 제도의 본질을 망각하지 않는 것"이라고 했다.

고은이 기자 koko@hankyung.com

"내 만화 베꼈어요"…AI의 '데이터 탐욕' 어디까지 갈까 [긱스]

인간 창작물 배우는 AI

법적 논의는

AI 창작물의 주인은 누구

네이버 게임 스트리밍 '치지직' 개시…업계 최초 '카카오 다양성 보고서' [Geeks' Briefing]

"영어, 쫄지 않는다"…AI와 대화하는 회화 앱 내놨더니 [긱스]

카카오벤처스 사령탑에 김기준…샌드박스 IPO 주관사엔 삼성증권 [Geeks' Briefing]

"그 인스타 여신, 광고매체 된다"…인플루언서에 주목한 피처링 [그래서 투자했다]

직원의 2000억 횡령 사건, AI로 막을 수 있을까 [긱스]