AI 워터마크 기술 전쟁터 된 온라인 세계
-
기사 스크랩
-
공유
-
댓글
-
클린뷰
-
프린트
딥페이크 막는 디지털 흔적
구글, 텍스트에도 워터마크 넣어
메타·MS·인텔 오픈AI도 가세
워터마크 지우는 서비스도 활개
구글, 텍스트에도 워터마크 넣어
메타·MS·인텔 오픈AI도 가세
워터마크 지우는 서비스도 활개
영상에 사람 얼굴을 합성한 딥페이크 콘텐츠가 쏟아지자 빅테크가 대응에 나섰다. 구글이 인공지능(AI) 생성 이미지, 영상, 음성에 이어 텍스트에도 워터마크를 심었다. ‘디지털 흔적’으로 불리는 이 기술을 공유하고자 빅테크들이 자발적으로 꾸린 연합체는 회원사가 200여 곳을 넘었다. 이와 반대로 워터마크를 벗겨주겠다는 업체도 등장하면서 온라인 세계에서 기술 전쟁이 벌어지고 있다.
8일 정보기술(IT)업계에 따르면 구글의 AI 연구 조직인 딥마인드는 지난 10월 국제 학술지인 네이처에 워터마크 부착·검출 솔루션인 ‘신스ID’의 텍스트 버전 적용 결과를 공개했다. 생성형 AI는 문맥에 따라 쓰일 수 있는 어휘 중 하나를 골라 작문한다.
이때 어휘의 선택 확률은 저마다 다르다. 예컨대 ‘나는 열대 과일 중 X를 좋아한다’를 작문하는 경우 AI는 바나나(35%), 망고(25%), 파파야(15%), 용과(7%) 중 하나를 일정 확률에 따라 X값으로 고른다. 이 단어들의 확률 산출 과정을 역으로 추적하면 AI가 만들었는지를 파악할 수 있다.
구글은 AI 챗봇인 제미나이에 질문해 얻은 응답 2000만여 건에 이와 같은 방식으로 워터마크를 심었다. 구글은 “AI가 만든 콘텐츠의 악용을 막겠다”며 텍스트 워터마크 기술을 오픈소스로 공개했다. AI 개발 업체인 센서티AI는 온라인에 풀린 딥페이크 영상 수가 지난해 10만 개가 넘어선 것으로 추정하고 있다. 구글이 AI 생성 콘텐츠를 걸러내는 기술을 무료로 풀게 된 배경이다. 구글은 신스ID를 통해 이미지, 영상 등의 워터마크 기술도 공급하고 있다. 오픈AI도 2월 AI 생성 이미지에 워터마크를 적용했다. 육안으로 구별하기 어려운 픽셀 단위로 특정 패턴을 워터마크로 활용해 이미지에 심는다.
오디오에 워터마크를 붙이는 기술도 보급됐다. 메타는 6월 음성 워터마크 솔루션인 ‘오디오실’을 공개했다. 음성 워터마크는 소리 파동을 시각화한 이미지에 식별용 픽셀을 심는 방식이다. 이 픽셀은 소리 파동으로 변환됐을 때 사람 귀로는 식별이 안 된다. 메타는 10월 AI 영상 생성기인 ‘무비 젠’에 이 기술을 적용했다. 시스코는 화상회의 앱인 ‘웹액스’에 워터마크 기술을 적용했다. 회의 녹음 오디오가 외부에 유출되면 이를 추적할 수 있도록 하려는 목적에서다.
워터마크를 벗기려는 중소 개발사의 반격도 잇따르고 있다. 주로 눈에 띄는 워터마크를 제거하는 식이다. 인도 정보기술(IT) 업체인 픽셀빈은 워터마크를 지워주는 서비스인 ‘워터마크 리무버’를 지난해 선보였다. 이미지에 내장된 워터마크 5000개를 169달러에 풀어주는 구독 상품을 내놨다. 이 서비스가 인기를 끌자 영상이나 오디오에서 워터마크를 빼주는 서비스를 공급하는 업체도 나왔다. 틱톡처럼 특정 SNS에서 생성된 워터마크만을 벗겨주는 서비스도 등장했다.
AI 업체들은 공조해 워터마크 생태계를 키우겠다는 구상이다. 구글은 10월 유튜브에 생성형 AI로 제작된 콘텐츠임을 표시하는 기능을 추가했다. AI 워터마크 기술 표준을 마련하기 위한 연합체인 ‘C2PA’의 표준을 적용했다. C2PA는 어도비, 아마존, 구글 등이 2021년 구성한 연합체다. 2일 기준 회원사가 219곳에 달하는 대형 조직이 됐다. 국내에선 네이버, 이스트소프트 등이 회원이다.
워터마크가 없는 AI 콘텐츠를 걸러내려는 기술 시도도 계속되고 있다. 인텔이 2022년 출시한 솔루션인 ‘페이크캐처’는 영상 속 인물의 얼굴에 드러나는 정맥의 색 변화를 1000분의 1초 단위로 감지해 딥페이크 기술 적용 여부를 가려낸다. 마이크로소프트는 콘텐츠 파일의 메타 데이터에 남은 수정 흔적을 분석하는 방식을 택했다.
‘콘텐츠 크리덴셜’이란 웹사이트에 이미지를 올려 AI 도구 사용 이력을 확인할 것을 권장하고 있다. 한국에선 AI 생성 콘텐츠에 워터마크 삽입을 의무화하는 ‘AI 기본법’(인공지능 발전과 신뢰 기반 조성 등에 관한 기본법안) 제정을 앞두고 있다.
이주현 기자 deep@hankyung.com
이때 어휘의 선택 확률은 저마다 다르다. 예컨대 ‘나는 열대 과일 중 X를 좋아한다’를 작문하는 경우 AI는 바나나(35%), 망고(25%), 파파야(15%), 용과(7%) 중 하나를 일정 확률에 따라 X값으로 고른다. 이 단어들의 확률 산출 과정을 역으로 추적하면 AI가 만들었는지를 파악할 수 있다.
구글은 AI 챗봇인 제미나이에 질문해 얻은 응답 2000만여 건에 이와 같은 방식으로 워터마크를 심었다. 구글은 “AI가 만든 콘텐츠의 악용을 막겠다”며 텍스트 워터마크 기술을 오픈소스로 공개했다. AI 개발 업체인 센서티AI는 온라인에 풀린 딥페이크 영상 수가 지난해 10만 개가 넘어선 것으로 추정하고 있다. 구글이 AI 생성 콘텐츠를 걸러내는 기술을 무료로 풀게 된 배경이다. 구글은 신스ID를 통해 이미지, 영상 등의 워터마크 기술도 공급하고 있다. 오픈AI도 2월 AI 생성 이미지에 워터마크를 적용했다. 육안으로 구별하기 어려운 픽셀 단위로 특정 패턴을 워터마크로 활용해 이미지에 심는다.
오디오에 워터마크를 붙이는 기술도 보급됐다. 메타는 6월 음성 워터마크 솔루션인 ‘오디오실’을 공개했다. 음성 워터마크는 소리 파동을 시각화한 이미지에 식별용 픽셀을 심는 방식이다. 이 픽셀은 소리 파동으로 변환됐을 때 사람 귀로는 식별이 안 된다. 메타는 10월 AI 영상 생성기인 ‘무비 젠’에 이 기술을 적용했다. 시스코는 화상회의 앱인 ‘웹액스’에 워터마크 기술을 적용했다. 회의 녹음 오디오가 외부에 유출되면 이를 추적할 수 있도록 하려는 목적에서다.
워터마크를 벗기려는 중소 개발사의 반격도 잇따르고 있다. 주로 눈에 띄는 워터마크를 제거하는 식이다. 인도 정보기술(IT) 업체인 픽셀빈은 워터마크를 지워주는 서비스인 ‘워터마크 리무버’를 지난해 선보였다. 이미지에 내장된 워터마크 5000개를 169달러에 풀어주는 구독 상품을 내놨다. 이 서비스가 인기를 끌자 영상이나 오디오에서 워터마크를 빼주는 서비스를 공급하는 업체도 나왔다. 틱톡처럼 특정 SNS에서 생성된 워터마크만을 벗겨주는 서비스도 등장했다.
AI 업체들은 공조해 워터마크 생태계를 키우겠다는 구상이다. 구글은 10월 유튜브에 생성형 AI로 제작된 콘텐츠임을 표시하는 기능을 추가했다. AI 워터마크 기술 표준을 마련하기 위한 연합체인 ‘C2PA’의 표준을 적용했다. C2PA는 어도비, 아마존, 구글 등이 2021년 구성한 연합체다. 2일 기준 회원사가 219곳에 달하는 대형 조직이 됐다. 국내에선 네이버, 이스트소프트 등이 회원이다.
워터마크가 없는 AI 콘텐츠를 걸러내려는 기술 시도도 계속되고 있다. 인텔이 2022년 출시한 솔루션인 ‘페이크캐처’는 영상 속 인물의 얼굴에 드러나는 정맥의 색 변화를 1000분의 1초 단위로 감지해 딥페이크 기술 적용 여부를 가려낸다. 마이크로소프트는 콘텐츠 파일의 메타 데이터에 남은 수정 흔적을 분석하는 방식을 택했다.
‘콘텐츠 크리덴셜’이란 웹사이트에 이미지를 올려 AI 도구 사용 이력을 확인할 것을 권장하고 있다. 한국에선 AI 생성 콘텐츠에 워터마크 삽입을 의무화하는 ‘AI 기본법’(인공지능 발전과 신뢰 기반 조성 등에 관한 기본법안) 제정을 앞두고 있다.
이주현 기자 deep@hankyung.com