딥페이크 잡아라…범죄 AI 따로 만들어 탐지 AI 강훈련

딥페이크는 ‘딥러닝(Deep Learning)’ 기술과 ‘가짜(Fake)’의 합성어입니다. 2017년 미국 최대 커뮤니티인 레딧에 등장한 연예인 얼굴과 포르노그래피 합성이 최초였고, 이후 사람의 눈으로 구별이 어려울 정도로 점점 진짜같이 만들어지고 있습니다. 예전에는 포토샵 같은 사진 합성 프로그램이 널리 쓰였다면, 이제는 인공지능(AI)의 힘을 빌려 훨씬 그럴듯한 합성물을 만들어내고 있습니다. 가짜뉴스에도 사용되면서 사람들에게 혼란을 주고, 사실을 왜곡하려는 목적으로 악용되는 상황입니다. 최근에는 기업과 일반인으로 공격 대상이 확대되고 있습니다.

딥페이크는 AI 기술 중 GAN(생성적 적대 신경망) 기술에 기반하고 있습니다. 2014년 이안 굿펠로가 발표한 논문에서 처음 언급된 GAN은 AI를 통해 세상에 존재하지 않는 이미지를 생성합니다. 이후 다른 연구진에 의해 발전된 다양한 GAN 기술은 보다 그럴듯하고 정교한 수준으로 가상의 이미지를 만들어 내고 있습니다.

사람처럼 학습을 통해 배우는 AI

GAN의 원리를 알려면 우선 AI가 어떻게 학습해야 하는지부터 시작해야 합니다. 기존 컴퓨터와 다르게 AI는 여러 가지 경험을 통해 패턴을 얻어내고 이를 기반으로 다음 행동을 결정합니다. 이것을 바로 학습이라고 합니다. ‘커피를 많이 마시면 잠을 설칠 수 있으니 줄여야겠다’와 같은 학습을 머신러닝(기계학습)을 통해 수행하게 된 것입니다.

많은 문제의 다양한 난이도와 해결 방법에 따라 머신러닝의 방식이 각각 다릅니다. 문제에 따라 AI가 인간 선생님의 지도를 받아 학습할 수도 있고, 스스로 자율학습을 할 수도 있게 됐습니다. 문제의 성격에 따라 적용하는 머신러닝 방법은 크게 지도 학습, 비지도 학습, 강화 학습으로 나뉩니다.

가장 먼저 알아볼 내용은 지도 학습입니다. 지도 학습은 정답이 주어진 상태에서 학습하는 알고리즘을 의미합니다. 예를 들어 여러 장의 고양이와 기린 사진을 주고 각 사진이 고양이인지 기린인지 하나하나 정답을 알려줍니다. 그다음 어떤 사진을 주었을 때 고양이인지 기린인지 알아맞힐 수 있도록 하는 것입니다.

동물을 잘 모르는 사람에게 고양이와 기린으로 구성된 동물 사진들을 보여준다고 가정해 봅시다. 이때 어떤 사진이 고양이고 어떤 사진이 기린인지 알려주지 않아도 사람들은 노랗고 얼룩무늬가 있고 목이 긴 동물과 그렇지 않은 동물로 구분할 수 있을 것입니다. 이렇게 하나하나 정답을 가르쳐주지 않아도 데이터의 특성, 즉 패턴을 파악해 분류하는 것을 비지도 학습으로 나눕니다.

완벽한 ‘가짜 이미지’ 만들어내는 GAN

이런 비지도 학습의 가장 대표적 기술이 GAN입니다. 위조지폐범은 최대한 진짜 같은 화폐를 만들어(생성) 경찰을 속이기 위해 노력하고, 경찰은 진짜 화폐와 가짜 화폐를 완벽히 판별(분류)해 위조지폐범을 검거하는 일을 목표로 세웁니다. 이렇게 경쟁적인 학습이 지속되다 보면 어느 순간 위조지폐범은 진짜 같은 위조지폐를 만들 수 있고 경찰은 위폐와 실제 화폐를 구분할 수 없는 수준에 이르게 됩니다.

여기서 경찰은 분류 모델, 위조지폐범은 생성 모델을 의미합니다. GAN에는 최대한 진짜 같은 데이터를 생성하려는 생성 모델과 진짜와 가짜를 판별하려는 분류 모델이 각각 존재해 서로 적대적으로 학습합니다. 이와 같은 학습과정을 반복하면 분류 모델과 생성 모델이 서로를 적대적 경쟁자로 인식해 둘 다 발전하게 됩니다. GAN은 생성 모델이 분류에 성공할 확률을 낮추려 하고 분류 모델은 분류에 성공할 확률을 높이려고 노력하면서 서로가 서로를 경쟁적으로 발전시켜 데이터 품질이 비약적으로 발전하는 구조를 이룹니다.

삼성SDS의 사내벤처 팀나인이 구현한 딥페이크 탐지 기술은 딥페이크 이미지에 포함된 인공물(아티팩트)을 평균 2초 이내에 99.99%의 정확도로 구별합니다. 현재 국내 및 해외 고객사에서 딥페이크 이미지 탐지 기술을 제공하고 있습니다. 아티팩트는 AI가 딥페이크를 만들 때 함께 생성되는 일종의 노이즈인데, 합성 기술이 발전한 현재에는 고도의 탐지 엔진을 통해서만 구분이 가능합니다. 현재 삼성SDS는 국내 및 해외 고객사에 딥페이크 이미지 탐지 기술을 제공하고 있습니다.

논문 ‘MMSys’21 Grand Challenge on Detecting Cheapfakes’에서 나온 미디어 대상의 칩페이크 예시. MCM 영화사 로고에 등장하는 ‘정면을 보며 울부짖는 사자’가 이렇게 촬영된 것처럼 조작했다(왼쪽 사진). 낸시 펠로시 미국 하원의장 인터뷰를 느리게 재생해 술에 취하거나 병약한 것처럼 왜곡했다(중간). 버락 오바마 전 미국 대통령이 국립보건원 메릴랜드 연구소에서 에볼라 백신 설명을 듣는 모습을 중국 우한 연구소를 방문해서 박쥐 프로젝트 설명을 듣는 모습으로 조작했다(오른쪽). 삼성SDS 제공

딥페이크만 있나…더 광범위한 칩페이크
짧은 시간에 적은 노력으로 위·변조 '뚝딱'

딥페이크 기술이 나오기 전에도 미디어 위·변조가 이뤄졌습니다. 비디오를 편집해 의도적으로 내용을 왜곡하는 영상을 만들거나, 옳지 못한 목적으로 합성 이미지를 생성하기는 사례가 상당했습니다. 비디오나 이미지 에디터 프로그램을 이용하는 위·변조가 주를 이뤘습니다. 더 먼 과거에는 타인 필체를 흉내 내 계약서에 위조 서명을 하거나, 흑백 증명사진에 잉크로 콧수염을 그려 넣는 등 수작업이 있었습니다.

이런 방식의 위·변조는 ‘짧은 시간과 적은 노력으로 만들어낼 수 있다’는 의미로 칩페이크(Cheapfake)라고 일컫거나, 딥페이크와 대조된다는 의미로 쉘로우페이크(Shallowfake)라고 불립니다. 딥페이크에는 서버 등 비용이 발생하다 보니 비교적 저렴하게 사람 손으로 조작한다는 의미로 칩페이크라는 표현이 생긴 것으로 보입니다.

특히 코로나19 확산 방지를 위해 기업들이 제공하는 모바일 기반 비대면 서비스 환경에서 신분증 위·변조 등 칩페이크 피해가 발생하고 있습니다. 온·오프라인 경계가 불분명해지고 생활에 비대면 업무가 깊게 스며들면서 칩페이크가 비집고 들어올 틈이 생겼다는 분석입니다. 개인 정보가 담긴 문서나 계약서, 친구들과 공유하는 일상 사진까지 다양한 형태의 각종 파일이 인터넷을 통해 전송되고 있다는 점을 노린 공격이 이뤄지고 있다는 얘기입니다.

이렇게 온라인에서 오가는 수많은 형태의 미디어가 우리에게 미치는 영향력이 점점 커지면서 위·변조 즉, 조작된 미디어가 아님을 탐지하는 기술이 한층 더 중요해졌습니다. 칩페이크 미디어는 그 종류와 형태가 다양합니다. 탐지 목적에 따라 대상과 형태 등 범위를 명확히 정의하고, 이에 적합한 기술을 이용해야 피해를 막을 수 있었습니다. 제일 피해 사례가 많은 것이 신분증과 영수증 이미지입니다. 삼성SDS의 사내벤처 팀나인은 신분증 실물, 인쇄물, 화면 촬영물 이미지에서 관찰되는 특징을 구분하는 기술을 개발해 활용하고 있습니다.

팀나인에서는 일반인들도 쉽게 쓸 수 있는 검증 기술을 개발하기 위해서도 노력하고 있습니다. 보통 AI와 관련된 기술은 전문가들이 쓰는 별도 프로그램 언어를 알아야 합니다. 이 부분을 불편해하는 사용자들을 위해 팀나인은 최근 모바일 브라우저에서 동작하는 챗봇 기반 미디어 검증 필터를 개발했습니다. 채팅창에서 기능 안내를 보고 선택해 딥페이크나 칩페이크 여부를 분석하고 그 결과를 즉석에서 확인할 수 있습니다.

삼성SDS

■ 지도학습
정답이 주어진 상태에서 학습하는 알고리즘

■ 비지도학습
데이터의 특성, 즉 패턴을 파악해서 분류해 학습하는 알고리즘

■ GAN(생성적 적대 신경망)
진짜 같은 데이터를 생성하려는 알고리즘과 진위를 감별하는 알고리즘을 서로 경쟁시키듯 학습시키면서 진짜 데이터와 완벽히 비슷한 가짜 데이터를 만드는 것.