구글 AI 이벤트서 음악·영상 창작 기술 공개…사람이 만든 곡과 구분 안돼
한두 문장 입력하면 후속 글쓰기도 '척척'…'뉴스 써라' 명령에도 소설식 묘사
3초 샘플 듣자 30초 넘는 피아노곡 '뚝딱'…예술 창작하는 AI
3초 남짓한 클래식풍의 피아노 소리 샘플을 입력하자 30초 넘는 피아노곡이 뚝딱 완성됐다.

처음부터 끝까지 물 흐르듯 자연스럽게 연결되는 이 음악은 앞부분 샘플만 제외하면 생성형 인공지능(AI)이 만든 작품이다.

프레젠테이션 화면에 '생성된 피아노곡'이라는 표시만 없었다면 사람이 만든 음악이 아니라는 의심은 결코 들지 않았을 것 같았다.

구글이 2일(현지시간) 미국 뉴욕 신사옥 피어57 캠퍼스에서 주최한 '구글 AI 이벤트'에서는 AI가 이미 예술 창작의 영역에 깊숙이 발을 들여놓았음을 실감할 수 있었다.

피아노곡을 완성한 것은 짧은 오디오 샘플만으로 진짜 같은 음성과 음악을 생성하는 새 AI 기반 프레임워크인 '오디오LM'이다.

텍스트 명령이나 악보를 입력할 필요도 없다.

이미 AI가 만들어낸 그림이 최근 미국의 한 미술전에서 입상해 예술 창작의 정의가 흔들리는 상황에서 구글이 이날 공개한 신기술들은 음악뿐 아니라 문학과 동영상에서도 비슷한 논란을 예고한다.
3초 샘플 듣자 30초 넘는 피아노곡 '뚝딱'…예술 창작하는 AI
구글의 대화형 엔진 '람다'를 기반으로 글쓰기용 텍스트를 생성하는 '워드크래프트' 프로젝트는 아예 전문 작가들과 협업해 다양한 단편 작품을 만들어내는 실험을 시작했다.

구글이 미리 마련한 사례 영상을 보면 '젊고 신비로운 한 마법사가 산속에서 혼자 살고 있다.

아무도 그의 이름이 뭔지, 그가 누구인지도 몰랐다'라는 두 문장을 입력하자 AI가 순식간에 다양한 여러 건의 후속 스토리를 제시했다.

그가 어떻게 마법을 배웠고, 어떤 능력을 갖췄는지, 자신이 누구인지 찾으려 한다는 등의 이야기가 소설 문체로 자연스럽게 이어졌다.

다만 이 기능은 아직 픽션 형식의 글쓰기에만 적용되는 것으로 보였다.

기자가 직접 워드크래프트를 체험하면서 '우크라이나 침공에 관한 뉴스 기사를 쓰라'고 명령하자 "춥고 눈 오는 날 한 무리의 사람들이 탁자 주변에 모여 우크라이나를 돕기 위해 무슨 일을 할지 논의했다", "커다란 소음이 나자 한 남자가 거리로 내려왔다.

그는 고개를 들어 머리 위를 날던 헬기에 있는 사람을 올려다봤다", "한 무리의 사람들이 하늘을 올려다보며 서 있었다.

그들은 두려워하고 있었다"라는 3개의 샘플 문장이 등장했다.

전부 다 뉴스보다는 소설 속 묘사에 가까웠다.

마지막 샘플 문장을 선택하자 AI는 "하늘은 점점 더 어두워지는 거대한 검은 구름으로 덮였고 비가 내리기 시작했다.

사람들은 두려워했다"라는 소설체 묘사가 이어졌다.

워드크래프트 시연을 도운 한 구글 직원은 "보통 샘플이 10개쯤 나오는데 자체 검열을 통해 3개만 나온 것 같다.

안전이나 위험에 관한 내용을 걸러낸 것으로 보인다"라고 설명했다.

실제로 이날 이벤트에서 구글은 '책임있는 AI'를 위한 3대 원칙을 제시하면서 유해한 콘텐츠를 규제하고 진짜가 아닌 AI 생성 콘텐츠를 구분하는 기술을 적용하겠다고 밝혔다.
3초 샘플 듣자 30초 넘는 피아노곡 '뚝딱'…예술 창작하는 AI
3초 샘플 듣자 30초 넘는 피아노곡 '뚝딱'…예술 창작하는 AI
텍스트 명령으로 그림 이미지를 만들어내던 구글의 AI는 초해상도 영상까지 만들어내는 모델로 업그레이드됐다.

이용자가 영어 문장을 하나씩 입력하자 문장 속 묘사를 충실히 구현한 영상이 생성된 것이다.

더글러스 에크 구글리서치 선임 연구국장은 "우리는 창조적 표현의 방식이 완전히 달라지는 전환점에 와 있다"고 말했다.

이날 행사장에서는 일상생활 편의를 돕는 다른 AI 기반 기술도 전시됐다.

면접을 준비하는 사람들이 AI의 도움으로 사전에 인터뷰를 준비하고 도움을 받을 수 있는 '인터뷰 웜업'과 명령어 코드가 아니라 사람의 언어를 입력해도 그대로 명령을 수행하는 로봇 등이 참석자들의 눈길을 끌었다.
3초 샘플 듣자 30초 넘는 피아노곡 '뚝딱'…예술 창작하는 AI
/연합뉴스