전문가처럼 글 쓰고 그림 그리고 작곡…가속 진화한 '생성 AI'

오픈AI가 만든 챗GPT '열풍'
방대한 양의 데이터 학습 바탕
인간의 창작 영역까지 넘봐

SKT·KT·네이버 등 국내 기업도
대화형 AI 서비스 상용화 ‘속도’

창작 프로세스 급변…부작용 돌출
美학교들 과제·논문에 활용 우려
가짜뉴스 학습해 퍼뜨릴 가능성
저작권 둘러싼 소송전도 본격화
세계에 생성 인공지능(AI) 열풍이 불고 있다. 방대한 양의 데이터를 학습한 초거대 AI를 이용해 글과 이미지, 음악까지 만들어낼 수 있는 서비스가 상용화 단계에 접어들었다. 인간의 ‘창작 프로세스’가 송두리째 바뀔 수 있는 만큼 이에 대한 대비가 필요하다는 지적도 나온다.

보고서 쓰고 시 짓는 챗GPT

사진 위는 오픈AI가 2021년 1월 공개한 이미지 생성 AI ‘달리’에게 ‘아보카도 안락의자’를 그려달라고 하자 나온 결과물. 아래는 이듬해 오픈AI가 내놓은 달리2가 만든 이미지. 1년 만에 완성도가 대폭 올라갔다. 오픈AI 제공
최근 생성 AI 열풍의 직접적인 이유는 오픈AI가 만든 챗GPT다. 오픈AI는 작년 11월 챗GPT의 연구용 프리뷰 버전을 공개했다. 누구나 웹사이트에 접속해 AI를 이용해볼 수 있다. 챗GPT의 하루 사용자는 출시 1주일 만에 100만 명을 넘어섰고 최근에는 1500만 명에 이르는 것으로 추산된다. 챗GPT는 기본적으로 사람이 질문하면 그에 대해 답변하는 챗봇이다. 차이는 결과물이다. 전문가가 썼다고 해도 손색없는 수준의 보고서를 작성하는가 하면 시를 짓기도 한다.
챗GPT는 오픈AI의 대규모 언어 모델(LLM) GPT-3를 개량한 GPT-3.5를 기반으로 만들었다. LLM은 단어를 조합해 나오는 문장 가운데 자연스러운 문장에 가중치를 부여하는 통계학적 모델이다. GPT는 학습한 방대한 데이터를 기반으로 인간과 비슷한 문장을 써 내려간다. GPT-3의 파라미터(매개변수)는 1750억 개에 이른다. 파라미터는 인간 뇌의 ‘시냅스’(신경세포의 접합부) 역할을 하는데 숫자가 클수록 성능도 높다. 이르면 올해 출시할 것으로 예상되는 GPT-4는 파라미터 100조 개를 보유한 것으로 알려졌다.

국내 정보기술(IT) 기업들도 한국어 데이터를 활용한 언어 AI 개발에 속도를 내고 있다. SK텔레콤은 최근 AI 서비스 ‘에이닷(A.)’에 장기 기억 기술을 반영할 계획이라고 발표했다. 이용자가 과거에 입력했던 정보를 반영해 맞춤형 결과물을 제시할 수 있게 된다는 설명이다. KT는 올해 상반기 챗GPT 같은 대화형 AI 서비스를 상용화한다는 계획을 내놨다. 네이버도 자체 개발한 초거대 AI ‘하이퍼클로바’를 다양한 용도로 활용 중이다. 네이버 쇼핑에 들어가는 홍보 문구를 작성하거나 각종 리뷰를 분석해 정리하는 등 네이버 서비스 곳곳에 적용했다. 음성을 텍스트로 바꿔주는 서비스 ‘클로바노트’도 하이퍼클로바를 기반으로 만들어졌다.

달리2, 15개월 만에 ‘상전벽해’

이미지 생성도 빠르게 성장하는 분야다. 텍스트 생성 AI가 한 가지 데이터 유형만 사용하는 ‘싱글모달 AI’인 데 비해 이미지 생성 AI는 그림과 텍스트를 활용하는 ‘멀티모달 AI’다.

오픈AI가 2021년 1월 이미지 생성 AI ‘달리(Dall-E)’를 처음 내놨을 당시만 해도 낮은 이미지 퀄리티 탓에 “한계가 뚜렷하다”는 반응이 나왔다. 하지만 지난해 4월 공개한 달리의 업그레이드 버전 달리2는 15개월 만에 비교할 수 없는 결과물을 보여줬다. 달리2를 필두로 스테이블 디퓨전, 미드저니, 노벨AI 등 이미지 생성 AI가 우후죽순 등장했다.

국내에서도 카카오와 LG그룹이 이미지 생성 AI를 선보였다. 카카오는 자체 개발한 초거대 AI ‘RQ-트랜스포머’를 기반으로 AI 아티스트 ‘칼로’를 공개한 데 이어 작년 10월 누구나 이용할 수 있는 이미지 생성 앱 ‘비디스커버(B^DISCOVER)’도 출시했다. LG그룹은 LG AI연구원을 통해 ‘엑사원’을 내놨다. 엑사원으로 구현한 AI 휴먼 ‘틸다’는 지난해 뉴욕 패션위크에서 디자이너로 데뷔하기도 했다.

저작권·거짓 정보 등은 ‘고민’

생성 AI가 도입되면서 기존 제도와 갈등을 빚는 사례도 이어지고 있다. 당장 미국에선 챗GPT를 과제, 논문 작성 등에 활용하는 일이 문제가 되고 있다. 뉴욕과 시애틀의 일부 공립학교는 학교에서 챗GPT 접속을 금지했다. 네이처지는 챗GPT 같은 도구를 논문에 사용할 경우 명시해야 한다는 원칙을 제시했다.

AI가 생성한 글이 거짓 정보를 담을 수 있다는 점도 위협으로 꼽힌다. AI는 온라인 웹사이트와 뉴스, 블로그 게시물 등의 데이터를 학습하는데 이곳의 정보 가운데 잘못된 내용이 섞여 있을 수 있어서다. AP는 “AI 도구는 산업을 재편할 잠재력이 있지만 자신의 목적을 달성하기 위해 거짓말과 프로파간다를 하려는 사람에게도 새로운 기회를 제공한다”고 꼬집었다.

이미지 생성 AI를 둘러싼 저작권 논쟁도 이어질 전망이다. 지난해 미드저니가 만든 작품이 한 미술 대회에서 디지털 아트 부문 1위를 차지하면서 논란이 됐다. 최근에는 3명의 그림 작가가 스테이블 디퓨전을 만든 스테빌리티AI를 비롯한 이미지 생성 AI 제작사에 소송을 제기했다. 원작자의 동의 없이 이미지를 학습시켜 결과적으로 예술가의 권리를 침해했다는 이유에서다. 세계 최대 이미지 플랫폼인 게티이미지도 스테빌리티AI를 상대로 소송을 진행 중이다. 스테빌리티AI가 게티이미지의 사진을 허락 없이 AI 학습에 활용했다는 게 이들의 주장이다.

이승우 기자 leeswoo@hankyung.com