문장쓰면 그림으로 척척…카카오 '화가 AI' 공개
-
기사 스크랩
-
공유
-
댓글
-
클린뷰
-
프린트
'RQ-트랜스포머' 선보여
카카오의 인공지능(AI) 전문 자회사 카카오브레인이 텍스트를 입력하면 이미지로 변환해 주는 이미지 생성 모델 ‘RQ-트랜스포머’를 글로벌 오픈소스 커뮤니티인 깃허브에 공개했다고 19일 발표했다.
39억 개의 매개변수(파라미터)로 구성된 RQ-트랜스포머는 3000만 쌍의 ‘텍스트-이미지’를 학습한 AI 모델이다. 처음 보는 텍스트의 조합을 이해하고, 이에 대응되는 이미지를 생성할 수 있다. ‘사막에 있는 에펠탑’이라는 텍스트를 입력하면 알맞은 이미지를 보여주는 식이다. 기존 AI 모델보다 이미지 생성 속도와 품질이 향상됐다는 게 회사 측 설명이다.
회사 관계자는 “인간이 머릿속에서 자유롭게 떠올리는 아이디어를 컴퓨터 프로그램을 통해 디지털 이미지로 실현할 수 있도록 기술 역량을 쌓아갈 예정”이라고 말했다. 카카오브레인은 오는 6월 열리는 세계적 학술대회 CVPR 2022에서 RQ-트랜스포머에 대한 논문을 발표할 예정이다.
김일두 카카오브레인 대표는 “이번에 공개한 AI 모델이 인간과 컴퓨터가 자유롭게 대화하는 미래를 향한 여정의 첫 시작이 될 것”이라고 말했다.
이승우 기자 leeswoo@hankyung.com
39억 개의 매개변수(파라미터)로 구성된 RQ-트랜스포머는 3000만 쌍의 ‘텍스트-이미지’를 학습한 AI 모델이다. 처음 보는 텍스트의 조합을 이해하고, 이에 대응되는 이미지를 생성할 수 있다. ‘사막에 있는 에펠탑’이라는 텍스트를 입력하면 알맞은 이미지를 보여주는 식이다. 기존 AI 모델보다 이미지 생성 속도와 품질이 향상됐다는 게 회사 측 설명이다.
회사 관계자는 “인간이 머릿속에서 자유롭게 떠올리는 아이디어를 컴퓨터 프로그램을 통해 디지털 이미지로 실현할 수 있도록 기술 역량을 쌓아갈 예정”이라고 말했다. 카카오브레인은 오는 6월 열리는 세계적 학술대회 CVPR 2022에서 RQ-트랜스포머에 대한 논문을 발표할 예정이다.
김일두 카카오브레인 대표는 “이번에 공개한 AI 모델이 인간과 컴퓨터가 자유롭게 대화하는 미래를 향한 여정의 첫 시작이 될 것”이라고 말했다.
이승우 기자 leeswoo@hankyung.com