[책마을]AI를 미디어에 적용한다면…이론·실무 겸비한 책 '미디어 인공지능'
미디어는 매일 인공지능(AI)에 대해서 얘기하지만, 실제로 AI를 적용하는 데는 스타트업에 비해서도 뒤처지는 경우가 많다. 딥러닝이나 머신러닝을 넘어 AI까지 기술발전의 속도가 빠른 데 비해 전통 미디어 분야의 전환은 더디다. AI 연구자 역시 미디어 분야에 대한 관심은 크지 않은 경우가 대다수다.

언론정보학을 전공한 후 기자 생활을 하다 연구자로 커리어를 전환한 저자 박대민은 언론계에서는 드물게 '개발자의 마음'과 '기자의 눈'을 동시에 가지고 있는 인물이다. 데이터를 거래하는 거래소 KDX를 운영해 본 경험과 풍부한 영상데이터 딥러닝 연구 경험에 기반해 책을 썼다. 현재 선문대 미디어커뮤니케이션학부 디지털 영상 미디어 전공 조교수로 일하고 있다.

이 책은 다소 학술적이지만 미디어 관계자에게 AI와 미디어를 접목할 수 있는 다양한 논의와 기술을 비교적 쉬운 언어로 설명하고, 저널리즘과 대중문화 등 미디어 영역에서 AI의 역할을 탐색한다.

책의 목적도 뚜렷하다. 저자는 책을 쓴 이유에 대해 '언론과 방송 등 미디어 분야의 연구, 교육, 실무 차원에서 AI 전환(AI transformation, AIX)을 촉진하기 위해서'라고 언급하고 있다. 종전의 AI 기술 서적은 대부분 미디어 분야와 무관하게 작성되어 있고, AI 연구자들이나 규제 당국은 미디어에 대해 관심이 없었다. 반대로 언론사 역시 AIX에 관심을 갖고 있지만, 몇몇 해외 언론사를 제외하고 이를 전면적으로 실행하는 경우는 많지 않았다.

이 책은 미디어 분야의 AI 활용을 하나의 응용 분야로 제시하기 위해 미디어 AI이라는 용어를 제시하고, 미디어 AI로 포괄할 수 있는 핵심 기술을 설명하는 내용을 담고 있다. 또 이를 AI 연구에서 다소 추상적인 수준 또는 기술 일반 수준에서만 논의되고 있는 설명 가능한 AI(eXplainable AI, XAI)나 신뢰할 수 있는 인공지능(trustworthy AI, TAI), 멀티모달 AI에 대한 논의로 확장시켜 나간다.

그동안 미디어 커뮤니케이션 학계나 업계에서는 딥러닝이 주로 텍스트를 대상으로, 기술적으로는 자연어처리 측면에서 다뤄져 왔다. 그 결과 분석 대상이 기사나 커뮤니티, 댓글 중심으로 이루어진 측면이 있다. 이 책은 텍스트보다는 영상 분야, 즉 컴퓨터 비전(computer vision)의 딥러닝에 무게를 두고자 했다. 이를 통해 기존의 텍스트 중심의 딥러닝 활용 연구를 영상, 특히 동영상 분야로 확대하는데 도움이 되길 기대한다고 저자는 밝히고 있다. 미디어 생산물은 특히 컴퓨터 비전 분야 학습데이터의 원천데이터로서 가치가 높다는 게 이유다.

AI에 대한 지식이 전혀 없는 독자가 인공지능의 개념에서 시작해 컴퓨터 비전 분야 딥러닝의 전반적인 내용까지 이해하는데 도움을 주는 것이 목적이다. 저자는 이를 위해 딥러닝 분야의 방대한 성과를 최대한 간결하게 서술하고, 원리 중심으로 서술하고 사례는 독자의 이해를 돕는 수준에서 대표적인 것 위주로 절제해 소개하려고 노력했다. 소스 코드는 완전히 배제했으며 수식 사용도 최소화했다.

미디어 커뮤니케이션학 분야에서 양적 접근을 하지만 컴퓨터 비전 분야 딥러닝은 낯선 양적 연구자는 물론, 학부생이나 대학원생을 비롯한 인문사회계 학생이나 기술적 이해를 바탕으로 AI에 비판적 연구를 수행하는 문화연구자, 그리고 컴퓨터공학을 전공하지 않은 언론사 기자나 방송사 프로듀서, 미디어 스타트업에 종사하는 비전공자 등 미디어 업계의 다양한 종사사, 미디어 관련 정책 담당자 등이 읽어볼 만한 책이다.



이상은 기자 selee@hankyung.com