김인중이 전하는 딥러닝의 세계<2> AI가 배우는 방법

인간은 다양한 지식과 개념을 이해하고 이를 이용해 복잡한 작업을 수행한다. 이러한 사고 과정에는 언어와 수학이 사용된다. 침팬지, 돌고래 등 일부 동물들도 추상적 사고가 가능하다고 알려져 있으나 인간의 사고력과는 차이가 크다. 그런데, 최근 수년 동안 개발된 다수의 AI들은 지문이나 영상으로부터 자연어로 주어진 질문의 답을 찾아내거나 영상의 내용을 문장으로 기술하는 등 추상적인 개념도 요구하는 작업을 수행한다. 그렇다면 AI는 지식과 개념을 어떻게 표현하고 학습할까?

AI가 지식과 개념 표현하는 방법

효과적인 지식과 개념의 표현 방법은 AI의 핵심 요소 중 하나이다. 딥러닝에 기반한 AI들은 입출력 정보 및 중간 결과를 모두 숫자로 표현한다. 영상, 텍스트, 음성 형태의 데이터 역시 내부적으로는 모두 숫자로 변환해 처리한다. 각 정보를 표현하는 숫자들은 좌표계에서의 위치에 해당한다. 3차원 공간에서 각 물체의 위치가 수평위치, 수직위치, 높이를 나타내는 세 개의 숫자로 표현되는 것처럼 지식과 개념 역시 다양한 축으로 구성된 좌표계에서의 위치에 의해 표현할 수 있다. 예를 들면 영화에 대한 평가 결과는 작품성, 오락성 등을 축으로 갖는 좌표계를, 기업의 경쟁력은 기술력, 지명도, 자산, 매출 등을 축으로 갖는 좌표계를 이용해 표현할 수 있다. 표현하려는 정보가 다양하고 복잡할수록 더 많은 축으로 구성된 좌표계가 사용된다. 그런데 이 세상에 존재하는 다양한 지식과 개념을 효과적으로 표현할 수 있는 좌표계를 정의하는 것은 쉬운 일이 아니다. AI는 어떠한 좌표계를 사용하여 이들을 표현할까?

AI가 지식과 개념의 공간을 학습하는 방법

딥러닝기반 AI는 지식이나 개념을 표현하기 위한 좌표계를 데이터로부터 학습한다. 딥러닝이 탁월한 성능을 보이는 가장 중요한 이유는 표현 체계를 학습하는 능력이 기존 AI기술에 비해 월등하기 때문이다. 대표적인 학습 방법은 목표 작업을 가장 잘 수행할 수 있도록 좌표계를 최적화하는 것이다. 예를 들어 한영번역을 수행하는 AI는 입력 문장의 각 단어를 고차원 공간에서의 좌표로 표현한 후 이를 이용해 문장을 번역한다. 학습 단계에는 입력 문장에 대하여 정답과 가장 유사한 번역 결과를 얻을 수 있도록 각 단어의 좌표를 최적화한다. 예를 들어 “만나서 반갑습니다.”라는 문장을 입력받았을 때 두 단어 ‘만나서’와 ‘반갑습니다’의 좌표는 AI가 “Nice to see you.”를 출력하기에 가장 유리한 좌표로 최적화된다. 작업의 학습 데이터가 부족할 경우 데이터가 풍부한 유사 작업을 위해 학습된 좌표계를 사용하기도 한다.
그런데 이렇게 학습된 좌표계가 다양한 개념을 실제로 잘 표현할까? AI는 특정 작업을 잘 수행하기 위한 지식과 개념의 표현 방법을 학습했을 뿐이므로 이렇게 학습된 좌표계가 인간의 개념 체계와 일치하거나 다른 작업에도 효과적이라는 보장은 없다. 그럼에도 불구하고 AI가 학습한 좌표 공간에서 관찰되는 몇 가지 특성은 인간의 개념 체계와 일치한다. 잘 학습된 좌표계에서는 단어들의 의미가 가까울수록 그 좌표 간의 거리가 가깝게 측정된다. ‘아버지’와 ‘아들’ 간의 거리는 ‘남극’과 ‘학교’ 간의 거리보다 가깝다. 또한 관계가 비슷한 단어쌍들의 거리와 방향은 유사하게 측정된다. ‘프랑스’와 ‘파리’ 간의 거리는 ‘독일’과 ‘베를린’, 또는 ‘영국’과 ‘런던’ 간의 거리와 유사하다. 이는 AI가 학습한 좌표계가 인간이 사용하는 개념 체계와 유의미한 관계가 있음을 보여준다. 이러한 현상은 영상처리, 음성처리 등 다른 분야에서도 관찰된다. 그러나 인간의 개념과 다르거나 잘못된 학습 결과를 보이는 경우도 많기 때문에 지식과 개념을 학습하는 기술이 완전하다고 말하기는 어렵다.

지식 및 개념 표현 체계의 통합 시너지

딥러닝에 의한 지식과 개념의 학습 기술은 다양한 분야에서 AI의 성능을 크게 개선하였을 뿐 아니라 영상, 자연어, 음성 처리 등 AI 응용 분야들 간의 경계를 무너뜨렸다. 딥러닝이 출현하기 전에는 응용 분야마다 서로 다른 기술이 사용되었으며 정보의 표현 체계 역시 달랐다. 그러나 대부분의 응용 분야에 딥러닝이 도입된 이후에는 지식과 개념을 표현하는 체계가 유사해졌기 때문에 분야 간 기술적 통합이 훨씬 쉬워졌다. 이는 문장으로부터 영상을 합성하는 AI와 같이 자연어처리 기술과 영상처리 기술을 결합한 AI나 음성번역과 같이 음성처리 기술과 자연어처리 기술이 결합한 AI가 출현하게 된 배경이다.
또한 응용 분야 간 공유되는 기술이 많아짐에 따라 한 분야의 전문가가 다른 분야에 진출하기 쉬워졌으며 한 분야에서 개발된 기술이 다른 분야의 AI를 발전시킨 사례도 많다. 통합에 의한 시너지가 AI의 발전을 더욱 가속하고 있는 것이다. 이와 같이 점점 강력해지고 있는 AI라는 도구를 깊이 이해한다면 상상을 현실화함으로써 혁신을 일으킬 수 있는 기회 역시 증가하리라 기대한다.

김인중 한동대 교수）