정보 순차처리하던 AI, '딥러닝'으로 인간의 말 터득
-
기사 스크랩
-
공유
-
댓글
-
클린뷰
-
프린트
인공지능의 역사
뉴런 모방한 알고리즘으로 출발
이젠 멀티모달로 여러 데이터 다뤄
뉴런 모방한 알고리즘으로 출발
이젠 멀티모달로 여러 데이터 다뤄
인공지능(AI)이란 용어가 처음 등장한 것은 1956년 미국 다트머스학회에서다. 컴퓨터 과학자 존 매카시는 AI를 “지능형 기계, 특히 지능형 컴퓨터 프로그램을 만드는 과학 및 공학”이라고 정의했다.
2년 뒤인 1958년 미국 코넬항공연구소의 프랑크 로젠블라트가 인간의 뉴런을 수학적으로 모방한 계산 알고리즘 ‘퍼셉트론’을 내놨다. 여러 신호를 입력해 하나의 신호를 출력하는데, 각 신호 세기에 따라 가중치를 부여한다. 신호가 흐르면 0, 흐르지 않는 경우를 1로 표시하며, 신호의 총합이 임계치를 넘어서면 1, 그렇지 않으면 0을 출력한다. 뇌의 뉴런과 구동 원리가 비슷하다.
퍼셉트론 알고리즘은 비선형적인 영역까지 구현하는 다층 퍼셉트론(MLP)으로 발전했고, 2006년 제프리 힌턴 캐나다 토론토대 교수의 딥러닝(심층학습) 기술 개발로 이어졌다. 머신러닝(기계학습)의 한 방법인 딥러닝은 2012년 이미지 인식 경연대회인 ‘이미지넷’에서 우승하며 AI 기술의 핵심으로 자리 잡았다. 이후 2016년 구글 딥마인드가 딥러닝 기술로 개발한 ‘알파고’가 이세돌 9단을 상대로 바둑 대국에서 4승 1패의 승리를 거뒀다. 이 사건을 계기로 ‘AI는 인간을 넘어설 수 없다’는 사회통념이 뒤집혔다.
이듬해인 2017년 AI 분야의 기념비적인 논문 ‘어텐션 이즈 올 유 니드’가 나왔다. 이 논문은 ‘트랜스포머’라고 불리는 AI 알고리즘을 제시했다. 주어진 정보를 순차 처리하는 기존 순환 신경망(RNN)이 아닌, 전체 데이터를 한 번에 받아들인 뒤 중요 정보를 집중해서 처리하는 ‘어텐션’ 딥러닝을 적용한 모델이다. 이 기술은 80년 AI 역사에서 가장 중요한 사건이라는 평가를 받고 있다. AI의 최대 난제이던 자연어 처리의 해법으로 작용했기 때문이다.
현재 주요 생성형 AI는 모두 트랜스포머를 기반으로 하고 있다. 생성 AI 열풍을 몰고 온 챗GPT에서 GPT는 ‘사전 학습된 생성형 트랜스포머(Generative Pre-trained Transformer)’의 약자다. 생성 AI 기술은 이제 문서는 물론 이미지, 영상, 음성 등 다양한 데이터를 분석 및 추론하는 멀티모달 기능으로 발전하고 있다.
실리콘밸리=최진석 특파원 iskra@hankyung.com
2년 뒤인 1958년 미국 코넬항공연구소의 프랑크 로젠블라트가 인간의 뉴런을 수학적으로 모방한 계산 알고리즘 ‘퍼셉트론’을 내놨다. 여러 신호를 입력해 하나의 신호를 출력하는데, 각 신호 세기에 따라 가중치를 부여한다. 신호가 흐르면 0, 흐르지 않는 경우를 1로 표시하며, 신호의 총합이 임계치를 넘어서면 1, 그렇지 않으면 0을 출력한다. 뇌의 뉴런과 구동 원리가 비슷하다.
퍼셉트론 알고리즘은 비선형적인 영역까지 구현하는 다층 퍼셉트론(MLP)으로 발전했고, 2006년 제프리 힌턴 캐나다 토론토대 교수의 딥러닝(심층학습) 기술 개발로 이어졌다. 머신러닝(기계학습)의 한 방법인 딥러닝은 2012년 이미지 인식 경연대회인 ‘이미지넷’에서 우승하며 AI 기술의 핵심으로 자리 잡았다. 이후 2016년 구글 딥마인드가 딥러닝 기술로 개발한 ‘알파고’가 이세돌 9단을 상대로 바둑 대국에서 4승 1패의 승리를 거뒀다. 이 사건을 계기로 ‘AI는 인간을 넘어설 수 없다’는 사회통념이 뒤집혔다.
이듬해인 2017년 AI 분야의 기념비적인 논문 ‘어텐션 이즈 올 유 니드’가 나왔다. 이 논문은 ‘트랜스포머’라고 불리는 AI 알고리즘을 제시했다. 주어진 정보를 순차 처리하는 기존 순환 신경망(RNN)이 아닌, 전체 데이터를 한 번에 받아들인 뒤 중요 정보를 집중해서 처리하는 ‘어텐션’ 딥러닝을 적용한 모델이다. 이 기술은 80년 AI 역사에서 가장 중요한 사건이라는 평가를 받고 있다. AI의 최대 난제이던 자연어 처리의 해법으로 작용했기 때문이다.
현재 주요 생성형 AI는 모두 트랜스포머를 기반으로 하고 있다. 생성 AI 열풍을 몰고 온 챗GPT에서 GPT는 ‘사전 학습된 생성형 트랜스포머(Generative Pre-trained Transformer)’의 약자다. 생성 AI 기술은 이제 문서는 물론 이미지, 영상, 음성 등 다양한 데이터를 분석 및 추론하는 멀티모달 기능으로 발전하고 있다.
실리콘밸리=최진석 특파원 iskra@hankyung.com