아프가니스탄 오폭과 신경망 AI, 그리고 불편한 진실
-
기사 스크랩
-
공유
-
댓글
-
클린뷰
-
프린트
류봉균의 AI밀리터리<4>신경망 신뢰성의 값비싼 대가
미국의 드론 오폭 '인간의 판단 실수'로 알려졌지만
신경망 AI의 완전한 신뢰성에 의문 갖게 한 사건
문제는 높은 수준의 신뢰성 확보하는 데 드는 천문학적 비용
100%순도 신경망 모델을 넘어선 현실적 대안 모색할 때
미국의 드론 오폭 '인간의 판단 실수'로 알려졌지만
신경망 AI의 완전한 신뢰성에 의문 갖게 한 사건
문제는 높은 수준의 신뢰성 확보하는 데 드는 천문학적 비용
100%순도 신경망 모델을 넘어선 현실적 대안 모색할 때
지난 8월 29일 아프가니스탄 카불에서 벌어진 일이다. 미국이 급작스런 철군에 대한 여론을 반전시키기 위해 급박하게 실행한 미션에서 현지 구호활동가와 어린이 7 명 등 총 10 명의 사상자를 내는 대형사고를 친 것이다. 드론이 ‘물통’을 폭탄으로 오인해 폭격을 했다는 게 지금까지 알려진 사고의 원인이다.
이 안타깝고 참담한 ‘실수’의 원인은 인공지능이 아닌 인간의 판단미스로 알려졌지만, 현재 사용되고 있거나 미래의 전장에서 사용될 인공지능 기술에 요구되는 신뢰성에 대해 시사하는 바는 절대로 작지 않다. 만약 이 미션에 인공지능 물체인식 기술이 사용되었다고 언론에 보도되었다고 가정해 보자. 필자의 생각으로는 테슬라의 자율주행 사고와는 비교도 안될 정도로 엄청난 후폭풍을 몰고 왔을 거라고 예상한다. 결론적으로, 이런 사고는 국방에서 점점 더 큰 스케일로 의지하고 있는 인공지능의 신뢰성에 대한 커다란 의문을 갖게 한다.
그렇다면 이 신뢰성을 100% 가까이로 늘리려면 어떻게 해야 할까? 딥러닝을 기반으로 한 현재의 기술발전 속도를 볼 때, 더 많은 데이터와 지속적인 모델 훈련만이 그나마 가능한 방법일 것이다. 이를 제일 잘 하고 있는 회사는 아무래도 테슬라인 듯 하다. 최근 테슬라의 AI Day 행사에서 보여준 데이터 수집과 분석, 그리고 거대 스케일 훈련 인프라는 가히 타의 추종을 불허한다는 생각이다.
문제는 이렇게 거의 무한한 데이터를 모으고 이를 이용한 딥러닝 모델을 끊임없이 훈련시키더라도 100%로 신뢰성을 얻기에는 불가능하다는 것이다.
며칠 전 MIT 인공지능랩의 닐 톰슨(Neil Thomson) 이 제1 연구자로 국제전기전자학회 스펙트럼 (IEEE Spectrum)에서 발표한 ‘Deep Learning’s Diminishing Return’을 보면,
자율주행이나 국방분야에서 거의 완벽한 신뢰성을 얻기 위해 투입하는 비용이 기하급수적으로 늘어난다는 비관적인 결론이 담겨 있다. 예를 들자면 이미지 분류 모델에서 95% 정확성을 얻기 위한 컴퓨팅 비용과 탄소배출량 등을 고려한 사회적 비용이 1조 달러 ($100B) 이상이라는 것이다. 이만한 비용을 감당할 회사나 나라는 몇 손가락을 꼽을 정도다. 실제로 이 때문에 인공지능의 빈부격차는 급속도로 늘어나고 있다.
이 논문에서 제시하는 해결 방법은 두 가지다. 첫 째로는 메타 러닝 방식이다. 쉽게 이야기하자면, 미리 훈련된 환경을 기반으로 새로운 환경에 적응시키기 위한 훈련시간과 훈련
자원을 줄이는 방법이다. 하지만 이 방법이 실질적으로 국방분야에서 필요로하는 고도의 신뢰성을 얻기에는 아직 너무 초보적이다. 논문에서도 언급하듯이 메타러닝을 이용할 경우 신뢰성이 10% 이상 낮아지는 경우가 대부분이다.
두 번째로는 딥러닝 신경망 모델 사이즈를 줄이는 디자인 방법이다. 논문의 둘째 저자인 크리스티안 그린월드(Kristjan Greenewald) 의 소속이 MIT-IBM Watson 인공지능 랩인데, 이는 IBM 과 MIT 가 공동으로 지난 3~4 년간 개발하고 있는 뉴로심볼릭 (neuro-symbolic) 인공지능 방식을 제안하고 있다고 하겠다. 뉴로심볼릭 방식은 한마디로 인공지능 1세대 방식이었던 전문가시스템 (Expert System)을 딥러닝 신경망 모델에 적합시킴으로써, 시스템이 원하는 성능도 얻으면서 동시에 필요로 하는 신경망 모델 크기를 현저히 줄이고자 하는 게 특징이다. 지난 수십 년간 쌓인 전문가 지식을 적극 활용할 수 있을 뿐더러 ‘설명가능한 인공지능’에 비교적 쉽게 근접할 수 있는 부수적 장점도 있다. 물론 이 방식도 더 많은 연구가 진행되어야 하기에 아직 가야할 길이 멀다. 그래도 최근에 이와 개념적으로 비슷한 구조를 가진 강화학습을 기반으로 성능과 신뢰성 두 가지를 모두 성공적으로 잡아낸 개발을 손수 해 본 경험을 토대로 예측하자면, 이런 혼합 방식이 고도의 신뢰성이 필요로 하는 곳에서 요긴하게 쓰여질 거라고 생각한다.
결론적으로 이야기하자면, 국방 분야와 자율주행차 등에 필요한 고도의 신뢰성은 순수 딥러닝만으로 얻기에는 초현실적인 시간과 자원이 필요하다는 ‘불편한 진실’을 보다 많은 사람들이 직시하기 시작했다는 점이다. 이는 모두가 원하지 않는 두 번째의 ‘인공지능 겨울’이라는 어두운 미래를 걱정하지 않을 수 없게 한다. 100% 순도의 신경망 모델만에만 매달릴 것이 아니라
대체방법을 진지하게 고민하여야 할 때이다.
<류봉균 대표>
▶현 (주)세이프가드AI 창업자 겸 대표
▶현 EpiSys Science 창업자 겸 대표
▶전 보잉 팀장, 수석연구원, 및 개발책임자
▶미국 콜럼비아대 전자공학 박사
이 안타깝고 참담한 ‘실수’의 원인은 인공지능이 아닌 인간의 판단미스로 알려졌지만, 현재 사용되고 있거나 미래의 전장에서 사용될 인공지능 기술에 요구되는 신뢰성에 대해 시사하는 바는 절대로 작지 않다. 만약 이 미션에 인공지능 물체인식 기술이 사용되었다고 언론에 보도되었다고 가정해 보자. 필자의 생각으로는 테슬라의 자율주행 사고와는 비교도 안될 정도로 엄청난 후폭풍을 몰고 왔을 거라고 예상한다. 결론적으로, 이런 사고는 국방에서 점점 더 큰 스케일로 의지하고 있는 인공지능의 신뢰성에 대한 커다란 의문을 갖게 한다.
그렇다면 이 신뢰성을 100% 가까이로 늘리려면 어떻게 해야 할까? 딥러닝을 기반으로 한 현재의 기술발전 속도를 볼 때, 더 많은 데이터와 지속적인 모델 훈련만이 그나마 가능한 방법일 것이다. 이를 제일 잘 하고 있는 회사는 아무래도 테슬라인 듯 하다. 최근 테슬라의 AI Day 행사에서 보여준 데이터 수집과 분석, 그리고 거대 스케일 훈련 인프라는 가히 타의 추종을 불허한다는 생각이다.
문제는 이렇게 거의 무한한 데이터를 모으고 이를 이용한 딥러닝 모델을 끊임없이 훈련시키더라도 100%로 신뢰성을 얻기에는 불가능하다는 것이다.
며칠 전 MIT 인공지능랩의 닐 톰슨(Neil Thomson) 이 제1 연구자로 국제전기전자학회 스펙트럼 (IEEE Spectrum)에서 발표한 ‘Deep Learning’s Diminishing Return’을 보면,
자율주행이나 국방분야에서 거의 완벽한 신뢰성을 얻기 위해 투입하는 비용이 기하급수적으로 늘어난다는 비관적인 결론이 담겨 있다. 예를 들자면 이미지 분류 모델에서 95% 정확성을 얻기 위한 컴퓨팅 비용과 탄소배출량 등을 고려한 사회적 비용이 1조 달러 ($100B) 이상이라는 것이다. 이만한 비용을 감당할 회사나 나라는 몇 손가락을 꼽을 정도다. 실제로 이 때문에 인공지능의 빈부격차는 급속도로 늘어나고 있다.
이 논문에서 제시하는 해결 방법은 두 가지다. 첫 째로는 메타 러닝 방식이다. 쉽게 이야기하자면, 미리 훈련된 환경을 기반으로 새로운 환경에 적응시키기 위한 훈련시간과 훈련
자원을 줄이는 방법이다. 하지만 이 방법이 실질적으로 국방분야에서 필요로하는 고도의 신뢰성을 얻기에는 아직 너무 초보적이다. 논문에서도 언급하듯이 메타러닝을 이용할 경우 신뢰성이 10% 이상 낮아지는 경우가 대부분이다.
두 번째로는 딥러닝 신경망 모델 사이즈를 줄이는 디자인 방법이다. 논문의 둘째 저자인 크리스티안 그린월드(Kristjan Greenewald) 의 소속이 MIT-IBM Watson 인공지능 랩인데, 이는 IBM 과 MIT 가 공동으로 지난 3~4 년간 개발하고 있는 뉴로심볼릭 (neuro-symbolic) 인공지능 방식을 제안하고 있다고 하겠다. 뉴로심볼릭 방식은 한마디로 인공지능 1세대 방식이었던 전문가시스템 (Expert System)을 딥러닝 신경망 모델에 적합시킴으로써, 시스템이 원하는 성능도 얻으면서 동시에 필요로 하는 신경망 모델 크기를 현저히 줄이고자 하는 게 특징이다. 지난 수십 년간 쌓인 전문가 지식을 적극 활용할 수 있을 뿐더러 ‘설명가능한 인공지능’에 비교적 쉽게 근접할 수 있는 부수적 장점도 있다. 물론 이 방식도 더 많은 연구가 진행되어야 하기에 아직 가야할 길이 멀다. 그래도 최근에 이와 개념적으로 비슷한 구조를 가진 강화학습을 기반으로 성능과 신뢰성 두 가지를 모두 성공적으로 잡아낸 개발을 손수 해 본 경험을 토대로 예측하자면, 이런 혼합 방식이 고도의 신뢰성이 필요로 하는 곳에서 요긴하게 쓰여질 거라고 생각한다.
결론적으로 이야기하자면, 국방 분야와 자율주행차 등에 필요한 고도의 신뢰성은 순수 딥러닝만으로 얻기에는 초현실적인 시간과 자원이 필요하다는 ‘불편한 진실’을 보다 많은 사람들이 직시하기 시작했다는 점이다. 이는 모두가 원하지 않는 두 번째의 ‘인공지능 겨울’이라는 어두운 미래를 걱정하지 않을 수 없게 한다. 100% 순도의 신경망 모델만에만 매달릴 것이 아니라
대체방법을 진지하게 고민하여야 할 때이다.
<류봉균 대표>
▶현 (주)세이프가드AI 창업자 겸 대표
▶현 EpiSys Science 창업자 겸 대표
▶전 보잉 팀장, 수석연구원, 및 개발책임자
▶미국 콜럼비아대 전자공학 박사