[전문가 포럼] 알파고 1년의 교훈, 휴리스틱에 머물러선 안 된다
-
기사 스크랩
-
공유
-
댓글
-
클린뷰
-
프린트
새로운 문제 해결책은 면밀한 계산에서 나와
승리의 확률을 높이는 견고한 선택도 중요
AI는 인간의 창작물이란 점도 인식해야
이경전 < 경희대 교수·경영학 >
승리의 확률을 높이는 견고한 선택도 중요
AI는 인간의 창작물이란 점도 인식해야
이경전 < 경희대 교수·경영학 >
‘알파고’와 이세돌 9단의 대결이 있은 지 1년이 지났다. 알파고는 그동안 온라인에서 60전 전승을 거뒀다고 한다. 중국 랭킹 1위 커제, 한국 랭킹 1위 박정환도 졌다. 바둑의 새로운 황제 알파고로부터 무엇을 배울 것인가.
바둑에는 수많은 정석과 격언이 있다. 인간은 바둑 역사를 통해 정석과 격언이라는 많은 휴리스틱(heuristic·어림셈법)을 개발했다. 이세돌에 대한 알파고의 압승은 인간이 구축해온 많은 격언과 휴리스틱이 합리적이고 냉정한 계산 앞에 무릎 꿇을 수 있다는 것을 보여준다. 이는 우리가 기업 경영과 정부 경영, 사회 정책을 위한 의사결정과 행동을 할 때 그럴듯한 격언, 오랜 가르침, 관행, 과거 사례에 대한 기억과 학습에만 머물러서는 안 된다는 것을 가르쳐준다. 알파고에는 어떤 추상화된 규칙이나 격언, 정석이 하나도 없다. 어쩌면 그런 격언, 규칙, 정석은 대국 결과의 부산물이지 그 자체가 목적은 아닌 것이다.
우리는 때때로 목적과 부산물을 혼동한다. 바둑에서 목적은 이기는 것이다. 기업에서 목적은 주주 종업원 고객을 포함한 이해관계자의 효용을 최대화하는 것이고, 정부의 목적은 국민을 지키고 국민의 행복을 최대화하는 것이다. 바둑, 기업 경영, 정부 경영의 과정에서 여러 격언, 규칙, 휴리스틱이 부산물로 생성돼 나오지만 어쩌면 그것들은 개별 사례에서 우연히 발생한 지식일 수도 있다. 그 지식은 새로운 현실에서는 적용되지 않을 수 있다. 따라서 그 지식은 새로운 문제를 해결할 때는 참고로만 사용해야 하며 새로운 해결책은 결국 면밀한 계산을 통해서만 도출할 수 있다. 또 하나 알파고는 매 순간 자신이 이길 확률과 질 확률을 계산한다. 매일 체중을 재는 사람이 자신의 체중을 적절한 체중으로 유지할 가능성이 더 높듯이 매일 자신의 경영 상황을 체크할 수 있다면 경쟁에서 이길 가능성이 더 커질 것이다.
바둑에는 수읽기가 있다. 바둑은 자기 혼자 잘한다고 이기는 게임이 아니다. 상대방의 수를 읽어 이에 대응할 자신의 수를 준비하고 그 이후에 상대방의 수를 계속 읽어나가야 한다. 알파고는 이 수읽기를 확률 통계적 시뮬레이션을 통해 무심하게, 냉정하게 해나간다. 알파고에는 ‘만방’이라는 개념이 없다. 90집을 이기든 반집을 이기든 이기면 +1점의 상을 받는 것으로 계산하고 지면 -1점이라는 벌을 받는 강화학습이다. 골 득실차가 때로는 중요한 축구와 달리 바둑에선 이겼는지 졌는지만이 중요하기 때문에 알파고 방법론도 그렇게 설계됐다. 그래서 알파고는 끝내기 상황에서 승부의 격차를 확대하기보다는 승리의 확률을 높이는 견고한 선택을 한다. 인간 의사 결정자는 때때로 게임의 법칙을 잊고 자신의 감정 상태를 극대화하는 과정에서 실수한다. 이 역시 알파고 방법론에서 배워야 할 점이다.
그런데 왜 알파고는 5-0 전승으로 이기지 못했는가. 어떤 이는 구글이 일부러 져줬다고 이야기하기도 했지만 그렇지 않다면 알파고의 이 합리적 방법에도 실수가 있다는 것이 된다. 사실 요즘 인공지능에서 가장 각광받는 딥러닝은 언제든지 실수할 수 있는 방법론이다. 또 어떤 실수를 했을 때 왜 그런 실수를 했는지 설명할 수 없는 방법론이다. 인간의 신경망 구조를 모사하면서 출발한 인공신경망 방법론은 아직 불완전해서, 인간은 의사결정 과정을 어느 정도 언어로 회고하면서 설명할 수 있는 데 비해 딥러닝이 기반하고 있는 연결주의적 인공지능 기법은 아직 의사결정의 이유를 설명할 수 없다는 문제가 있다. 학습과정에서 포착해내지 못한 패턴이 나왔을 때는 인간의 상식으로는 전혀 이해하지 못하는 결과를 산출할 수도 있다.
또 알파고는 인간이 만들었다는 점을 명심할 필요가 있다. 그것은 그저 몇십 년 전에 전자계산기를 만든 것과 같다. 어떤 생명이 있는, 의식이 있는 기계가 나온 것이 아니라 그저 노력하는 천재들이 기업 내에서 협업해 프로그램을 만들어냈다. 앞으로 나오는 어떤 인공지능도 인간이 만든 기계일 뿐이고 기업이 만드는 상품이거나 서비스다. 인공지능은 인간의 창작물일 뿐이라는 점을 명심해야 한다.
이경전 < 경희대 교수·경영학 >
바둑에는 수많은 정석과 격언이 있다. 인간은 바둑 역사를 통해 정석과 격언이라는 많은 휴리스틱(heuristic·어림셈법)을 개발했다. 이세돌에 대한 알파고의 압승은 인간이 구축해온 많은 격언과 휴리스틱이 합리적이고 냉정한 계산 앞에 무릎 꿇을 수 있다는 것을 보여준다. 이는 우리가 기업 경영과 정부 경영, 사회 정책을 위한 의사결정과 행동을 할 때 그럴듯한 격언, 오랜 가르침, 관행, 과거 사례에 대한 기억과 학습에만 머물러서는 안 된다는 것을 가르쳐준다. 알파고에는 어떤 추상화된 규칙이나 격언, 정석이 하나도 없다. 어쩌면 그런 격언, 규칙, 정석은 대국 결과의 부산물이지 그 자체가 목적은 아닌 것이다.
우리는 때때로 목적과 부산물을 혼동한다. 바둑에서 목적은 이기는 것이다. 기업에서 목적은 주주 종업원 고객을 포함한 이해관계자의 효용을 최대화하는 것이고, 정부의 목적은 국민을 지키고 국민의 행복을 최대화하는 것이다. 바둑, 기업 경영, 정부 경영의 과정에서 여러 격언, 규칙, 휴리스틱이 부산물로 생성돼 나오지만 어쩌면 그것들은 개별 사례에서 우연히 발생한 지식일 수도 있다. 그 지식은 새로운 현실에서는 적용되지 않을 수 있다. 따라서 그 지식은 새로운 문제를 해결할 때는 참고로만 사용해야 하며 새로운 해결책은 결국 면밀한 계산을 통해서만 도출할 수 있다. 또 하나 알파고는 매 순간 자신이 이길 확률과 질 확률을 계산한다. 매일 체중을 재는 사람이 자신의 체중을 적절한 체중으로 유지할 가능성이 더 높듯이 매일 자신의 경영 상황을 체크할 수 있다면 경쟁에서 이길 가능성이 더 커질 것이다.
바둑에는 수읽기가 있다. 바둑은 자기 혼자 잘한다고 이기는 게임이 아니다. 상대방의 수를 읽어 이에 대응할 자신의 수를 준비하고 그 이후에 상대방의 수를 계속 읽어나가야 한다. 알파고는 이 수읽기를 확률 통계적 시뮬레이션을 통해 무심하게, 냉정하게 해나간다. 알파고에는 ‘만방’이라는 개념이 없다. 90집을 이기든 반집을 이기든 이기면 +1점의 상을 받는 것으로 계산하고 지면 -1점이라는 벌을 받는 강화학습이다. 골 득실차가 때로는 중요한 축구와 달리 바둑에선 이겼는지 졌는지만이 중요하기 때문에 알파고 방법론도 그렇게 설계됐다. 그래서 알파고는 끝내기 상황에서 승부의 격차를 확대하기보다는 승리의 확률을 높이는 견고한 선택을 한다. 인간 의사 결정자는 때때로 게임의 법칙을 잊고 자신의 감정 상태를 극대화하는 과정에서 실수한다. 이 역시 알파고 방법론에서 배워야 할 점이다.
그런데 왜 알파고는 5-0 전승으로 이기지 못했는가. 어떤 이는 구글이 일부러 져줬다고 이야기하기도 했지만 그렇지 않다면 알파고의 이 합리적 방법에도 실수가 있다는 것이 된다. 사실 요즘 인공지능에서 가장 각광받는 딥러닝은 언제든지 실수할 수 있는 방법론이다. 또 어떤 실수를 했을 때 왜 그런 실수를 했는지 설명할 수 없는 방법론이다. 인간의 신경망 구조를 모사하면서 출발한 인공신경망 방법론은 아직 불완전해서, 인간은 의사결정 과정을 어느 정도 언어로 회고하면서 설명할 수 있는 데 비해 딥러닝이 기반하고 있는 연결주의적 인공지능 기법은 아직 의사결정의 이유를 설명할 수 없다는 문제가 있다. 학습과정에서 포착해내지 못한 패턴이 나왔을 때는 인간의 상식으로는 전혀 이해하지 못하는 결과를 산출할 수도 있다.
또 알파고는 인간이 만들었다는 점을 명심할 필요가 있다. 그것은 그저 몇십 년 전에 전자계산기를 만든 것과 같다. 어떤 생명이 있는, 의식이 있는 기계가 나온 것이 아니라 그저 노력하는 천재들이 기업 내에서 협업해 프로그램을 만들어냈다. 앞으로 나오는 어떤 인공지능도 인간이 만든 기계일 뿐이고 기업이 만드는 상품이거나 서비스다. 인공지능은 인간의 창작물일 뿐이라는 점을 명심해야 한다.
이경전 < 경희대 교수·경영학 >