"1000분의 1초 속도로 학습"…데이터 공부방법 바꾸는 AI

테크 & 사이언스

전병곤 서울대 교수 연구팀
인공지능 딥러닝 시스템 '테라'
기존기술 융합해 속도 1.73배↑

황성주 KAIST 교수 연구팀
적은 양의 데이터 학습만으로
많은 업무 수행하는 AI 개발
황성주 KAIST 교수
선택은 늘 어렵다. 떡볶이와 라면 중 어떤 식사가 더 만족스러울지 고민하는 것이 인간이다. 그래서 필요한 개념이 비교다. 떡볶이가 아무리 맛이 좋아도, 가격이 터무니없으면 라면을 먹을 가능성이 크다. 인간은 비교와 선택을 통해 결정하고, 합리적 효용을 취하려 한다. 인공지능(AI)도 다르지 않다. AI가 선택과 비교에 기초한 판단을 할 수 있으면 ‘머신러닝’을 구현한 것이고, 더 고도화하면 ‘딥러닝’이다.

선택과 비교를 컴퓨터에 더 잘 가르치려는 노력은 끊임없이 이어져왔다. 다만 컴퓨터에 ‘맞춤형 교육’을 제공해야 하는 AI 개발자의 고역이 갈수록 커졌다. 기능이 더 좋아지긴 하지만 개발에 엄청난 시간이 들기 시작한 것이다. 딥러닝 프로그램 개발 과정에서 이른바 ‘심볼릭 그래프 처리’ 방식과 ‘명령형 처리’ 방식이 대립을 이룬 것도 이 때문이다. 심볼릭 그래프 처리 방식은 컴퓨터가 데이터를 이해하고 처리하기에 최적이다. 연산할 내용이 그래프로 구조화돼 컴퓨터가 데이터 학습을 직관적이고 빠르게 수행할 수 있다.
전병곤 서울대 교수
다만 AI 개발자가 그래프까지 만들어내는 것은 난도가 높았다. 통상의 정보기술(IT) 프로그램 개발처럼 코드를 입력하는 형태인 명령형 처리는 최종 성능은 떨어졌지만 일단 쉬웠다. 어떤 방식이 옳은지는 AI업계에서 오랜 화두였고, 오랫동안 대립해왔다. 이 기본 구도에 변화가 생겼다.

전병곤 서울대 교수 연구팀은 심볼릭 그래프 처리 방식과 명령형 처리 방식을 융합한 새로운 딥러닝 개발 시스템을 개발했다고 최근 밝혔다. 시스템 이름은 ‘테라’다. 관련 논문은 이달 6일부터 14일까지 열린 세계 최대 AI학회 ‘뉴립스(NeurIPS) 2021’에 채택됐다.

전 교수 연구팀이 만들어낸 체계는 기존에 존재하지 않던 방식이다. 테라는 프로그램에서 실제 진행한 딥러닝 연산을 수집해 이에 대응하는 심볼릭 그래프를 직접 생성하는 고도의 시스템이다. 사용자는 일반 프로그램을 개발하듯, 프로그래밍 언어를 문법에 맞게 작성하기만 하면 된다. 전 교수는 “개발자는 명령형 처리 방식을 계속 수행하는 것이고, 심볼릭 그래프가 필요한 부분은 테라가 대신 변환한다”고 말했다. 심볼릭 그래프 처리 방식이 섞이며 성능은 개선됐다. 테라는 딥러닝 개발 플랫폼 ‘텐서플로’ 기준으로 볼 때 기본 명령형 수행 방식보다 최대 1.73배 빠른 학습 속도를 보였다. 기술은 특허 출원 절차를 밟고 있다.데이터에 맞는 최적의 AI 모델을 찾아 학습시간을 단축시키는 시도는 지구적 숙제다. ‘오토ML’의 고도화가 중요해진 이유다. 기계학습을 도와주는 오토ML은 구글·마이크로소프트(MS) 등 글로벌 IT 기업들이 플랫폼 형태로 서비스하고 있다. 이 기술의 단점은 ‘시간’이었다. 데이터를 넣어 최종적인 AI 모델을 얻어내는 데만 최대 2일이 걸릴 정도로 느렸다.

황성주 KAIST 교수 연구팀은 이 시간을 ‘밀리세컨드(1/1000초)’대로 줄였다. ‘메타러닝’ 기법을 적용한 것이 비결이었다. 메타러닝은 적은 양의 데이터 학습만으로도 다양한 임무 수행이 가능한 AI 모델을 만들어내는 훈련 기법이다. 여기에 황 교수는 1만여 개의 AI 모델 데이터를 활용했다.

사용자가 자신의 데이터를 입력하기만 하면, 즉각적으로 AI 모델이 나오는 새 ‘오토ML’을 완성하는 셈이다. 황 교수는 “현재 이미지 인식 관련 프로토타입 개발을 완료했으며, 내년에 음성인식 등 여러 분야에 실증 적용할 예정”이라고 말했다.

이시은 기자 see@hankyung.com