"블랙박스 같은 실패 분석해야 발전"…美 유망 AI 기업 개발자의 조언 [긱스]
입력
수정
최근 주목을 받는 인공지능(AI) 산업에서도 한국인 개발자들이 곳곳에서 활약하고 있다. 세계에서 AI 기술과 서비스 수준이 가장 높은 미국에서도 한국인 AI 개발자를 찾을 수 있다. 미국의 유망 AI 스타트업 투게더AI에서 근무하는 정희진 씨도 그런 개발자 중의 하나다. 투게더AI는 AI 기업인 고객사의 AI 모델 구축과 운영 등을 돕는다. 최근 시리즈A에서 1억25만달러의 투자금을 유치해 업계의 주목을 받았다. 정희진 씨를 한경 긱스(Geeks)가 만났다.Q. 학창 시절 어디서 공부했나요?
A. 한성과학고를 졸업하고 KAIST 학부 과정에서 로봇 제어 관련 연구를 했습니다. 미국 펜실베니아 대학교로 석·박사학위를 받았습니다. 다니엘 리 교수님과 조지 파파스 교수님 지도로 강화학습(Reinforcement Learning)과 이를 이용한 로봇학을 집중적으로 공부했죠. 박사 과정에서는 아마존의 로보틱스 연구팀에서 립 러닝 강화 학습(Deep Reinforcement Learning) 연구 인턴십을 경험했습니다. 구글 웨이모의 'Behavior Prediction팀'에서 기계 학습에 관한 인턴십도 했습니다.Q. 첫 직장은 어디인가요?
A. 대학 박사과정을 마치고 인턴십을 했던 구글 웨이모 팀에 'ML 엔지니어'로 합류했습니다. 테크 리드로 여러 팀에서 다른 연구원과 일했습니다. 내부 딥러닝 기반 행동 예측 모델 개선을 이끌었습니다. 3년 정도 지나고 올해 6월에 투게더AI에 연구원으로 이직했죠.
Q. 이직한 이유가 궁금합니다.
A. 투게더AI는 지인의 소개로 알게 됐어요. 공동 창업자, 창립 멤버 대화를 하고 나서 그들의 미션과 비전에 큰 관심과 흥미를 갖게 되었죠. 웨이모도 좋았습니다. 그런데 올해 초부터 생성형 AI 분야에 급격히 커지고 많은 분들이 생성형 AI 영향이 굉장히 커지겠다고 보면서 더 관심이 갔죠. 아직 초기 단계 분야라서 기회가 더 크다고 생각했고요. 세계의 AI 리더들과 새로운 AI 시대에 크고 작은 많은 회사들의 AI 모델 개발이 가능하다는 것도 설렜습니다. 투게더 구성원과 그 목표를 같이 실현하고 싶었습니다.
Q. 투게더AI는 어떤 회사인가요?
A. 연구 기반의 AI 회사입니다. AI 오픈소스 모델과 데이터 연구 및 생성형 AI 모델의 개발과 추론을 위한 클라우드 플랫폼을 제공합니다.Q. 투게더AI에서 어떤 일을 하나요?
A. 데이터와 AI 모델의 성능 관계를 연구하고 있습니다. 최근에는 연구원들과 신기술을 제품화하는 일도 하고 있죠. 회사가 생긴 지 얼마 되지 않고 작아서 연구와 제품화 업무 둘 다 하고 있어요.
Q. 국내 AI 스타트업 업스테이지가 고객사입니다. 업스테이지는 투게더AI에서 어떤 도움을 받나요?
A. 어떤 회사가 AI 모델을 개발하면 그 모델이 쓰일 수 있도록 어딘가에 그 모델이 살아 있어야 합니다. 그 모델 자체도 요즘에는 생성형 기반 AI와 같이 크기가 큽니다. 보통 컴퓨터나 GPU(그래픽처리장치)에서 호스팅합니다. AI 모델을 돌렸을 때 아웃풋이 빨리 나오는 것도 굉장히 중요해요. 이런 상황에서 업스테이지의 AI 모델이 잘 돌아가게 해줍니다.
Q. AI 서비스나 LLM의 구동을 지원하는 건가요?
A. AI 모델이 작동하면서 GPU가 얼마나 필요할지, 이용자가 점점 많아지면 그걸 또 어떻게 처리할지, 그런 문제를 해결하는 것을 지원하죠. Q. 보통 AI 기업이 AWS 같은 클라우드 서비스를 이용하는 것과 비슷한 것 같습니다.
A. 네. 그렇지만 고객사는 AWS에서는 세세한 것까지 직접 설정하고 대응을 해야 합니다. 투게더AI는 이런 부담을 줄여줍니다.
Q. AI 기업이 투게더AI 솔루션을 이용하면 비용, 편의성, 제품 성능 등에서 어떤 좋은 점이 있나요?
A. 셋 다라고 할 수 있습니다. 예를 들어 업스테이지가 직접 다 하려면 모든 분야에 엔지니어들이 시간과 노력을 쏟아야 합니다. 투게더AI를 통해 시행착오를 줄이고 제품 성능을 높일 수 있죠. 관련 엔지니어 인력도 줄일 수 있어 비용도 아낄 수 있습니다. 여러 GPU를 쓰면서 소프트웨어 버그가 많이 발생할 수 있는데 이런 것도 해결해 주기 때문에 편의성도 있습니다. Q. 투게더AI가 놀고 있는 GPU를 활용한다는 얘기도 있습니다.
A. 그건 회사의 궁극적인 목표입니다. 그렇게 하려면 많은 하드웨어 간 통신을 가능하게 해야 합니다. 기술이 발전하면 가능할 겁니다. 아직 구현하지는 못 했고요. 큰 목표입니다. Q. 투게더AI는 AI 모델 중에서 메타의 라마 같은 공개형 모델을 선호하는 것 같아요.
A. 오픈 모델이 'transparency(투명한 수준)'도 훨씬 큽니다. AI 모델이 어떤 데이터로 어떻게 연습을 했는지 모르면 세부 조종을 하는데 제한이 있어요. 오픈 소스는 많은 것이 공개돼 있습니다. 해당 모델을 어떻게 유용하게 쓸 지 도움이 되죠. AI의 사용과 제한에 대해서도 관련 전문가들이 토론하기도 쉽죠. 폐쇄형 모델에서는 이런 논의가 쉽지 않아요. 공개 모델이 논의도 많고 개발자 간 협력도 많이 해서 발전도 빠른 것 같아요. 오픈 소스 진영에서는 AI 모델의 위험성에 대해서도 더 많이 이야기합니다. 사용하는 기업 입장에서도 AI 모델을 효과적으로 사용할 수 있는 방법을 더 쉽게 찾을 수 있죠.
Q. 폐쇄형 AI 모델과 공개형 AI 모델 간 경쟁은 어떻게 될까요?
A. 한가지 모델만 사용하지는 않을 것 같아요. 여러 모델이 공존할 겁니다. 오픈AI의 GPT-4가 더 효과적인 분야가 있고요. 회사 데이터를 학습해야 한다면 오픈AI의 GPT에서는 힘든 작업입니다. 프라이버시 문제가 있기 때문이죠.
Q. 이번에 한국에 온 이유가 궁금합니다.
A. 투게더AI의 미션은 오픈소스 연구와 클라우드 플랫폼을 통해 개인부터 크고 작은 회사들의 AI 모델 개발과 추론을 지원하는 것입니다. 단지 기술과 제품 개발뿐만이 아니라 AI 생태계에 계속 기여하려고 해요. 다른 스타트업, 기업과 협력하고 같이 유용한 상품을 만드는 것이 중요하죠. 한국의 뛰어난 AI인재와 회사가 있어서 저희도 한국에 관심이 많아요. 이미 저희 플랫폼을 이용하는 한국 고객사가 있고요. 이번 한국 방문에서 고객사와 만났고 어떻게 더 지원할 수 있는지 논의하고 향후 계획도 얘기했습니다. 고객사인 업스테이지는 한국의 아주 유망한 AI 회사입니다. 세계적인 수준의 AI 오픈소스 모델도 개발했죠. 오픈소스 데이터와 AI 모델을 기반으로 하는 저희 회사 눈에도 띄었습니다. 업스테이지의 김성훈 대표와 만났고 업스테이지 팀의 실력과 회사의 방향에 깊은 인상을 받았습니다. 서로의 전문성을 살려 앞으로 같이 일할 수 있는 방향에 대해 논의했죠.
Q. AI가 세상을 크게 바꾸고 있고 다른 세상이 올 것이라는 얘기가 나옵니다.
A. AI 기술은 최근 급속도로 발전하고 있습니다. 챗GPT 등장으로 AI가 한정된 분야에서만 쓰이는 기술이 아니라 일상 속 많은 곳에서 사용하고 있죠. 그 영향이 크다는 것이 확실해졌습니다. AI가 얼마나 빠르게 우리 삶에 AI가 적용되고 세상을 변하게 할지 예측하기는 거의 불가능합니다. 엔터테인트먼트부터 교육, 의료 등 다양한 곳에 AI가 쓰이는 것은 불가피하다고 생각합니다. 어쩌면 인터넷이나 소셜미디어만큼 또는 더욱 우리가 사는 방식부터 직업까지 많은 면에서 큰 변화를 급격하게 줄 수 있다고 생각해요.
Q. 미국 AI 산업 현장의 분위기는 어떤가요?
A. 미국에서도 AI에 대한 기대와 열정이 큽니다. 실리콘밸리에서는 친구들과 모임에서도 AI 이야기가 빠지질 않습니다. 여기저기서 생성형 AI를 주제로 저녁 자리부터 토론, 강연, 해커톤 등 일주일에도 관련 이벤트가 여러 개 열릴 정도입니다. 다양한 직종의 사람들의 관심이 많아요.
Q. 한국의 AI 수준이 궁금합니다.
A. 세계적이라고 봅니다. 한국에 뛰어난 AI 개발자, 기업가 등 인재들이 많아요, 'NeurIPS'나 'ICML' 같은 세계적인 AI 학회를 가도 한국 사람의 논문이 많이 눈에 띕니다. 업스테이지 같은 유망한 스타트업과 기업이 아시아 지역과 세계 시장에 진출하는 것을 어렵지 않게 볼 수 있어요. 한국에서 AI 산업과 인재에 대한 지원과 투자가 계속 있기를 바랍니다. Q. 최근에 주목하는 AI 기술과 서비스 소개 부탁드립니다.
A. 저희 회사 연구팀과 협력 연구실에서 집중하는 연구 중 하나는 늘어나는 'sequence length'에 실질적으로 잘 스케일할 수 있는 새로운 딥러닝 구조를 찾는 것입니다. 트랜스포머 구조는 강력하고 지금의 생성형 AI가 혁신을 이끌었지만 이 기술에 요구되는 계산(computation)이 'sequence length'에 2차로(quadratically) 증가하기 때문에 긴 문서 같은 데이터로 학습하고 추론하는 데 한계가 있습니다. 이 때문에 새로운 구조를 제시하는 'Hyena', 'Monarch Mixer', 'RWKV' 같은 기술을 보고 있습니다. 또 다른 흥미로운 분야는 데이터를 효과적으로 사용해 모델의 성능을 높이는 것입니다. 저희 회사도 이 분야를 중점으로 오픈소스 데이터 런치, 'Data mixture' 관련 연구 등을 해오고 있어요. 이 분야에서는 다른 많은 연구도 활발합니다. 이런 신기술을 적용해 거대 AI 모델을 좀 더 저렴하게 이용할 수 있는 서비스에 주목하고 있어요.
Q. AI 개발자 일반인은 AI의 발전에 어떻게 대응해야 할까요?
A. 확실히 올해 초부터 AI에 관심 있는 사람의 범위가 굉장히 넓어졌어요. 이제 AI는 어딜가나 흔히 들을 수 있죠. 기본적인 AI, 특히 요즘 많이 쓰이는 생성형 AI에 대해 배울 수 있는 많은 글과 영상 자료들을 쉽게 접할 수 있습니다. 모든 사람이 AI 전문가가 될 필요는 전혀 없습니다. 하지만 현재 일상에서 많은 사람들이 컴퓨터를 쓰듯이 관련 자료를 통해 기본적인 AI 핵심을 이해하는 것이 필요하죠. AI 제품과 서비스를 어떻게 쓸 수 있을지 관심을 두면 많은 곳에 도움이 될 것으로 생각합니다.
Q. AI 개발자에게 필요한 자세가 있을까요?
A. AI를 다루다 보면 블랙박스 같은 것이 나와요. 이런 블랙박스에서 원하는 성능이 나오지 않으면 그냥 버리는 경우가 있어요. 그런데 왜 성능이 나오지 않은지 굉장히 집중해 분석하는 사람들이 있죠. 이런 태도가 아주 중요하다고 생각해요. 뭐가 문제인지 알아보고 파악하고 분석한 다음에 어떤 모델을 잘 만들지, 그런 고민이 필요합니다. 지금 당장 인센티브가 나오진 않아요. 이렇게 계속 집중하면 나중에 좋은 결과가 나오죠. 그렇지 않은 사람은 발전하지 못하는 것 같아요.
Q. AI 시대에 자녀 교육은 어떻게 해야 할까요?
A. 앞으로 AI가 많이 활용되면서 많은 직종에 변화가 있을 것입니다. 특정 직종에서도 얼마나 AI를 접목할 지에 따라서 많이 바뀔 것 같아요. 구체적으로 예측하기 힘들어요. 지금 당장 보이는 어떤 직종을 목표로 삼고 아이를 지도하기보다는 빠르게 바뀌는 세상과 쏟아지는 새로운 정보를 빨리 소화하고 활용할 수 있는 능력이 중요하다고 생각합니다. AI 시대로 가면서 더욱더 많은 것들이 데이터화가 될 것입니다. 데이터를 기본적으로 이해하고 분석할 수 있는 능력이 많은 직종에서 기본적인 능력이 될 것으로 보입니다. 특히 AI를 많이 쓰게 될 직종에서 큰 장점이 될 것으로 생각합니다.Q. 앞으로 계획과 목표가 궁금합니다.
A. 최근까지 'Advanced AI' 기반 제품들은 대부분 AI 연구원이나 엔지니어가 개발했습니다. 하지만 AI 기초 모델 성능이 우수해지고 개발 툴들이 향상하면서 AI 전문가가 아니어도 AI 기반 제품이나 앱을 쉽게 개발할 수 있게 될 것입니다. 더 많은 개발자가 AI 모델과 데이터에 접근할 수 있고 이를 기반으로 다양한 제품을 쉽고 빠르게 개발할 수 있도록 투게더AI에서 계속 연구하고 제품을 개발할 것입니다. 궁극적으로 AI를 통해 의료 또는 교육 분야의 많은 문제와 어려움들을 푸는 데 기여하고 싶어요
김주완 기자 kjwan@hankyung.com