페이스북 LLM '라마1·2' 연달아 눌렀다…AI 선도국 된 아부다비
-
기사 스크랩
-
공유
-
댓글
-
클린뷰
-
프린트
"극소수의 빅테크들이 우리(의 정보)에 대해 더 많은 권력을 쥐길 원하는 사람은 없을 것입니다. 우리는 우리가 만든 생성형 인공지능(AI)의 거대언어모델(LLM)의 코드를 세상에 공개하고 그들에게 (정보) 주권을 돌려줘야 한다고 믿었습니다."
11일 아부다비에서 만난 파이살 알 반나이 ARTC(아부다비첨단기술연위원회) 사무총장은 ATRC 산하의 연구센터 TII가 개발한 생성형 AI '팰컨 시리즈'를 오픈소스로 공개한 배경에 대해 이 같이 설명했다. 세계 최대 AI 플랫폼 허깅페이스에 따르면 이들이 작년 5월 출시한 생성형 AI 팰컨 시리즈의 첫 모델인 팰컨 40B는 이용률 기준 3개월 전 메타(옛 페이스북)가 선보였던 라마1을 금세 제쳤다.
그 비결로 파이살 총장은 생성형 AI 사용자들에게 정보의 주권을 돌려준 덕분이라고 주장했다. 그는 "기존의 생성형 AI 모델들은 정부, 기업, 개인 등이 이를 사용하려면 해당 모델을 만든 기업에 자신들의 정보를 전부 내어줘야 하는 폐쇄형 소스가 대부분이었다"며 "하지만 앞으로 AI는 여러분들로부터 취합한 정보들을 토대로 훨씬 더 정교하게 병원 이용 내력 등 당신들의 사생활을 분석할 텐데, 이는 보안 측면에서 많은 위험을 안고 있다"고 말했다. 이어 "우리는 차세대 큰 물결인 AI를 극소수가 장악해서는 안된다고 생각해 오픈소스로 세상에 내놓기로 결정했던 것"이라고 했다. 또한 "AI 모델 제작자가 사용자의 데이터를 볼 수 없게 데이터가 비공개로 유지된다는 점은 한국을 포함한 다른 나라들에 중요한 메시지라고 생각한다"며 "모두의 이익을 위해 한국의 연구진도 함께 이 오픈소스 모델을 확장해보는 게 어떨까 제안한다"고 했다.
출시 초기 팰컨40B는 1200만건 이상 다운로드되며 오픈소스 LLM 분야에서 1위 모델이 됐다. 이후 같은해 7월 메타도 성능을 보완한 라마2를 오픈소스로 공개하는 강수를 뒀지만, ATRC가 2개월여만에 내놓은 팰컨180B에 또 다시 밀리는 양상을 보였다. 파이살 총장은 PPT 화면 속 그래프를 가리키며 "현재 팰컨180B는 폐쇄형 소스인 PaLM2(구글)에 필적하고 챗GPT4(오픈AI)의 뒤를 바짝 좇고 있다"며 "여러 국가 및 기업과 이야기를 해 보았을 때 자신들의 정보를 내어주지 않아도 된다는 것에 대한 강한 선호도가 있다는 걸 느낄 수 있다"고 설명했다.
ATRC는 작년 11월엔 무료 서비스인 팰컨 시리즈를 기반으로 유료 플랫폼을 구축하는 AI71를 설립했다. 보건, 교육 등 국가 데이터를 이용해 팰컨 모델을 개선해 특화된 인터페이스를 만고 이를 구독 서비스로 제공해 수익을 창출한다는 구상에서다. AI71에서 만든 의료 특화 플랫폼 라지(RAZI)71이 대표적이다. 의사가 환자의 의료 기록과 증상 등에 대해 입력하면 라지71은 이를 바탕으로 병명 진단 및 치료법 등에 대해 답을 내놓는다. 파이살 총장은 "라지71은 최근 미국과 UAE의 의사시험을 통과할 정도로 성능이 개선됐다"고 강조했다.
이코노미스트는 최근 'AI 국가주의'라는 제목의 기사를 통해 "국가 주도의 AI 기술 개발 방식은 유권자들의 표심을 의식해야 하는 서방 정부들보다 UAE와 같은 중동에서 성과를 내고 있다"고 보도한 바 있다. 중동 국가들은 오일 머니를 토대로 자금력이 풍부한 데다 데이터 수집을 위해 서방처럼 국민들을 설득해야 하는 과정이 필요 없다는 분석이다. ATRC는 설립된지 3여년 된 기관이다. AI 외에도 헬스, 식품 및 농업, 안전 및 보안, 지속가능성, 항공우주, 운송 등 7개 분야에서 현재 100개 이상의 연구 프로젝트를 동시다발로 진행하고 있다. 파이살 총장은 "ATRC는 올해 안에 자율 주행, 보안시스템, 재료소재 등 다른 분야에서도 4~5개의 회사를 추가로 출범할 예정"이라고 말했다.
김리안 기자 knra@hankyung.com
11일 아부다비에서 만난 파이살 알 반나이 ARTC(아부다비첨단기술연위원회) 사무총장은 ATRC 산하의 연구센터 TII가 개발한 생성형 AI '팰컨 시리즈'를 오픈소스로 공개한 배경에 대해 이 같이 설명했다. 세계 최대 AI 플랫폼 허깅페이스에 따르면 이들이 작년 5월 출시한 생성형 AI 팰컨 시리즈의 첫 모델인 팰컨 40B는 이용률 기준 3개월 전 메타(옛 페이스북)가 선보였던 라마1을 금세 제쳤다.
그 비결로 파이살 총장은 생성형 AI 사용자들에게 정보의 주권을 돌려준 덕분이라고 주장했다. 그는 "기존의 생성형 AI 모델들은 정부, 기업, 개인 등이 이를 사용하려면 해당 모델을 만든 기업에 자신들의 정보를 전부 내어줘야 하는 폐쇄형 소스가 대부분이었다"며 "하지만 앞으로 AI는 여러분들로부터 취합한 정보들을 토대로 훨씬 더 정교하게 병원 이용 내력 등 당신들의 사생활을 분석할 텐데, 이는 보안 측면에서 많은 위험을 안고 있다"고 말했다. 이어 "우리는 차세대 큰 물결인 AI를 극소수가 장악해서는 안된다고 생각해 오픈소스로 세상에 내놓기로 결정했던 것"이라고 했다. 또한 "AI 모델 제작자가 사용자의 데이터를 볼 수 없게 데이터가 비공개로 유지된다는 점은 한국을 포함한 다른 나라들에 중요한 메시지라고 생각한다"며 "모두의 이익을 위해 한국의 연구진도 함께 이 오픈소스 모델을 확장해보는 게 어떨까 제안한다"고 했다.
출시 초기 팰컨40B는 1200만건 이상 다운로드되며 오픈소스 LLM 분야에서 1위 모델이 됐다. 이후 같은해 7월 메타도 성능을 보완한 라마2를 오픈소스로 공개하는 강수를 뒀지만, ATRC가 2개월여만에 내놓은 팰컨180B에 또 다시 밀리는 양상을 보였다. 파이살 총장은 PPT 화면 속 그래프를 가리키며 "현재 팰컨180B는 폐쇄형 소스인 PaLM2(구글)에 필적하고 챗GPT4(오픈AI)의 뒤를 바짝 좇고 있다"며 "여러 국가 및 기업과 이야기를 해 보았을 때 자신들의 정보를 내어주지 않아도 된다는 것에 대한 강한 선호도가 있다는 걸 느낄 수 있다"고 설명했다.
ATRC는 작년 11월엔 무료 서비스인 팰컨 시리즈를 기반으로 유료 플랫폼을 구축하는 AI71를 설립했다. 보건, 교육 등 국가 데이터를 이용해 팰컨 모델을 개선해 특화된 인터페이스를 만고 이를 구독 서비스로 제공해 수익을 창출한다는 구상에서다. AI71에서 만든 의료 특화 플랫폼 라지(RAZI)71이 대표적이다. 의사가 환자의 의료 기록과 증상 등에 대해 입력하면 라지71은 이를 바탕으로 병명 진단 및 치료법 등에 대해 답을 내놓는다. 파이살 총장은 "라지71은 최근 미국과 UAE의 의사시험을 통과할 정도로 성능이 개선됐다"고 강조했다.
이코노미스트는 최근 'AI 국가주의'라는 제목의 기사를 통해 "국가 주도의 AI 기술 개발 방식은 유권자들의 표심을 의식해야 하는 서방 정부들보다 UAE와 같은 중동에서 성과를 내고 있다"고 보도한 바 있다. 중동 국가들은 오일 머니를 토대로 자금력이 풍부한 데다 데이터 수집을 위해 서방처럼 국민들을 설득해야 하는 과정이 필요 없다는 분석이다. ATRC는 설립된지 3여년 된 기관이다. AI 외에도 헬스, 식품 및 농업, 안전 및 보안, 지속가능성, 항공우주, 운송 등 7개 분야에서 현재 100개 이상의 연구 프로젝트를 동시다발로 진행하고 있다. 파이살 총장은 "ATRC는 올해 안에 자율 주행, 보안시스템, 재료소재 등 다른 분야에서도 4~5개의 회사를 추가로 출범할 예정"이라고 말했다.
김리안 기자 knra@hankyung.com