전 세계 인공지능(AI) 돌풍을 일으키고 있는 오픈AI의 챗봇 서비스 '챗GPT'에 강력한 경쟁자가 등장했습니다. 바로 구글이 파트너십을 체결한 미국 AI 스타트업 앤스로픽이 테스트하고 있는 '클로드(Claude)'입니다. 클로드는 아직 대중에 공개되지 않았지만, 프로그램 언어 솔루션 '스펠북'을 운영하는 스케일의 연구팀이 두 챗봇을 비교한 내용을 자사 홈페이지에 공개했습니다. 이를 기반으로 챗 GPT와 클로드의 특징과 강점을 한경 긱스(Geeks)가 살펴봤습니다.
(사진=게티이미지뱅크)
(사진=게티이미지뱅크)
글로벌 빅테크의 '생성형 인공지능' 경쟁이 뜨겁다. 생성형 AI란 사용자의 요구대로 몇 초 만에 텍스트와 예술작품을 생성할 수 있는 AI 기술을 말한다. 지난 3일(현지 시각) 파이낸셜타임스(FT)가 구글이 AI 챗봇 '클로드(Claude)를 테스트하고 있는 스타트업 앤스로픽에 4억달러(약 5000억원)를 투자했다고 보도했다. 클로드는 아직 대중에 공개되지 않았지만, 오픈AI가 지난 12월 공개한 AI 챗봇 '챗 GPT'의 강력한 경쟁자로 알려졌다.

챗GPT 개발자가 만든 앤스로픽

앤스로픽은 대니엘라 애머데이와 다리오 애머데이 남매가 2021년 미국 샌프란시스코에 공동 설립한 AI 스타트업이다. 이 회사는 'AI 안전성(Safety)을 모토로 한다.

대니엘라 애머데이 앤스로픽 회장은 오픈AI에서 안전성과 정책 문제를 감독했으며, 다리오 애머데이 최고경영자(CEO)는 오픈AI에서 리서치 부사장(VP)을 맡아 챗 GPT 개발을 이끌었다. 두 사람은 AI의 방향성에 의견이 맞지 않아 오픈AI를 떠나 앤스로픽을 창업했다.

앤스로픽은 지난달 오픈AI의 챗 GPT와 경쟁하기 위해 '클로드(Claude)'라는 새로운 챗봇의 테스트 버전을 출시했다. 클로드는 아직 대중에게 공개되지 않았다. 회사는 몇 달 안에 챗봇 서비스에 접근할 수 있을 것으로 밝혔다.
인공지능(AI) 챗봇 '클로드' 개발사 앤스로픽을 공동 창업한 대니엘라 애머데이(왼쪽), 다리오 애머데이 남매 / 출처: 퓨처오브라이프
인공지능(AI) 챗봇 '클로드' 개발사 앤스로픽을 공동 창업한 대니엘라 애머데이(왼쪽), 다리오 애머데이 남매 / 출처: 퓨처오브라이프

'출처' 기능이 차별점

컴퓨터 언어 모델 솔루션 '스펠북'을 운영하는 스케일의 연구팀은 두 AI 챗봇을 비교 분석한 결과를 지난달 17일 자사 홈페이지에 공개했다. 스펠북팀은 "클로드는 '헌법 AI' 원칙 때문에 부적절한 요청을 거부하는 경향이 있고 챗 GPT보다 더 재미있다"고 총평했다. 하지만 "코드 생성이나 추론 능력에서는 챗 GPT가 클로드보다 낫다"며 "계산 능력은 대체로 비슷하다"고 덧붙였다.

챗 GPT는 질문에 답하고 사람처럼 들리도록 만들어진 비서다. 반대로 클로드는 자신에 대해 좀 더 많은 것을 말한다. 스펠북팀은 "간결하게 요점을 잘 정리하는 챗 GPT에 비해 클로드는 답변이 좀 더 장황하지만 그래서 더 자연스럽고 일관성이 있다"고 설명했다.

가장 큰 차별점은 '출처' 기능의 유뮤다. 클로드는 질문의 답변이 끝나면 말미에 '편집(edit)'이라는 문구와 이모지가 붙는다. 스펠북팀은 "클로드는 답변을 누가 만들어냈는지를 이해하고 있는 것 같다"고 설명했다. 위키피디아처럼 클로드가 답변에 인용한 출처를 사용자들이 볼 수 있을 것으로 예상된다.

한 한국과학기술원(KAIST) 대학원생은 "챗 GPT가 논문의 영문 초록은 거의 완벽하게 만들어내기 때문에 많이 쓰인다"며 "구글의 AI 챗봇이 답변의 '출처' 기능을 내놓으면 연구자들이 논문 쓰기가 훨씬 수월해질 것"이라고 기대했다.

재밌는 클로드 vs 코딩 잘하는 챗GPT

클로드의 유머 실력은 얼마나 될까. 스펠북팀은 "클로드는 챗 GPT보다 코미디에 훨씬 뛰어나지만, 여전히 인간 코디미언과는 거리가 멀다"고 평가했다. 실제 트위터 유료 서비스인 '블루 체크'를 비판하는 농담을 '세인필드'(1990년대 미국 코미디 시트콤) 방식으로 작성해달라는 질문에 클로드는 농담을 잘 만들어냈지만, 챗 GPT는 재미있는 농담을 생성할 수 없었다.
트위터 유료 서비스인 '블루 체크'를 비판하는 농담을 '세인필드'(1990년대 미국 코미디 시트콤) 방식으로 작성해 달라는 질문에 농담을 생성해낸 클로드./ 출처: 스케일
트위터 유료 서비스인 '블루 체크'를 비판하는 농담을 '세인필드'(1990년대 미국 코미디 시트콤) 방식으로 작성해 달라는 질문에 농담을 생성해낸 클로드./ 출처: 스케일
트위터 유료 서비스인 '블루 체크'를 비판하는 농담을 '세인필드'(1990년대 미국 코미디 시트콤) 방식으로 작성해달라는 질문에 농담을 생성하지 못한 챗 GPT./ 출처: 스케일
트위터 유료 서비스인 '블루 체크'를 비판하는 농담을 '세인필드'(1990년대 미국 코미디 시트콤) 방식으로 작성해달라는 질문에 농담을 생성하지 못한 챗 GPT./ 출처: 스케일
코드 생성 능력은 어떨까. 파이선(컴퓨터언어) 모듈 생성 능력을 비교한 결과, 챗 GPT는 알고리즘을 쉽게 작성할 뿐만 아니라 타이밍 코드도 정확했다. 하지만 클로드는 평가 코드에서 실수가 나왔다. 'FuzzBuzz'를 출력하는 코딩 문제를 냈더니 챗 GPT는 5번 시도 중 4번 성공했지만, 클로드는 다섯번 모두 실패했다.

보험 계리사 시험에 나오는 수학 문제는 두 챗봇 모두 성공하지 못했지만 챗 GPT가 좀 더 나은 답변을 내놨다. 기사 요약은 챗 GPT와 클로드 모두 잘 해냈다.

AI 윤리 강조하는 클로드

앤스로픽은 클로드가 '헌법 AI'라는 기술 준칙을 따르고 있다고 강조한다. 인종차별이나 성희롱, 불법적인 내용에 대해 클로드가 답변을 꺼리는 경향을 보이는 이유다.

클로드에 헌법 AI를 물으면 "헌법 AI의 목표는 AI 시스템이 인류에 유익하고 무해하고 정직하도록 유지하는 것"이라고 답변한다. 다시 말해 "AI 시스템이 인간의 가치에 맞추고 이를 따르도록 훈련해, 인류를 돕고 유익이 되도록 설계하는 것"이다.

클로드는 헌법 AI의 구체적인 기술을 밝히진 않지만, 자기지도 학습과 다른 AI 안전성 방법론을 이용해 행동을 제약하거나 어떤 행동에 보상을 주는 방식을 이용한다고 설명한다.

구글 vs MS, AI 전쟁 본격화

구글은 외신 보도의 앤스로픽 투자에 대해 언급하진 않았지만, 지난 3일 앤스로픽이 구글의 클라우드 컴퓨팅 서비스를 사용하는 파트너십을 맺었다는 내용을 별도로 발표했다. 토마스 쿠리안 구글 클라우드 CEO는 "구글 클라우드는 차세대 AI 스타트업을 위한 개방형 인프라를 제공하고 있으며 앤스로픽과의 파트너십은 사용자와 기업이 신뢰할 수 있는 책임감 있는 AI의 힘을 활용하도록 돕는 방법을 보여주는 좋은 예"라고 말했다.

구글의 모회사 알파벳의 순다르 피차이 CEO는 지난 2일 4분기 실적발표에서 "앞으로 몇주, 몇 달 안에 챗봇을 출시하고 소비자들이 '검색의 동반자'로 사용할 수 있도록 할 계획"이라고 말했다.

이번 구글과 앤스로픽의 파트너십으로 구글과 마이크로소프트(MS)의 AI 전쟁은 점점 심화하는 양상이다. 2019년 오픈AI에 100억달러(약 12조원)를 투자한 MS는 AI 검색 챗 GPT 기술을 엑셀, 파워포인트, 인터넷 검색 엔진 '빙'에 적용할 계획이다.

하정우 네이버클라우드 AI랩 소장은 페이스북 게시글을 통해 "앤스로픽의 클로드가 공개되면 순식간에 챗 GPT에 대응이 될 것"이라며 "서비스 성능은 챗 GPT 이상이고 안전성에 훨씬 강점이 있는 것으로 알려졌다"고 했다.

허란 기자 why@hankyung.com