물리학 겨룬 딥시크 vs 챗GPT…승자는?
-
기사 스크랩
-
공유
-
댓글
-
클린뷰
-
프린트

중국과학원 물리연구소는 지난 30일 소셜미디어 공식 계정을 통해 최근 개최한 물리 경시대회의 AI 테스트 결과를 공개하며 이같이 밝혔다.
연구소는 이달 17일 장쑤성에서 열린 '톈무(天目)배 이론물리 경시대회'에서 출제된 문제를 AI가 풀도록 한 결과 딥시크의 최신 모델인 R1의 점수가 오픈AI의 GPT-o1을 제쳤다고 밝혔다.
연구소는 딥시크의 R1, 오픈AI의 GPT-o1, 앤스로픽의 클로드 소넷 등 3개 AI 모델이 푼 문제의 답안을 실제 경시대회 채점위원단에게 전달했다고 밝혔다.
채점 결과 140점 만점에 딥시크가 100점으로 1등을 차지했으며, 다음으로 챗GPT이 97점, 클로드 소넷이 71점을 받았다.
다만, 이번 대회 참가자들과 진짜 경쟁할 경우 딥시크는 3등 수준의 성적이었으며, 인간 최고점인 '125점'과는 격차가 매우 컸다.
그러면서 "딥시크와 비교하면 챗GPT의 답안은 인간이 작성한 것과 더 유사한 스타일을 보였다"며 "챗GPT가 증명 문제에서 상대적으로 높은 점수를 기록했다"고 분석했다.
이어 "딥시크는 '증명'의 의미를 제대로 이해하지 못했다"면서 "증명해야 할 결론을 재서술했을 뿐 증명 과정을 답안에 포함하지 않았다"고 덧붙였다.
(사진=연합뉴스)
김현경기자 khkkim@wowtv.co.kr