[국제] 딥시크 vs 챗GPT, 충격 실험 결과…中 물리 경시대회 승자는

아이러브강원

아이러브강원님의 홈

전체게시물

아이디로 검색

6시간 59분전 10 0 0

LV.5 67%

관련링크 : https://www.joongang.co.kr/article/25310838

2회 연결

딥시크 앱. 로이터=연합뉴스

중국 인공지능(AI) 스타트업 딥시크(DeepSeek) 최신 모델의 물리학 문제 해결 능력이 AI 선두주자인 미국의 오픈AI 대표 모델인 챗GPT(ChatGPT)를 넘어섰다는 주장이 나왔다.

중국 국영 연구소인 중국과학원 물리연구소는 지난 30일 소셜미디어 공식 계정을 통해 이 같이 밝혔다. 과학 수재들이 경쟁하는 경시대회 문제로 AI를 실험한 결과를 이날 공개한 것이다.

연구소에 따르면 지난 17일 장쑤성에서 열린 '톈무(天目)배 이론물리 경시대회'에서 출제된 문제를 딥시크의 R1, 오픈AI의 GPT-o1, 앤스로픽의 클로드 소넷 등 3개 AI 모델에 풀게 했다. 이후 문제 답안을 실제 경시대회 채점위원단에게 전달했다.

그 결과 140점 만점에 딥시크가 100점으로 1등을 차지했으며 챗GPT이 97점, 클로드 소넷이 71점을 각각 받았다. 이번 대회 참가자들과 비교했을 때 딥시크는 3등 수준의 성적으로, 인간 최고점인 125점과는 격차가 컸다.

연구소는 "AI 응답을 통해 시험 진행 방식에 대한 이해도를 확인한 후 시험을 시작했다"면서 "총 문제 7개에 대해 순차적으로 답안을 받았으며, 답안에 대해서는 중간에 어떤 피드백도 제공하지 않았다"고 설명했다.

이어 "이제 연구원이나 박사후연구원(Postdoc·포닥)을 뽑을 필요도 없는 걸까"라면서도 "AI의 사고 과정이 뛰어난 것은 사실이나 기본적 실수에서 헤매는 경향이 있는 것으로 나타났다"고 짚었다.

연구소는 각 AI 답안의 특징을 구체적으로 분석하기도 했다. 연구소는 "딥시크와 비교하면 챗GPT의 답안은 인간이 작성한 것과 더 유사한 스타일을 보였다"면서 "챗GPT가 증명 문제에서 더 높은 점수를 기록했다"고 했다.

그러면서 "딥시크는 증명의 의미를 제대로 이해하지 못했다"며 "증명해야 할 결론을 재서술했을 뿐 증명 과정을 답안에 포함하지 않았다"고 덧붙였다.

또 "클로드 소넷은 예상외로 부진한 성적을 보였다"며 "초반 두 문제에서 0점을 받는 실수를 저질렀고, 후반에는 챗GPT와 유사한 부분에서 감점을 받았다"고 언급했다.

로그인 후 추천을 하실 수 있습니다.

SNS

댓글목록 0

등록된 댓글이 없습니다.

강원도 행사

시군별 소식

Q&A

뽐&팁

여행&맛집

채용정보

강원마켓

홍보

뉴스

자유글

아이러브강원

[국제] 딥시크 vs 챗GPT, 충격 실험 결과…中 물리 경시대회 승자는

본문

댓글목록 0

[문화] 김대호 "MBC에 퇴사 얘기했다"…14년 만에 '헤어질 결심' 왜

[국제] '파리의 달' 두둥실…올림픽 명물 성화대, 올 여름 다시 뜬다

[문화] 김대호, 14년 몸담았던 MBC 퇴사한다…"프리랜서 전향"

[국제] 日, 군함도 강제성 또 숨겼다…유네스코 후속조치 보고서 ‘약속 불이행’

[국제] 7만원에 산 그림이 216억?…반 고흐 진품 가능성에 발칵

[국제] "최악의 모독 행위"…佛 '극우 대부' 무덤 뒤집어졌다, 무슨 일

[국제] 롤링스톤스 뮤즈서 노숙자까지…英스타 메리앤 페이스풀 별세

[사회] 전한길 "협박 메일 받았다"…경찰, 신변보호 스마트워치 지급

[경제] 美 작년 12월 PCE물가 전년대비 2.6% 상승… 전망치 부합

[국제] 러, 美여객기 사고 애도…“러시아 국적자 3명 사망”

[경제] "정말 18분의 1 비용 맞아?"…딥시크 향한 3가지 의문 [팩플]

[스포츠] 이기흥 전 체육회장, 3월 IOC 총회 참석

[정치] 헌정회장 "이재명 찬성하면 탄핵 전 '원포인트 개헌' 가능"

[국제] 틱톡 올린 영상 뭐길래…13세 딸 총살한 파키스탄 아버지

열람중[국제] 딥시크 vs 챗GPT, 충격 실험 결과…中 물리 경시대회 승자는