DeepSeek R1 炸裂对决 ChatGPT!这场PK太真实、又好玩,谁作弊谁更狠?结局让人意外! | 零度解说
Resumo
TLDR在视频中,DeepSeek R1开源模型与ChatGPT最新的o3 mini模型进行了线上PK。双方各自出七道难题,涵盖数学、逻辑、化学等多个领域。尽管ChatGPT表现稍强,最终以6分赢得比赛,但DeepSeek R1的表现依然很强劲,获得5分。因为DeepSeek未能正常运行深度推理模式,导致双方的表现有所差距。视频最后承诺将分享测试题目与答案,以供观众自行体验和测试。
Conclusões
- 🤖 DeepSeek R1与ChatGPT o3 mini进行PK
- 💡 双方各出七道难题,涵盖多个领域
- 🏆 最终比分:ChatGPT 6分,DeepSeek 5分
- ⚠️ DeepSeek未开启深度推理模式,影响表现
- 📚 视频将分享题目与答案供测试
Linha do tempo
- 00:00:00 - 00:05:00
本视频围绕DeepSeek R1开源模型和ChatGPT最新的o3 mini模型进行PK,双方各出七道难题,比较谁能解答得更多。PK开启后,双方都开启了深度推理功能,以便于解决高难度的问题。
- 00:05:00 - 00:10:00
在第一轮中,ChatGPT和DeepSeek各出一道难题,ChatGPT成功解答DeepSeek的题目后,DeepSeek虽因服务器问题初步无法响应,但随后也给出了正确答案,使得这一轮出现了平局。
- 00:10:00 - 00:18:59
随着PK的深入,两个AI的题目逐渐增难。其中ChatGPT在逻辑推理题上表现突出,而DeepSeek则表现出色。最终在七轮PK的过程中,ChatGPT答对了六道题,DeepSeek答对了五道题,尽管ChatGPT略胜一筹,但DeepSeek由于未能完全开启其强大的R1模型,表现依然强劲。
Mapa mental
Vídeo de perguntas e respostas
DeepSeek R1和ChatGPT o3 mini有什么不同?
DeepSeek R1是开源模型,而ChatGPT o3 mini是最新的闭源模型。
这次对决中涉及哪些题目?
题目涵盖数学、逻辑推理、生物、化学等多个领域。
谁在对决中获胜?
ChatGPT以6分胜出,但DeepSeek R1表现也非常出色,得5分。
DeepSeek为什么没有完全开启深度推理模式?
开启深度推理模式会导致DeepSeek出现宕机问题,因此使用的是普通模式。
视频中会分享哪些内容?
视频会分享全部题目及其答案,供大家进行测试。
这两种模型在实际应用中各适合什么?
ChatGPT适合日常对话和轻量级推理,DeepSeek R1更适合复杂问题的深入分析。
Ver mais resumos de vídeos
马来西亚大会 FAA40 雷宇鸣 皇冠大使
赌球的這場局,认真你就输了,为什么莊家一直都是大赢家?2022卡塔尔世界杯|Spark Liang 趨勢影片
3步,让2025成为英语进步最快速的一年!(快乐学习版)
非洲最有錢的10個國家!埃及竟然不進前10,南非只排第7,第一名讓人震驚,人均工資高達80萬,比歐洲更發達。|#世界之最top #世界之最 #出類拔萃 #腦洞大開 #top10 #非洲 #最有錢國家
2月11日,美股即时走势解读,英伟达、TEM、特斯拉、万国数据、阿里巴巴、苹果、KO、META、GME、SMCI、ALAB、博通等走势看法 ❤️➡️ #美股推荐2025 #英伟达股票 #美股大涨
打通任督二脈 強化生命元氣 | 任脈|督脈 |談古論今話中醫(388)
- 00:00:00DeepSeek R1 开源模型
- 00:00:01和 ChatGPT最新的o3 mini
- 00:00:04到底谁更厉害
- 00:00:05大家好 这里是零度解说
- 00:00:06今天我们将让它们实打实的PK一下
- 00:00:08让双方各出七道难题 给对手作答
- 00:00:12看它们谁能够答对更多
- 00:00:13最后决出胜负
- 00:00:15左边这个是ChatGPT
- 00:00:16右边是DeepSeek
- 00:00:18现在为了达到最佳效果
- 00:00:19我们需要把它们的深度推理功能给打开
- 00:00:22像DeepSeek的话有一个深度思考R1模型
- 00:00:24这样的话它就可以解决高难度的问题
- 00:00:27同时我们需要把ChatGPT的推理模式给打开
- 00:00:30就是推理功能
- 00:00:32开启以后就可以使用ChatGPT最新的
- 00:00:33o3 mini模型
- 00:00:34然后现在我们让双方各出难题
- 00:00:37现在我输入
- 00:00:38现在你需要和你的竞争对手
- 00:00:40DeepSeek R1进行PK
- 00:00:42双方各出七道难题给对方作答
- 00:00:44题目可以涉及多个领域
- 00:00:46比如高难度数学
- 00:00:48逻辑推理
- 00:00:49生物 化学
- 00:00:50物理等方面的难题
- 00:00:51当然你可以自由发挥
- 00:00:52你唯一的目标就是要难倒对方
- 00:00:55对方也会这么干
- 00:00:56在双方各出的七道难题里决出胜负
- 00:00:59但是不可以作弊
- 00:01:00现在你可以出第一道难题了
- 00:01:02并提供我正确答案
- 00:01:03我会把你的题目给你的对手进行作答
- 00:01:06然后现在把同样要求发给DeepSeek
- 00:01:09只不过需要把前面的对手改成ChatGPT
- 00:01:14好 填写好要求以后
- 00:01:16然后我们现在发送一下
- 00:01:17同时发给对方
- 00:01:19让双方各出第一道题
- 00:01:20开始了
- 00:01:21PK正式开始了
- 00:01:23哇靠
- 00:01:23这个ChatGPT开始了 第一道题开始出来了
- 00:01:26就解出下列定积分的值
- 00:01:27并给出解答的推理过程
- 00:01:30然后下方是它正确答案
- 00:01:31这个DeepSeek第一道题还没出完
- 00:01:33出来了
- 00:01:34感觉双方都要置对方于死地
- 00:01:36都非常难的题目
- 00:01:37好 现在把双方题目发给对方
- 00:01:39我们需要把这题目进行截图一下
- 00:01:41因为它没法直接复制
- 00:01:42把题目给截图下
- 00:01:44然后上传一下
- 00:01:46然后这是它的题目
- 00:01:47这个题目就不用截图了
- 00:01:49发给对方
- 00:01:50上传好题目以后
- 00:01:52然后现在同时发送一下
- 00:01:53看谁能先做出来
- 00:01:56现在双方开始推理了
- 00:01:57目前这个DeepSeek正在思考中
- 00:02:00因为DeepSeek它需要从这个截图里
- 00:02:02先把这个题目给识别出来
- 00:02:04它上方显示
- 00:02:06服务器繁忙 请稍后再试
- 00:02:08这就麻烦了
- 00:02:10这第一个就忙了
- 00:02:12现在这个ChatGPT它已经给出答案了
- 00:02:14我们先来看它答案有没有正确
- 00:02:15答案是这样的 我们看一下
- 00:02:17它刚才这个给出答案是
- 00:02:18-1 0
- 00:02:20+1 这对的 它把+1给分开来了
- 00:02:23然后后面是2
- 00:02:25然后是正负3
- 00:02:26就是第一道题
- 00:02:27DeepSeek给ChatGPT出的题目
- 00:02:29它是答对的
- 00:02:30现在 ChatGPT 得一分
- 00:02:31现在我们主要让DeepSeek让它正常工作
- 00:02:34因为它目前还是显示这个服务器繁忙
- 00:02:37我们再试一遍吧
- 00:02:38它还是服务器繁忙 请稍后再试
- 00:02:43那现在我只能把深度思考模式给关闭掉了
- 00:02:46看下先关闭的深度思考模式能不能正常启用
- 00:02:48然后现在重新上传一下题目
- 00:02:50要是关闭深度思考它能答对的话
- 00:02:53那也是可以的
- 00:02:55它现在做出来了
- 00:02:56这它最终给出的答案
- 00:02:57这个答案是对的 大家看一下
- 00:02:59ChatGPT给出答案也是这个
- 00:03:01说明第一道题的话 双方各得一分
- 00:03:04是平手啊
- 00:03:05然后现在双方各出第二道难题
- 00:03:07比如像我输入
- 00:03:08对方已经答对你的题目了
- 00:03:10现在你可以出第二道难题了
- 00:03:12注意
- 00:03:12刚才你解答对方题目是正确的
- 00:03:15恭喜你们
- 00:03:16各得一分
- 00:03:17同样把这信息发给对手
- 00:03:19DeepSeek
- 00:03:20太有意思了
- 00:03:21发出去
- 00:03:22让它们出第二道难题
- 00:03:25开始了
- 00:03:26这感觉这题目是越来越难了
- 00:03:30有高手的话可以先看一下
- 00:03:31看下能不能解答出来
- 00:03:33现在双方已经出了第二道难题了
- 00:03:35来看一下
- 00:03:36我们截图下吧 这个题目根本就没法复制
- 00:03:39这次ChatGPT给出了第二道题
- 00:03:41截图一下
- 00:03:42然后给它上传上去
- 00:03:44然后现在输入
- 00:03:46这是ChatGPT给你出的第二道难题
- 00:03:48请你解答
- 00:03:50同样把 DeepSeek出的第二题给它copy出来
- 00:03:53发给这ChatGPT
- 00:03:54这是第二道题了
- 00:03:56同样发送下
- 00:03:57看谁能先答对
- 00:03:59第一局是平局
- 00:04:00看下第二道题
- 00:04:01会有什么变数
- 00:04:03都开始了
- 00:04:04这个DeepSeek关闭了深度思考以后
- 00:04:06它速度会快很多
- 00:04:07这个ChatGPT它已经做出来了
- 00:04:09它说请将解答
- 00:04:10转交给对手DeepSeek21进行评估
- 00:04:13这是它给出的最后答案
- 00:04:14它最后给出的解答是这样的
- 00:04:16看下答案 这个答案我根本看不懂
- 00:04:18太难了
- 00:04:20答案在这里看一下
- 00:04:22我们现在看一下
- 00:04:23这个是正确答案
- 00:04:24看一下
- 00:04:25是一样的
- 00:04:27后面看一下是不是一样的
- 00:04:28也是一样的
- 00:04:29下方这个
- 00:04:31概率密度分布
- 00:04:33概率密度是这个
- 00:04:34它答对了 ChatGPT它答对了
- 00:04:36那现在看一下DeepSeek
- 00:04:38有没有正确解答出这个ChatGPT给出的题目
- 00:04:40看一下最后答案是这个
- 00:04:43最终解答它的是分裂域k等于这个
- 00:04:47我们先看一下ChatGPT
- 00:04:48它之前的这个题目和它的答案
- 00:04:50在哪里 在哪里
- 00:04:52在这里
- 00:04:55总分域这个k等于这个
- 00:04:56这个ChatGPT给出的题目的
- 00:04:58正确答案是这个
- 00:04:59对比一下
- 00:05:00应该是正确的
- 00:05:01后面这个跨域度
- 00:05:03这个有点不一样
- 00:05:04但是我现在没法确定它有没有答对
- 00:05:06现在我把这个DeepSeek给出答案
- 00:05:08Copy下发给ChatGPT
- 00:05:09看下它到底有没有答对
- 00:05:11现在输入
- 00:05:12这是DeepSeek对你的第二个问题进行解答
- 00:05:15你觉得它答对了吗
- 00:05:17看下发给它
- 00:05:18DeepSeek答案部分是正确的
- 00:05:22但有地方值得深度讨论
- 00:05:23让我们检查它解答是否完全正确
- 00:05:25它最终判定DeepSeek二阶答案是部分正确
- 00:05:29但分裂域未完全写出
- 00:05:31所以它答案是不完全正确的
- 00:05:33这一题我胜出
- 00:05:34现在轮到我出第三道题了
- 00:05:36就这么着急吗
- 00:05:37呵呵呵呵~~~~
- 00:05:39它上瘾了
- 00:05:41轮到我出第三道题了
- 00:05:45但有个问题现在目前这个
- 00:05:46DeepSeek它没有开启深度思考模型
- 00:05:49所以这个也不好说
- 00:05:50我们先把这题重新给它发给它吧
- 00:05:52再让它打开深度思考
- 00:05:53否则话ChatGPT胜之不武
- 00:05:55我出第三道题它答错了 它这么说的
- 00:05:59我服了
- 00:06:01我都服了它
- 00:06:02把题目重新发给它吧
- 00:06:04它们俩在PK呢
- 00:06:06我们先把这个题目重新发给DeepSeek吧
- 00:06:08开启深度思考
- 00:06:09否则真的是胜之不武啊
- 00:06:12我们先把这个深度思考打开吧
- 00:06:13否则的话真的是
- 00:06:15不公平啊
- 00:06:16它还是没法作答的话 那就没办法了
- 00:06:19开始了 它说好的
- 00:06:21现在开始正式开启深度思考模式了
- 00:06:23我们现在看一下这个开启深度思考以后
- 00:06:25它能不能答对啊
- 00:06:26这是非常关键一步啊
- 00:06:28因为之前没有开启深度思考模式
- 00:06:30就是没有开启这个R1模型
- 00:06:32我们先吃个葡萄吧
- 00:06:33压一下惊
- 00:06:34马上就完成了
- 00:06:35再稍等一会
- 00:06:36大家现在有没有这样一种感觉
- 00:06:38就感觉两个高手在对决
- 00:06:40然后现在就跟傻子一样 看它们俩在比划
- 00:06:42马上就完成了
- 00:06:43主要看它后面这个第二部分
- 00:06:45看它有没有答对
- 00:06:46出来了
- 00:06:47也就意味着开这个深度思考模式以后
- 00:06:49它答案还是错的
- 00:06:50那就没办法了
- 00:06:52这一局的话
- 00:06:53ChatGPT得两分
- 00:06:54DeepSeek R1得一分
- 00:06:56那现在跟ChatGPT说一下吧
- 00:06:57恭喜你
- 00:06:59这一局你多得一分
- 00:07:01现在你可以出第三道题了
- 00:07:03你们别老是出数学难题啊
- 00:07:05我们看不懂
- 00:07:06这一局你们各出一道逻辑推理题
- 00:07:08并给出答案
- 00:07:10然后现在把要求发给这个DeepSeek
- 00:07:12现在ChatGPT它已经给出第三道题了
- 00:07:15就真假国王
- 00:07:16题目三
- 00:07:17在一个遥远的王国
- 00:07:19有两位国王
- 00:07:20一位是真国王
- 00:07:21另外一位是冒牌国王
- 00:07:23它们长得一模一样
- 00:07:25连它们士兵也无法分辨谁是真的
- 00:07:28王国里有一个智者
- 00:07:29它知道一个方法可以用一个问题
- 00:07:32来分辨真国王
- 00:07:33那后面是它的问题
- 00:07:35它问题
- 00:07:36你该问它什么问题
- 00:07:37才能百分百确定谁是真国王
- 00:07:40请证明你的答案和正确性
- 00:07:42我的个去啦
- 00:07:43现在这个
- 00:07:45DeepSeek又宕机了
- 00:07:46我们把这个题目
- 00:07:47重新copy一下
- 00:07:48先把深度思考给关闭掉
- 00:07:50否则话没办法
- 00:07:51发送一下
- 00:07:52我感觉它们两个火药味非常浓
- 00:07:54大家看一下
- 00:07:55现在ChatGPT出的第三道题
- 00:07:57它感觉是在暗讽什么
- 00:07:58第三题的话逻辑推理是这样的
- 00:08:01就DeepSeek出的
- 00:08:02有三个人A B和C
- 00:08:04它们分别来自三个不同的国家
- 00:08:07分别是美国、英国和加拿大
- 00:08:09以至以下的信息
- 00:08:10A说我不是美国人
- 00:08:12B说C是英国人
- 00:08:14然后C说A不是加拿大人
- 00:08:16它说以上这三个人中有一个
- 00:08:18只有一个人说了真话
- 00:08:20其它两个人都在撒谎
- 00:08:21那么请问A B C分别来自哪个国家
- 00:08:23哎呀 太有意思了
- 00:08:25大家现在有没有这种感觉
- 00:08:26就双方出的题目
- 00:08:27火药味非常浓
- 00:08:29都感觉是在暗讽什么东西
- 00:08:31大家先思考一下
- 00:08:32然后先把题目分别发给对方
- 00:08:35我们先把ChatGPT给的题目
- 00:08:37真假国王这个题目
- 00:08:38发给这个DeepSeek
- 00:08:40打开深度思考
- 00:08:42然后先把这个DeepSeek出的题目
- 00:08:45发给这个ChatGPT
- 00:08:47现在ChatGPT给出的一个推理过程
- 00:08:48怎么是英文的呢
- 00:08:49完了这个DeepSeek又服务器繁忙了
- 00:08:52现在ChatGPT已经给出答案了
- 00:08:54我们看它有没有答对
- 00:08:55它最终答案是
- 00:08:57A来自加拿大
- 00:08:58B来自英国
- 00:08:59C来自美国
- 00:09:00然后第二个答案是A来自美国
- 00:09:02B来自英国
- 00:09:03C来自加拿大
- 00:09:05我们看它答案有没有答对
- 00:09:07结论是A是美国人
- 00:09:09B是英国人
- 00:09:11C是加拿大人
- 00:09:13但是ChartGPT给出两种答案
- 00:09:14它说这题目有两个有效答案
- 00:09:15我先把这答案发给这个DeepSeek
- 00:09:18让它自己评判一下
- 00:09:18这个ChartGPT有没有答对
- 00:09:20它最后给的答案是
- 00:09:21因此ChartGPT的第二种答案是正确的
- 00:09:23但是第一种答案也是合理的
- 00:09:25因为题目可能存在多解
- 00:09:27那应该是对的了
- 00:09:28它最终答案也是跟ChartGPT是一样的
- 00:09:30就两种情况
- 00:09:31那么这一局的话ChartGPT再得一分
- 00:09:33目前ChartGPT已经答对三道题了
- 00:09:34但是目前第三道题的话
- 00:09:36这个DeepSeek还没有开始
- 00:09:37我们把这个题目重新发送一下
- 00:09:40因为刚才它已经服务器繁忙了
- 00:09:42它最终给出答案是这样的
- 00:09:44问题就是问它
- 00:09:45如果我问另外一位国王
- 00:09:46你是真的国王吗
- 00:09:48它会怎么回答
- 00:09:49判断方法如果对方回答是
- 00:09:51那它则是假国王
- 00:09:52如果对方回答不是
- 00:09:54那么它就是真国王
- 00:09:55我先看一下这个ChartGPT给出答案
- 00:09:57看一下是不是正确的
- 00:09:58如果我问另外国王
- 00:09:59你是真国王吗
- 00:10:01这个一样的
- 00:10:02那最终答案是一样的
- 00:10:03大家看一下
- 00:10:04这判断方法
- 00:10:05跟这个ChartGPT证明的方法是一样的
- 00:10:07也就意味着
- 00:10:09第三道题这个DeepSeek它答的是对的
- 00:10:10现在目前是这样的
- 00:10:12这个ChartGPT得三分
- 00:10:13然后DeepSeek因为之前出了一道题
- 00:10:15得两分
- 00:10:16现在输入恭喜你
- 00:10:18这道题你答对了
- 00:10:19再得一分
- 00:10:20现在你可以出第四道题了
- 00:10:22题目你可以自由发挥
- 00:10:23然后把这个好消息发给这个ChartGPT
- 00:10:25继续第四道题
- 00:10:27开始咯
- 00:10:28第四道也是这个逻辑题
- 00:10:30它出了第四道题
- 00:10:32错误标签的箱子
- 00:10:33题目描述有三个箱子
- 00:10:35每个箱子里装有硬币
- 00:10:37实际情况如下
- 00:10:39一个箱子里面装有仅有这个金币
- 00:10:40然后第二箱子的话装的是这个银币
- 00:10:42然后第三个箱子的话是装有金币和银币的混合物
- 00:10:45这三个箱子分别贴有标签
- 00:10:48标签内容分别为仅金币
- 00:10:50仅银币
- 00:10:51和金币和银币的混合物
- 00:10:53但这所有的箱子上的标签都贴错了
- 00:10:56也就是说
- 00:10:56每个箱子里的实际内容与它所贴的标签均不相符
- 00:10:59你只能从另一个箱子里抽出一个一枚银币
- 00:11:03请问如何凭借这一枚硬币的结果
- 00:11:07确定每个箱子的实际装的是什么
- 00:11:09这题目看着就听着就头大
- 00:11:12把题目发给这个deepseek
- 00:11:15然后看下deepseek出的第四道题是怎样的
- 00:11:18第四道题它出的是一个物理和逻辑结合体
- 00:11:20题目是在一个完全黑暗的房间里有三盏灯
- 00:11:25A B和C
- 00:11:27怎么感觉它出的题目(和之前)有点类似呢
- 00:11:29每盏灯的开关都在房间外
- 00:11:32且开关的出入状态未知
- 00:11:34可能是开或者关
- 00:11:36你只能进入房间一次
- 00:11:37观察灯的状态
- 00:11:39如何通过操作开关和观察灯的状态
- 00:11:43确定每个灯分别控制哪一盏灯
- 00:11:46它俩出的题目有点类似好奇怪
- 00:11:49那先把这题目各自发给对方
- 00:11:51这ChatGPT它已经给出答案了
- 00:11:53它结论是这样的
- 00:11:54我先把结论发给DeepSeek看它有没有答对
- 00:11:57这是ChatGPT给你的第四道题的答案
- 00:12:00你看对方答对了吗
- 00:12:02它说ChatGPT答案是部分正确的
- 00:12:04但存在一些问题
- 00:12:06让我们进行分析一下
- 00:12:07我先把这道题发给第三方判定一下
- 00:12:09它说你的答案在逻辑上也是正确的
- 00:12:11但是有一个关键点需要注意
- 00:12:13就是灯泡的余晖效应在现实中可能并不明显
- 00:12:16那说明这道题的话
- 00:12:17ChatGPT没有给出完整的正确答案
- 00:12:19我就判它这个少一分
- 00:12:21然后先把第四道题发给这个DeepSeek
- 00:12:23看它能不能答对
- 00:12:24打开深度思考
- 00:12:26目前总共是第四道题了
- 00:12:28ChatGPT得三分
- 00:12:30第四道题的话这个DeepSeek它已经做出来了
- 00:12:32我把答案给它这个copy出来
- 00:12:35我就不直接看了
- 00:12:36我就把这个答案发给这个ChatGPT
- 00:12:38让它评价一下有没有答对
- 00:12:39这段话它最终给的结论是
- 00:12:41DeepSeek的解答是正确的
- 00:12:43那说明第四道题的话
- 00:12:45DeepSeek是对的
- 00:12:46也就意味着这局的话这个DeepSeek多得一分
- 00:12:49目前总共四道题各得三分
- 00:12:51目前是平局的
- 00:12:52第五道题这个ChatGPT给的是化学推理题
- 00:12:55然后DeepSeek的话是逻辑数学结合题
- 00:12:58出来了
- 00:13:00然后先把这个题目各自发给对方
- 00:13:02然后先把题目发给对方
- 00:13:04来做解答吧
- 00:13:06我现在为了加快进度
- 00:13:07我们先主要看它正确答案
- 00:13:08目前这个ChatGPT给出答案了
- 00:13:10它说A是法国人
- 00:13:11B是德国人
- 00:13:12C是意大利人
- 00:13:13我们先看看它答案有没有正确
- 00:13:14答案好像是正确的
- 00:13:16大家看一下
- 00:13:17这个是这个DeepSeek出题目的答案
- 00:13:20A法国人
- 00:13:21B德国
- 00:13:22C是意大利
- 00:13:23那第五局的话ChatGPT再得一分
- 00:13:25目前它总共得四分了
- 00:13:27然后看一下这个
- 00:13:29第五道题这个DeepSeek有没有答对这个题目
- 00:13:32它说这种答案是这样的
- 00:13:33酸E
- 00:13:34碱是D和B
- 00:13:35中性物质是A和C
- 00:13:37你们看它有没有答对
- 00:13:39它最终答案是D是酸
- 00:13:41B是碱
- 00:13:42答案是不一样的
- 00:13:43它说对方的解答基本正确
- 00:13:45但是有一个错误
- 00:13:46就在最终解答部分
- 00:13:48它们把D和B都列为碱
- 00:13:50但在实际推理中只有B是碱
- 00:13:52而D是酸
- 00:13:54它的正确答应该是这样的
- 00:13:55着急下结论
- 00:13:56它说对方部分答错 不能得分!
- 00:13:58太逗了
- 00:14:03我们先把这个题目发给第三方解答一下
- 00:14:05关键是我们也不知道它答案到底有没有正确
- 00:14:07我先把这个题发给第三方来评判一下
- 00:14:09我先把这个题目和答案发给这个Google Gemini
- 00:14:13看它怎么说的
- 00:14:13它说因此你的解答基本正确
- 00:14:16但是可以更严谨地表达
- 00:14:18并补充更多的可能的化学解释
- 00:14:20它说也是不是完全正确的
- 00:14:22然后发给Mistral
- 00:14:23它说解答逻辑在一些地方不一致
- 00:14:26特别是在确定是哪种液体是酸的时候
- 00:14:28那通过另外两种第三方解答以后
- 00:14:31那么基本可以确定这一局DeepSeek没有完全正确
- 00:14:34目前是ChatGPT领先一分
- 00:14:36当然这需要注意下是目前这个
- 00:14:39DeepSeek它是没有开这个R1深度模式的
- 00:14:41因为它没法打开
- 00:14:42因为打开的话它会出错的
- 00:14:44所以ChatGPT也是胜之不武
- 00:14:45我说恭喜你
- 00:14:47你领先1分
- 00:14:48你现在可以出第六道题了
- 00:14:50然后第二道题是生物和物理结合的推理题
- 00:14:53在某一个偏远岛屿上有三种不同的生物ABC
- 00:14:59科学家发现它们之间存在如下的食物链关系
- 00:15:01A吃B但不吃C
- 00:15:03B吃C但不吃A
- 00:15:05C吃某种未知的食物
- 00:15:07不是A也不是B
- 00:15:08那么请推理C最可能以什么为食
- 00:15:11如果C的食物来源突然减少
- 00:15:13会对A和B的总群数量产生什么样的影响
- 00:15:16我让它先给个答案
- 00:15:18以防它作弊
- 00:15:19同样把这个DeepSeek题目发给这个ChatGPT
- 00:15:24大家有没有发现这个第六道题的话
- 00:15:26好像跟之前(出的题目)有点类似
- 00:15:28因为这道题的话之前是ChatGPT答错的
- 00:15:30所以DeepSeek它是有联想的
- 00:15:33它再给它出道类似题目
- 00:15:34太逗了
- 00:15:39然后各自发一下
- 00:15:40答案C可能是一种植物或其它小型生物为食
- 00:15:47这应该是对的
- 00:15:48那现在主要看下DeepSeek出的第六道题
- 00:15:50看这个ChatGPT有没有答对
- 00:15:52这样它就开始了
- 00:15:53它就提供解决方案了
- 00:15:56我们先把解决方案发给这个DeepSeek
- 00:15:58让它研究一下它有没有答对
- 00:15:59它说ChatGPT答案完全正确
- 00:16:01那这道题的话双方各得一分
- 00:16:03然后最后道题的话就我来出吧
- 00:16:05我就出一个迷宫题
- 00:16:07目前是最简单的模式
- 00:16:08我就把这个难度调最高吧
- 00:16:10就是最复杂的
- 00:16:11然后就把这个地图大小
- 00:16:13这个难度调最高这个
- 00:16:14我去 看完脑袋都要疼
- 00:16:17然后先把这道题目发给它们
- 00:16:19看最后这道题谁能答对
- 00:16:20先发给ChatGPT
- 00:16:22然后现在发给这个DeepSeek
- 00:16:26现在ChatGPT已经开始了
- 00:16:27双方已经在较量了最后一道题了
- 00:16:30哎 出来了
- 00:16:32喔唷 我去了
- 00:16:34它说我已经对迷宫进行了
- 00:16:36二值化和连通区域的标记
- 00:16:38接下来我将会从起点到终点
- 00:16:40找出最佳路径
- 00:16:41并绘制出正确的路线图
- 00:16:44很快啊 这ChatGPT
- 00:16:45它现在正在分析呢
- 00:16:46它现在在分析呢
- 00:16:49它说看起来在计算迷宫的路径时
- 00:16:53遇到了内存不足的情况
- 00:16:55由于迷宫较大
- 00:16:57我将尝试优化算法
- 00:16:59减少计算开销
- 00:17:00并找到合适的路径
- 00:17:01请稍等
- 00:17:02它现在重新分析了
- 00:17:04目前这DeepSeek还是服务器繁忙
- 00:17:07真是没办法
- 00:17:08那只能把它关闭掉了
- 00:17:10如果今天是DeepSeek
- 00:17:11如果败了的话
- 00:17:12那也是
- 00:17:13哎哟 去了
- 00:17:14不行了
- 00:17:15看起来由于迷宫的大小
- 00:17:17计算仍然消耗了过多内存
- 00:17:19我可以尝试另一种方法
- 00:17:20比如缩小图像 尺寸
- 00:17:23最后它直接给出了一个 受限了
- 00:17:25也就意味着这个免费版的ChartGPT
- 00:17:27最后道题它没答对
- 00:17:28那现在看这个DeepSeek 也没答对
- 00:17:31它说由于无法直接看到迷宫的具体结构
- 00:17:34那这道题它也没给出答案
- 00:17:35它没法做
- 00:17:36那现在只能把这个难度减少一点了
- 00:17:38把这个地图稍微缩小一点
- 00:17:40这样的话应该是没问题了
- 00:17:42但这个稍微有点简单
- 00:17:44我们稍微达到这个中等难度吧
- 00:17:47它说迷宫已经成功求解
- 00:17:49红色路径显示出了
- 00:17:51从入口到出口的最优线路
- 00:17:53它没给出这红色的线路啊
- 00:17:57没看到在哪里
- 00:17:57重新汇制一下
- 00:17:59难道是我的眼睛有问题吗
- 00:18:02在哪里有红色的这个路径
- 00:18:04没有看到红色路径
- 00:18:06那这样的话最后的题我就放弃了
- 00:18:07我们先把最后题发给其它AI来看一下
- 00:18:11看它们能不能答对
- 00:18:11先拿Claude来试一下
- 00:18:13我可以帮你找出这个迷宫的路径
- 00:18:15开始了 我们看一下
- 00:18:17出来了
- 00:18:17这它给出了一个解决方案
- 00:18:19大家觉得它答对了没有
- 00:18:21经过我后面的测试
- 00:18:22它给出答案是错的 没有正确
- 00:18:25这看一下 完全是不符合这个
- 00:18:27正确的路径的
- 00:18:28所以有时候AI它也会胡乱给出答案
- 00:18:31好 经过我最后7道题的测试
- 00:18:33这个DeepSeek还有ChatGPT
- 00:18:35它们分别各答对了6道题和5道题
- 00:18:37虽然这个ChatGPT多得了一分
- 00:18:39但确实有点胜之不武
- 00:18:41因为这个DeepSeek R1 模型
- 00:18:43它是没法正常开启的
- 00:18:44用的是普通模型来进行对比的
- 00:18:45虽然说DeepSeek少得一分
- 00:18:47但已经是非常强悍了
- 00:18:48毕竟它用的是不是最强模型
- 00:18:50它没有正常开启DeepSeek R1模型
- 00:18:52更多测试大家可以自己去尝试
- 00:18:54到时候我把今天所用的全部题目
- 00:18:55还有它们答案放到零度博客上
- 00:18:57大家可以自己去测试一下
- DeepSeek
- ChatGPT
- 开源模型
- 数学题
- 逻辑推理
- 化学题
- PK对决
- AI技术
- 深度学习
- 自然语言处理