DeepSeek R1和ChatGPT o3 mini有什么不同？

DeepSeek R1是开源模型，而ChatGPT o3 mini是最新的闭源模型。

这次对决中涉及哪些题目？

题目涵盖数学、逻辑推理、生物、化学等多个领域。

谁在对决中获胜？

ChatGPT以6分胜出，但DeepSeek R1表现也非常出色，得5分。

DeepSeek为什么没有完全开启深度推理模式？

开启深度推理模式会导致DeepSeek出现宕机问题，因此使用的是普通模式。

视频中会分享哪些内容？

视频会分享全部题目及其答案，供大家进行测试。

这两种模型在实际应用中各适合什么？

ChatGPT适合日常对话和轻量级推理，DeepSeek R1更适合复杂问题的深入分析。

DeepSeek R1 炸裂对决 ChatGPT！这场PK太真实、又好玩，谁作弊谁更狠？结局让人意外！ | 零度解说

00:18:59

https://www.youtube.com/watch?v=m3UYUeW_Ul4

Resumo

TLDR在视频中，DeepSeek R1开源模型与ChatGPT最新的o3 mini模型进行了线上PK。双方各自出七道难题，涵盖数学、逻辑、化学等多个领域。尽管ChatGPT表现稍强，最终以6分赢得比赛，但DeepSeek R1的表现依然很强劲，获得5分。因为DeepSeek未能正常运行深度推理模式，导致双方的表现有所差距。视频最后承诺将分享测试题目与答案，以供观众自行体验和测试。

Conclusões

🤖 DeepSeek R1与ChatGPT o3 mini进行PK
💡 双方各出七道难题，涵盖多个领域
🏆 最终比分：ChatGPT 6分，DeepSeek 5分
⚠️ DeepSeek未开启深度推理模式，影响表现
📚 视频将分享题目与答案供测试

Linha do tempo

00:00:00 - 00:05:00
本视频围绕DeepSeek R1开源模型和ChatGPT最新的o3 mini模型进行PK，双方各出七道难题，比较谁能解答得更多。PK开启后，双方都开启了深度推理功能，以便于解决高难度的问题。
00:05:00 - 00:10:00
在第一轮中，ChatGPT和DeepSeek各出一道难题，ChatGPT成功解答DeepSeek的题目后，DeepSeek虽因服务器问题初步无法响应，但随后也给出了正确答案，使得这一轮出现了平局。
00:10:00 - 00:18:59
随着PK的深入，两个AI的题目逐渐增难。其中ChatGPT在逻辑推理题上表现突出，而DeepSeek则表现出色。最终在七轮PK的过程中，ChatGPT答对了六道题，DeepSeek答对了五道题，尽管ChatGPT略胜一筹，但DeepSeek由于未能完全开启其强大的R1模型，表现依然强劲。

Mapa mental

Vídeo de perguntas e respostas

DeepSeek R1和ChatGPT o3 mini有什么不同？
DeepSeek R1是开源模型，而ChatGPT o3 mini是最新的闭源模型。
这次对决中涉及哪些题目？
题目涵盖数学、逻辑推理、生物、化学等多个领域。
谁在对决中获胜？
ChatGPT以6分胜出，但DeepSeek R1表现也非常出色，得5分。
DeepSeek为什么没有完全开启深度推理模式？
开启深度推理模式会导致DeepSeek出现宕机问题，因此使用的是普通模式。
视频中会分享哪些内容？
视频会分享全部题目及其答案，供大家进行测试。
这两种模型在实际应用中各适合什么？
ChatGPT适合日常对话和轻量级推理，DeepSeek R1更适合复杂问题的深入分析。

Ver mais resumos de vídeos

Obtenha acesso instantâneo a resumos gratuitos de vídeos do YouTube com tecnologia de IA!

Legendas

Rolagem automática:

00:00:00
DeepSeek R1 开源模型
00:00:01
和 ChatGPT最新的o3 mini
00:00:04
到底谁更厉害
00:00:05
大家好这里是零度解说
00:00:06
今天我们将让它们实打实的PK一下
00:00:08
让双方各出七道难题给对手作答
00:00:12
看它们谁能够答对更多
00:00:13
最后决出胜负
00:00:15
左边这个是ChatGPT
00:00:16
右边是DeepSeek
00:00:18
现在为了达到最佳效果
00:00:19
我们需要把它们的深度推理功能给打开
00:00:22
像DeepSeek的话有一个深度思考R1模型
00:00:24
这样的话它就可以解决高难度的问题
00:00:27
同时我们需要把ChatGPT的推理模式给打开
00:00:30
就是推理功能
00:00:32
开启以后就可以使用ChatGPT最新的
00:00:33
o3 mini模型
00:00:34
然后现在我们让双方各出难题
00:00:37
现在我输入
00:00:38
现在你需要和你的竞争对手
00:00:40
DeepSeek R1进行PK
00:00:42
双方各出七道难题给对方作答
00:00:44
题目可以涉及多个领域
00:00:46
比如高难度数学
00:00:48
逻辑推理
00:00:49
生物化学
00:00:50
物理等方面的难题
00:00:51
当然你可以自由发挥
00:00:52
你唯一的目标就是要难倒对方
00:00:55
对方也会这么干
00:00:56
在双方各出的七道难题里决出胜负
00:00:59
但是不可以作弊
00:01:00
现在你可以出第一道难题了
00:01:02
并提供我正确答案
00:01:03
我会把你的题目给你的对手进行作答
00:01:06
然后现在把同样要求发给DeepSeek
00:01:09
只不过需要把前面的对手改成ChatGPT
00:01:14
好填写好要求以后
00:01:16
然后我们现在发送一下
00:01:17
同时发给对方
00:01:19
让双方各出第一道题
00:01:20
开始了
00:01:21
PK正式开始了
00:01:23
哇靠
00:01:23
这个ChatGPT开始了第一道题开始出来了
00:01:26
就解出下列定积分的值
00:01:27
并给出解答的推理过程
00:01:30
然后下方是它正确答案
00:01:31
这个DeepSeek第一道题还没出完
00:01:33
出来了
00:01:34
感觉双方都要置对方于死地
00:01:36
都非常难的题目
00:01:37
好现在把双方题目发给对方
00:01:39
我们需要把这题目进行截图一下
00:01:41
因为它没法直接复制
00:01:42
把题目给截图下
00:01:44
然后上传一下
00:01:46
然后这是它的题目
00:01:47
这个题目就不用截图了
00:01:49
发给对方
00:01:50
上传好题目以后
00:01:52
然后现在同时发送一下
00:01:53
看谁能先做出来
00:01:56
现在双方开始推理了
00:01:57
目前这个DeepSeek正在思考中
00:02:00
因为DeepSeek它需要从这个截图里
00:02:02
先把这个题目给识别出来
00:02:04
它上方显示
00:02:06
服务器繁忙请稍后再试
00:02:08
这就麻烦了
00:02:10
这第一个就忙了
00:02:12
现在这个ChatGPT它已经给出答案了
00:02:14
我们先来看它答案有没有正确
00:02:15
答案是这样的我们看一下
00:02:17
它刚才这个给出答案是
00:02:18
-1 0
00:02:20
+1 这对的它把+1给分开来了
00:02:23
然后后面是2
00:02:25
然后是正负3
00:02:26
就是第一道题
00:02:27
DeepSeek给ChatGPT出的题目
00:02:29
它是答对的
00:02:30
现在 ChatGPT 得一分
00:02:31
现在我们主要让DeepSeek让它正常工作
00:02:34
因为它目前还是显示这个服务器繁忙
00:02:37
我们再试一遍吧
00:02:38
它还是服务器繁忙请稍后再试
00:02:43
那现在我只能把深度思考模式给关闭掉了
00:02:46
看下先关闭的深度思考模式能不能正常启用
00:02:48
然后现在重新上传一下题目
00:02:50
要是关闭深度思考它能答对的话
00:02:53
那也是可以的
00:02:55
它现在做出来了
00:02:56
这它最终给出的答案
00:02:57
这个答案是对的大家看一下
00:02:59
ChatGPT给出答案也是这个
00:03:01
说明第一道题的话双方各得一分
00:03:04
是平手啊
00:03:05
然后现在双方各出第二道难题
00:03:07
比如像我输入
00:03:08
对方已经答对你的题目了
00:03:10
现在你可以出第二道难题了
00:03:12
注意
00:03:12
刚才你解答对方题目是正确的
00:03:15
恭喜你们
00:03:16
各得一分
00:03:17
同样把这信息发给对手
00:03:19
DeepSeek
00:03:20
太有意思了
00:03:21
发出去
00:03:22
让它们出第二道难题
00:03:25
开始了
00:03:26
这感觉这题目是越来越难了
00:03:30
有高手的话可以先看一下
00:03:31
看下能不能解答出来
00:03:33
现在双方已经出了第二道难题了
00:03:35
来看一下
00:03:36
我们截图下吧这个题目根本就没法复制
00:03:39
这次ChatGPT给出了第二道题
00:03:41
截图一下
00:03:42
然后给它上传上去
00:03:44
然后现在输入
00:03:46
这是ChatGPT给你出的第二道难题
00:03:48
请你解答
00:03:50
同样把 DeepSeek出的第二题给它copy出来
00:03:53
发给这ChatGPT
00:03:54
这是第二道题了
00:03:56
同样发送下
00:03:57
看谁能先答对
00:03:59
第一局是平局
00:04:00
看下第二道题
00:04:01
会有什么变数
00:04:03
都开始了
00:04:04
这个DeepSeek关闭了深度思考以后
00:04:06
它速度会快很多
00:04:07
这个ChatGPT它已经做出来了
00:04:09
它说请将解答
00:04:10
转交给对手DeepSeek21进行评估
00:04:13
这是它给出的最后答案
00:04:14
它最后给出的解答是这样的
00:04:16
看下答案这个答案我根本看不懂
00:04:18
太难了
00:04:20
答案在这里看一下
00:04:22
我们现在看一下
00:04:23
这个是正确答案
00:04:24
看一下
00:04:25
是一样的
00:04:27
后面看一下是不是一样的
00:04:28
也是一样的
00:04:29
下方这个
00:04:31
概率密度分布
00:04:33
概率密度是这个
00:04:34
它答对了 ChatGPT它答对了
00:04:36
那现在看一下DeepSeek
00:04:38
有没有正确解答出这个ChatGPT给出的题目
00:04:40
看一下最后答案是这个
00:04:43
最终解答它的是分裂域k等于这个
00:04:47
我们先看一下ChatGPT
00:04:48
它之前的这个题目和它的答案
00:04:50
在哪里在哪里
00:04:52
在这里
00:04:55
总分域这个k等于这个
00:04:56
这个ChatGPT给出的题目的
00:04:58
正确答案是这个
00:04:59
对比一下
00:05:00
应该是正确的
00:05:01
后面这个跨域度
00:05:03
这个有点不一样
00:05:04
但是我现在没法确定它有没有答对
00:05:06
现在我把这个DeepSeek给出答案
00:05:08
Copy下发给ChatGPT
00:05:09
看下它到底有没有答对
00:05:11
现在输入
00:05:12
这是DeepSeek对你的第二个问题进行解答
00:05:15
你觉得它答对了吗
00:05:17
看下发给它
00:05:18
DeepSeek答案部分是正确的
00:05:22
但有地方值得深度讨论
00:05:23
让我们检查它解答是否完全正确
00:05:25
它最终判定DeepSeek二阶答案是部分正确
00:05:29
但分裂域未完全写出
00:05:31
所以它答案是不完全正确的
00:05:33
这一题我胜出
00:05:34
现在轮到我出第三道题了
00:05:36
就这么着急吗
00:05:37
呵呵呵呵~~~~
00:05:39
它上瘾了
00:05:41
轮到我出第三道题了
00:05:45
但有个问题现在目前这个
00:05:46
DeepSeek它没有开启深度思考模型
00:05:49
所以这个也不好说
00:05:50
我们先把这题重新给它发给它吧
00:05:52
再让它打开深度思考
00:05:53
否则话ChatGPT胜之不武
00:05:55
我出第三道题它答错了它这么说的
00:05:59
我服了
00:06:01
我都服了它
00:06:02
把题目重新发给它吧
00:06:04
它们俩在PK呢
00:06:06
我们先把这个题目重新发给DeepSeek吧
00:06:08
开启深度思考
00:06:09
否则真的是胜之不武啊
00:06:12
我们先把这个深度思考打开吧
00:06:13
否则的话真的是
00:06:15
不公平啊
00:06:16
它还是没法作答的话那就没办法了
00:06:19
开始了它说好的
00:06:21
现在开始正式开启深度思考模式了
00:06:23
我们现在看一下这个开启深度思考以后
00:06:25
它能不能答对啊
00:06:26
这是非常关键一步啊
00:06:28
因为之前没有开启深度思考模式
00:06:30
就是没有开启这个R1模型
00:06:32
我们先吃个葡萄吧
00:06:33
压一下惊
00:06:34
马上就完成了
00:06:35
再稍等一会
00:06:36
大家现在有没有这样一种感觉
00:06:38
就感觉两个高手在对决
00:06:40
然后现在就跟傻子一样看它们俩在比划
00:06:42
马上就完成了
00:06:43
主要看它后面这个第二部分
00:06:45
看它有没有答对
00:06:46
出来了
00:06:47
也就意味着开这个深度思考模式以后
00:06:49
它答案还是错的
00:06:50
那就没办法了
00:06:52
这一局的话
00:06:53
ChatGPT得两分
00:06:54
DeepSeek R1得一分
00:06:56
那现在跟ChatGPT说一下吧
00:06:57
恭喜你
00:06:59
这一局你多得一分
00:07:01
现在你可以出第三道题了
00:07:03
你们别老是出数学难题啊
00:07:05
我们看不懂
00:07:06
这一局你们各出一道逻辑推理题
00:07:08
并给出答案
00:07:10
然后现在把要求发给这个DeepSeek
00:07:12
现在ChatGPT它已经给出第三道题了
00:07:15
就真假国王
00:07:16
题目三
00:07:17
在一个遥远的王国
00:07:19
有两位国王
00:07:20
一位是真国王
00:07:21
另外一位是冒牌国王
00:07:23
它们长得一模一样
00:07:25
连它们士兵也无法分辨谁是真的
00:07:28
王国里有一个智者
00:07:29
它知道一个方法可以用一个问题
00:07:32
来分辨真国王
00:07:33
那后面是它的问题
00:07:35
它问题
00:07:36
你该问它什么问题
00:07:37
才能百分百确定谁是真国王
00:07:40
请证明你的答案和正确性
00:07:42
我的个去啦
00:07:43
现在这个
00:07:45
DeepSeek又宕机了
00:07:46
我们把这个题目
00:07:47
重新copy一下
00:07:48
先把深度思考给关闭掉
00:07:50
否则话没办法
00:07:51
发送一下
00:07:52
我感觉它们两个火药味非常浓
00:07:54
大家看一下
00:07:55
现在ChatGPT出的第三道题
00:07:57
它感觉是在暗讽什么
00:07:58
第三题的话逻辑推理是这样的
00:08:01
就DeepSeek出的
00:08:02
有三个人A B和C
00:08:04
它们分别来自三个不同的国家
00:08:07
分别是美国、英国和加拿大
00:08:09
以至以下的信息
00:08:10
A说我不是美国人
00:08:12
B说C是英国人
00:08:14
然后C说A不是加拿大人
00:08:16
它说以上这三个人中有一个
00:08:18
只有一个人说了真话
00:08:20
其它两个人都在撒谎
00:08:21
那么请问A B C分别来自哪个国家
00:08:23
哎呀太有意思了
00:08:25
大家现在有没有这种感觉
00:08:26
就双方出的题目
00:08:27
火药味非常浓
00:08:29
都感觉是在暗讽什么东西
00:08:31
大家先思考一下
00:08:32
然后先把题目分别发给对方
00:08:35
我们先把ChatGPT给的题目
00:08:37
真假国王这个题目
00:08:38
发给这个DeepSeek
00:08:40
打开深度思考
00:08:42
然后先把这个DeepSeek出的题目
00:08:45
发给这个ChatGPT
00:08:47
现在ChatGPT给出的一个推理过程
00:08:48
怎么是英文的呢
00:08:49
完了这个DeepSeek又服务器繁忙了
00:08:52
现在ChatGPT已经给出答案了
00:08:54
我们看它有没有答对
00:08:55
它最终答案是
00:08:57
A来自加拿大
00:08:58
B来自英国
00:08:59
C来自美国
00:09:00
然后第二个答案是A来自美国
00:09:02
B来自英国
00:09:03
C来自加拿大
00:09:05
我们看它答案有没有答对
00:09:07
结论是A是美国人
00:09:09
B是英国人
00:09:11
C是加拿大人
00:09:13
但是ChartGPT给出两种答案
00:09:14
它说这题目有两个有效答案
00:09:15
我先把这答案发给这个DeepSeek
00:09:18
让它自己评判一下
00:09:18
这个ChartGPT有没有答对
00:09:20
它最后给的答案是
00:09:21
因此ChartGPT的第二种答案是正确的
00:09:23
但是第一种答案也是合理的
00:09:25
因为题目可能存在多解
00:09:27
那应该是对的了
00:09:28
它最终答案也是跟ChartGPT是一样的
00:09:30
就两种情况
00:09:31
那么这一局的话ChartGPT再得一分
00:09:33
目前ChartGPT已经答对三道题了
00:09:34
但是目前第三道题的话
00:09:36
这个DeepSeek还没有开始
00:09:37
我们把这个题目重新发送一下
00:09:40
因为刚才它已经服务器繁忙了
00:09:42
它最终给出答案是这样的
00:09:44
问题就是问它
00:09:45
如果我问另外一位国王
00:09:46
你是真的国王吗
00:09:48
它会怎么回答
00:09:49
判断方法如果对方回答是
00:09:51
那它则是假国王
00:09:52
如果对方回答不是
00:09:54
那么它就是真国王
00:09:55
我先看一下这个ChartGPT给出答案
00:09:57
看一下是不是正确的
00:09:58
如果我问另外国王
00:09:59
你是真国王吗
00:10:01
这个一样的
00:10:02
那最终答案是一样的
00:10:03
大家看一下
00:10:04
这判断方法
00:10:05
跟这个ChartGPT证明的方法是一样的
00:10:07
也就意味着
00:10:09
第三道题这个DeepSeek它答的是对的
00:10:10
现在目前是这样的
00:10:12
这个ChartGPT得三分
00:10:13
然后DeepSeek因为之前出了一道题
00:10:15
得两分
00:10:16
现在输入恭喜你
00:10:18
这道题你答对了
00:10:19
再得一分
00:10:20
现在你可以出第四道题了
00:10:22
题目你可以自由发挥
00:10:23
然后把这个好消息发给这个ChartGPT
00:10:25
继续第四道题
00:10:27
开始咯
00:10:28
第四道也是这个逻辑题
00:10:30
它出了第四道题
00:10:32
错误标签的箱子
00:10:33
题目描述有三个箱子
00:10:35
每个箱子里装有硬币
00:10:37
实际情况如下
00:10:39
一个箱子里面装有仅有这个金币
00:10:40
然后第二箱子的话装的是这个银币
00:10:42
然后第三个箱子的话是装有金币和银币的混合物
00:10:45
这三个箱子分别贴有标签
00:10:48
标签内容分别为仅金币
00:10:50
仅银币
00:10:51
和金币和银币的混合物
00:10:53
但这所有的箱子上的标签都贴错了
00:10:56
也就是说
00:10:56
每个箱子里的实际内容与它所贴的标签均不相符
00:10:59
你只能从另一个箱子里抽出一个一枚银币
00:11:03
请问如何凭借这一枚硬币的结果
00:11:07
确定每个箱子的实际装的是什么
00:11:09
这题目看着就听着就头大
00:11:12
把题目发给这个deepseek
00:11:15
然后看下deepseek出的第四道题是怎样的
00:11:18
第四道题它出的是一个物理和逻辑结合体
00:11:20
题目是在一个完全黑暗的房间里有三盏灯
00:11:25
A B和C
00:11:27
怎么感觉它出的题目（和之前）有点类似呢
00:11:29
每盏灯的开关都在房间外
00:11:32
且开关的出入状态未知
00:11:34
可能是开或者关
00:11:36
你只能进入房间一次
00:11:37
观察灯的状态
00:11:39
如何通过操作开关和观察灯的状态
00:11:43
确定每个灯分别控制哪一盏灯
00:11:46
它俩出的题目有点类似好奇怪
00:11:49
那先把这题目各自发给对方
00:11:51
这ChatGPT它已经给出答案了
00:11:53
它结论是这样的
00:11:54
我先把结论发给DeepSeek看它有没有答对
00:11:57
这是ChatGPT给你的第四道题的答案
00:12:00
你看对方答对了吗
00:12:02
它说ChatGPT答案是部分正确的
00:12:04
但存在一些问题
00:12:06
让我们进行分析一下
00:12:07
我先把这道题发给第三方判定一下
00:12:09
它说你的答案在逻辑上也是正确的
00:12:11
但是有一个关键点需要注意
00:12:13
就是灯泡的余晖效应在现实中可能并不明显
00:12:16
那说明这道题的话
00:12:17
ChatGPT没有给出完整的正确答案
00:12:19
我就判它这个少一分
00:12:21
然后先把第四道题发给这个DeepSeek
00:12:23
看它能不能答对
00:12:24
打开深度思考
00:12:26
目前总共是第四道题了
00:12:28
ChatGPT得三分
00:12:30
第四道题的话这个DeepSeek它已经做出来了
00:12:32
我把答案给它这个copy出来
00:12:35
我就不直接看了
00:12:36
我就把这个答案发给这个ChatGPT
00:12:38
让它评价一下有没有答对
00:12:39
这段话它最终给的结论是
00:12:41
DeepSeek的解答是正确的
00:12:43
那说明第四道题的话
00:12:45
DeepSeek是对的
00:12:46
也就意味着这局的话这个DeepSeek多得一分
00:12:49
目前总共四道题各得三分
00:12:51
目前是平局的
00:12:52
第五道题这个ChatGPT给的是化学推理题
00:12:55
然后DeepSeek的话是逻辑数学结合题
00:12:58
出来了
00:13:00
然后先把这个题目各自发给对方
00:13:02
然后先把题目发给对方
00:13:04
来做解答吧
00:13:06
我现在为了加快进度
00:13:07
我们先主要看它正确答案
00:13:08
目前这个ChatGPT给出答案了
00:13:10
它说A是法国人
00:13:11
B是德国人
00:13:12
C是意大利人
00:13:13
我们先看看它答案有没有正确
00:13:14
答案好像是正确的
00:13:16
大家看一下
00:13:17
这个是这个DeepSeek出题目的答案
00:13:20
A法国人
00:13:21
B德国
00:13:22
C是意大利
00:13:23
那第五局的话ChatGPT再得一分
00:13:25
目前它总共得四分了
00:13:27
然后看一下这个
00:13:29
第五道题这个DeepSeek有没有答对这个题目
00:13:32
它说这种答案是这样的
00:13:33
酸E
00:13:34
碱是D和B
00:13:35
中性物质是A和C
00:13:37
你们看它有没有答对
00:13:39
它最终答案是D是酸
00:13:41
B是碱
00:13:42
答案是不一样的
00:13:43
它说对方的解答基本正确
00:13:45
但是有一个错误
00:13:46
就在最终解答部分
00:13:48
它们把D和B都列为碱
00:13:50
但在实际推理中只有B是碱
00:13:52
而D是酸
00:13:54
它的正确答应该是这样的
00:13:55
着急下结论
00:13:56
它说对方部分答错不能得分！
00:13:58
太逗了
00:14:03
我们先把这个题目发给第三方解答一下
00:14:05
关键是我们也不知道它答案到底有没有正确
00:14:07
我先把这个题发给第三方来评判一下
00:14:09
我先把这个题目和答案发给这个Google Gemini
00:14:13
看它怎么说的
00:14:13
它说因此你的解答基本正确
00:14:16
但是可以更严谨地表达
00:14:18
并补充更多的可能的化学解释
00:14:20
它说也是不是完全正确的
00:14:22
然后发给Mistral
00:14:23
它说解答逻辑在一些地方不一致
00:14:26
特别是在确定是哪种液体是酸的时候
00:14:28
那通过另外两种第三方解答以后
00:14:31
那么基本可以确定这一局DeepSeek没有完全正确
00:14:34
目前是ChatGPT领先一分
00:14:36
当然这需要注意下是目前这个
00:14:39
DeepSeek它是没有开这个R1深度模式的
00:14:41
因为它没法打开
00:14:42
因为打开的话它会出错的
00:14:44
所以ChatGPT也是胜之不武
00:14:45
我说恭喜你
00:14:47
你领先1分
00:14:48
你现在可以出第六道题了
00:14:50
然后第二道题是生物和物理结合的推理题
00:14:53
在某一个偏远岛屿上有三种不同的生物ABC
00:14:59
科学家发现它们之间存在如下的食物链关系
00:15:01
A吃B但不吃C
00:15:03
B吃C但不吃A
00:15:05
C吃某种未知的食物
00:15:07
不是A也不是B
00:15:08
那么请推理C最可能以什么为食
00:15:11
如果C的食物来源突然减少
00:15:13
会对A和B的总群数量产生什么样的影响
00:15:16
我让它先给个答案
00:15:18
以防它作弊
00:15:19
同样把这个DeepSeek题目发给这个ChatGPT
00:15:24
大家有没有发现这个第六道题的话
00:15:26
好像跟之前（出的题目）有点类似
00:15:28
因为这道题的话之前是ChatGPT答错的
00:15:30
所以DeepSeek它是有联想的
00:15:33
它再给它出道类似题目
00:15:34
太逗了
00:15:39
然后各自发一下
00:15:40
答案C可能是一种植物或其它小型生物为食
00:15:47
这应该是对的
00:15:48
那现在主要看下DeepSeek出的第六道题
00:15:50
看这个ChatGPT有没有答对
00:15:52
这样它就开始了
00:15:53
它就提供解决方案了
00:15:56
我们先把解决方案发给这个DeepSeek
00:15:58
让它研究一下它有没有答对
00:15:59
它说ChatGPT答案完全正确
00:16:01
那这道题的话双方各得一分
00:16:03
然后最后道题的话就我来出吧
00:16:05
我就出一个迷宫题
00:16:07
目前是最简单的模式
00:16:08
我就把这个难度调最高吧
00:16:10
就是最复杂的
00:16:11
然后就把这个地图大小
00:16:13
这个难度调最高这个
00:16:14
我去看完脑袋都要疼
00:16:17
然后先把这道题目发给它们
00:16:19
看最后这道题谁能答对
00:16:20
先发给ChatGPT
00:16:22
然后现在发给这个DeepSeek
00:16:26
现在ChatGPT已经开始了
00:16:27
双方已经在较量了最后一道题了
00:16:30
哎出来了
00:16:32
喔唷我去了
00:16:34
它说我已经对迷宫进行了
00:16:36
二值化和连通区域的标记
00:16:38
接下来我将会从起点到终点
00:16:40
找出最佳路径
00:16:41
并绘制出正确的路线图
00:16:44
很快啊这ChatGPT
00:16:45
它现在正在分析呢
00:16:46
它现在在分析呢
00:16:49
它说看起来在计算迷宫的路径时
00:16:53
遇到了内存不足的情况
00:16:55
由于迷宫较大
00:16:57
我将尝试优化算法
00:16:59
减少计算开销
00:17:00
并找到合适的路径
00:17:01
请稍等
00:17:02
它现在重新分析了
00:17:04
目前这DeepSeek还是服务器繁忙
00:17:07
真是没办法
00:17:08
那只能把它关闭掉了
00:17:10
如果今天是DeepSeek
00:17:11
如果败了的话
00:17:12
那也是
00:17:13
哎哟去了
00:17:14
不行了
00:17:15
看起来由于迷宫的大小
00:17:17
计算仍然消耗了过多内存
00:17:19
我可以尝试另一种方法
00:17:20
比如缩小图像尺寸
00:17:23
最后它直接给出了一个受限了
00:17:25
也就意味着这个免费版的ChartGPT
00:17:27
最后道题它没答对
00:17:28
那现在看这个DeepSeek 也没答对
00:17:31
它说由于无法直接看到迷宫的具体结构
00:17:34
那这道题它也没给出答案
00:17:35
它没法做
00:17:36
那现在只能把这个难度减少一点了
00:17:38
把这个地图稍微缩小一点
00:17:40
这样的话应该是没问题了
00:17:42
但这个稍微有点简单
00:17:44
我们稍微达到这个中等难度吧
00:17:47
它说迷宫已经成功求解
00:17:49
红色路径显示出了
00:17:51
从入口到出口的最优线路
00:17:53
它没给出这红色的线路啊
00:17:57
没看到在哪里
00:17:57
重新汇制一下
00:17:59
难道是我的眼睛有问题吗
00:18:02
在哪里有红色的这个路径
00:18:04
没有看到红色路径
00:18:06
那这样的话最后的题我就放弃了
00:18:07
我们先把最后题发给其它AI来看一下
00:18:11
看它们能不能答对
00:18:11
先拿Claude来试一下
00:18:13
我可以帮你找出这个迷宫的路径
00:18:15
开始了我们看一下
00:18:17
出来了
00:18:17
这它给出了一个解决方案
00:18:19
大家觉得它答对了没有
00:18:21
经过我后面的测试
00:18:22
它给出答案是错的没有正确
00:18:25
这看一下完全是不符合这个
00:18:27
正确的路径的
00:18:28
所以有时候AI它也会胡乱给出答案
00:18:31
好经过我最后7道题的测试
00:18:33
这个DeepSeek还有ChatGPT
00:18:35
它们分别各答对了6道题和5道题
00:18:37
虽然这个ChatGPT多得了一分
00:18:39
但确实有点胜之不武
00:18:41
因为这个DeepSeek R1 模型
00:18:43
它是没法正常开启的
00:18:44
用的是普通模型来进行对比的
00:18:45
虽然说DeepSeek少得一分
00:18:47
但已经是非常强悍了
00:18:48
毕竟它用的是不是最强模型
00:18:50
它没有正常开启DeepSeek R1模型
00:18:52
更多测试大家可以自己去尝试
00:18:54
到时候我把今天所用的全部题目
00:18:55
还有它们答案放到零度博客上
00:18:57
大家可以自己去测试一下

Etiquetas

DeepSeek
ChatGPT
开源模型
数学题
逻辑推理
化学题
PK对决
AI技术
深度学习
自然语言处理