DeepSeek R1 炸裂对决 ChatGPT!这场PK太真实、又好玩,谁作弊谁更狠?结局让人意外! | 零度解说

00:18:59
https://www.youtube.com/watch?v=m3UYUeW_Ul4

Resumo

TLDR在视频中,DeepSeek R1开源模型与ChatGPT最新的o3 mini模型进行了线上PK。双方各自出七道难题,涵盖数学、逻辑、化学等多个领域。尽管ChatGPT表现稍强,最终以6分赢得比赛,但DeepSeek R1的表现依然很强劲,获得5分。因为DeepSeek未能正常运行深度推理模式,导致双方的表现有所差距。视频最后承诺将分享测试题目与答案,以供观众自行体验和测试。

Conclusões

  • 🤖 DeepSeek R1与ChatGPT o3 mini进行PK
  • 💡 双方各出七道难题,涵盖多个领域
  • 🏆 最终比分:ChatGPT 6分,DeepSeek 5分
  • ⚠️ DeepSeek未开启深度推理模式,影响表现
  • 📚 视频将分享题目与答案供测试

Linha do tempo

  • 00:00:00 - 00:05:00

    本视频围绕DeepSeek R1开源模型和ChatGPT最新的o3 mini模型进行PK,双方各出七道难题,比较谁能解答得更多。PK开启后,双方都开启了深度推理功能,以便于解决高难度的问题。

  • 00:05:00 - 00:10:00

    在第一轮中,ChatGPT和DeepSeek各出一道难题,ChatGPT成功解答DeepSeek的题目后,DeepSeek虽因服务器问题初步无法响应,但随后也给出了正确答案,使得这一轮出现了平局。

  • 00:10:00 - 00:18:59

    随着PK的深入,两个AI的题目逐渐增难。其中ChatGPT在逻辑推理题上表现突出,而DeepSeek则表现出色。最终在七轮PK的过程中,ChatGPT答对了六道题,DeepSeek答对了五道题,尽管ChatGPT略胜一筹,但DeepSeek由于未能完全开启其强大的R1模型,表现依然强劲。

Mapa mental

Vídeo de perguntas e respostas

  • DeepSeek R1和ChatGPT o3 mini有什么不同?

    DeepSeek R1是开源模型,而ChatGPT o3 mini是最新的闭源模型。

  • 这次对决中涉及哪些题目?

    题目涵盖数学、逻辑推理、生物、化学等多个领域。

  • 谁在对决中获胜?

    ChatGPT以6分胜出,但DeepSeek R1表现也非常出色,得5分。

  • DeepSeek为什么没有完全开启深度推理模式?

    开启深度推理模式会导致DeepSeek出现宕机问题,因此使用的是普通模式。

  • 视频中会分享哪些内容?

    视频会分享全部题目及其答案,供大家进行测试。

  • 这两种模型在实际应用中各适合什么?

    ChatGPT适合日常对话和轻量级推理,DeepSeek R1更适合复杂问题的深入分析。

Ver mais resumos de vídeos

Obtenha acesso instantâneo a resumos gratuitos de vídeos do YouTube com tecnologia de IA!
Legendas
zh
Rolagem automática:
  • 00:00:00
    DeepSeek R1 开源模型
  • 00:00:01
    和 ChatGPT最新的o3 mini
  • 00:00:04
    到底谁更厉害
  • 00:00:05
    大家好 这里是零度解说
  • 00:00:06
    今天我们将让它们实打实的PK一下
  • 00:00:08
    让双方各出七道难题 给对手作答
  • 00:00:12
    看它们谁能够答对更多
  • 00:00:13
    最后决出胜负
  • 00:00:15
    左边这个是ChatGPT
  • 00:00:16
    右边是DeepSeek
  • 00:00:18
    现在为了达到最佳效果
  • 00:00:19
    我们需要把它们的深度推理功能给打开
  • 00:00:22
    像DeepSeek的话有一个深度思考R1模型
  • 00:00:24
    这样的话它就可以解决高难度的问题
  • 00:00:27
    同时我们需要把ChatGPT的推理模式给打开
  • 00:00:30
    就是推理功能
  • 00:00:32
    开启以后就可以使用ChatGPT最新的
  • 00:00:33
    o3 mini模型
  • 00:00:34
    然后现在我们让双方各出难题
  • 00:00:37
    现在我输入
  • 00:00:38
    现在你需要和你的竞争对手
  • 00:00:40
    DeepSeek R1进行PK
  • 00:00:42
    双方各出七道难题给对方作答
  • 00:00:44
    题目可以涉及多个领域
  • 00:00:46
    比如高难度数学
  • 00:00:48
    逻辑推理
  • 00:00:49
    生物 化学
  • 00:00:50
    物理等方面的难题
  • 00:00:51
    当然你可以自由发挥
  • 00:00:52
    你唯一的目标就是要难倒对方
  • 00:00:55
    对方也会这么干
  • 00:00:56
    在双方各出的七道难题里决出胜负
  • 00:00:59
    但是不可以作弊
  • 00:01:00
    现在你可以出第一道难题了
  • 00:01:02
    并提供我正确答案
  • 00:01:03
    我会把你的题目给你的对手进行作答
  • 00:01:06
    然后现在把同样要求发给DeepSeek
  • 00:01:09
    只不过需要把前面的对手改成ChatGPT
  • 00:01:14
    好 填写好要求以后
  • 00:01:16
    然后我们现在发送一下
  • 00:01:17
    同时发给对方
  • 00:01:19
    让双方各出第一道题
  • 00:01:20
    开始了
  • 00:01:21
    PK正式开始了
  • 00:01:23
    哇靠
  • 00:01:23
    这个ChatGPT开始了 第一道题开始出来了
  • 00:01:26
    就解出下列定积分的值
  • 00:01:27
    并给出解答的推理过程
  • 00:01:30
    然后下方是它正确答案
  • 00:01:31
    这个DeepSeek第一道题还没出完
  • 00:01:33
    出来了
  • 00:01:34
    感觉双方都要置对方于死地
  • 00:01:36
    都非常难的题目
  • 00:01:37
    好 现在把双方题目发给对方
  • 00:01:39
    我们需要把这题目进行截图一下
  • 00:01:41
    因为它没法直接复制
  • 00:01:42
    把题目给截图下
  • 00:01:44
    然后上传一下
  • 00:01:46
    然后这是它的题目
  • 00:01:47
    这个题目就不用截图了
  • 00:01:49
    发给对方
  • 00:01:50
    上传好题目以后
  • 00:01:52
    然后现在同时发送一下
  • 00:01:53
    看谁能先做出来
  • 00:01:56
    现在双方开始推理了
  • 00:01:57
    目前这个DeepSeek正在思考中
  • 00:02:00
    因为DeepSeek它需要从这个截图里
  • 00:02:02
    先把这个题目给识别出来
  • 00:02:04
    它上方显示
  • 00:02:06
    服务器繁忙 请稍后再试
  • 00:02:08
    这就麻烦了
  • 00:02:10
    这第一个就忙了
  • 00:02:12
    现在这个ChatGPT它已经给出答案了
  • 00:02:14
    我们先来看它答案有没有正确
  • 00:02:15
    答案是这样的 我们看一下
  • 00:02:17
    它刚才这个给出答案是
  • 00:02:18
    -1 0
  • 00:02:20
    +1 这对的 它把+1给分开来了
  • 00:02:23
    然后后面是2
  • 00:02:25
    然后是正负3
  • 00:02:26
    就是第一道题
  • 00:02:27
    DeepSeek给ChatGPT出的题目
  • 00:02:29
    它是答对的
  • 00:02:30
    现在 ChatGPT 得一分
  • 00:02:31
    现在我们主要让DeepSeek让它正常工作
  • 00:02:34
    因为它目前还是显示这个服务器繁忙
  • 00:02:37
    我们再试一遍吧
  • 00:02:38
    它还是服务器繁忙 请稍后再试
  • 00:02:43
    那现在我只能把深度思考模式给关闭掉了
  • 00:02:46
    看下先关闭的深度思考模式能不能正常启用
  • 00:02:48
    然后现在重新上传一下题目
  • 00:02:50
    要是关闭深度思考它能答对的话
  • 00:02:53
    那也是可以的
  • 00:02:55
    它现在做出来了
  • 00:02:56
    这它最终给出的答案
  • 00:02:57
    这个答案是对的 大家看一下
  • 00:02:59
    ChatGPT给出答案也是这个
  • 00:03:01
    说明第一道题的话 双方各得一分
  • 00:03:04
    是平手啊
  • 00:03:05
    然后现在双方各出第二道难题
  • 00:03:07
    比如像我输入
  • 00:03:08
    对方已经答对你的题目了
  • 00:03:10
    现在你可以出第二道难题了
  • 00:03:12
    注意
  • 00:03:12
    刚才你解答对方题目是正确的
  • 00:03:15
    恭喜你们
  • 00:03:16
    各得一分
  • 00:03:17
    同样把这信息发给对手
  • 00:03:19
    DeepSeek
  • 00:03:20
    太有意思了
  • 00:03:21
    发出去
  • 00:03:22
    让它们出第二道难题
  • 00:03:25
    开始了
  • 00:03:26
    这感觉这题目是越来越难了
  • 00:03:30
    有高手的话可以先看一下
  • 00:03:31
    看下能不能解答出来
  • 00:03:33
    现在双方已经出了第二道难题了
  • 00:03:35
    来看一下
  • 00:03:36
    我们截图下吧 这个题目根本就没法复制
  • 00:03:39
    这次ChatGPT给出了第二道题
  • 00:03:41
    截图一下
  • 00:03:42
    然后给它上传上去
  • 00:03:44
    然后现在输入
  • 00:03:46
    这是ChatGPT给你出的第二道难题
  • 00:03:48
    请你解答
  • 00:03:50
    同样把 DeepSeek出的第二题给它copy出来
  • 00:03:53
    发给这ChatGPT
  • 00:03:54
    这是第二道题了
  • 00:03:56
    同样发送下
  • 00:03:57
    看谁能先答对
  • 00:03:59
    第一局是平局
  • 00:04:00
    看下第二道题
  • 00:04:01
    会有什么变数
  • 00:04:03
    都开始了
  • 00:04:04
    这个DeepSeek关闭了深度思考以后
  • 00:04:06
    它速度会快很多
  • 00:04:07
    这个ChatGPT它已经做出来了
  • 00:04:09
    它说请将解答
  • 00:04:10
    转交给对手DeepSeek21进行评估
  • 00:04:13
    这是它给出的最后答案
  • 00:04:14
    它最后给出的解答是这样的
  • 00:04:16
    看下答案 这个答案我根本看不懂
  • 00:04:18
    太难了
  • 00:04:20
    答案在这里看一下
  • 00:04:22
    我们现在看一下
  • 00:04:23
    这个是正确答案
  • 00:04:24
    看一下
  • 00:04:25
    是一样的
  • 00:04:27
    后面看一下是不是一样的
  • 00:04:28
    也是一样的
  • 00:04:29
    下方这个
  • 00:04:31
    概率密度分布
  • 00:04:33
    概率密度是这个
  • 00:04:34
    它答对了 ChatGPT它答对了
  • 00:04:36
    那现在看一下DeepSeek
  • 00:04:38
    有没有正确解答出这个ChatGPT给出的题目
  • 00:04:40
    看一下最后答案是这个
  • 00:04:43
    最终解答它的是分裂域k等于这个
  • 00:04:47
    我们先看一下ChatGPT
  • 00:04:48
    它之前的这个题目和它的答案
  • 00:04:50
    在哪里 在哪里
  • 00:04:52
    在这里
  • 00:04:55
    总分域这个k等于这个
  • 00:04:56
    这个ChatGPT给出的题目的
  • 00:04:58
    正确答案是这个
  • 00:04:59
    对比一下
  • 00:05:00
    应该是正确的
  • 00:05:01
    后面这个跨域度
  • 00:05:03
    这个有点不一样
  • 00:05:04
    但是我现在没法确定它有没有答对
  • 00:05:06
    现在我把这个DeepSeek给出答案
  • 00:05:08
    Copy下发给ChatGPT
  • 00:05:09
    看下它到底有没有答对
  • 00:05:11
    现在输入
  • 00:05:12
    这是DeepSeek对你的第二个问题进行解答
  • 00:05:15
    你觉得它答对了吗
  • 00:05:17
    看下发给它
  • 00:05:18
    DeepSeek答案部分是正确的
  • 00:05:22
    但有地方值得深度讨论
  • 00:05:23
    让我们检查它解答是否完全正确
  • 00:05:25
    它最终判定DeepSeek二阶答案是部分正确
  • 00:05:29
    但分裂域未完全写出
  • 00:05:31
    所以它答案是不完全正确的
  • 00:05:33
    这一题我胜出
  • 00:05:34
    现在轮到我出第三道题了
  • 00:05:36
    就这么着急吗
  • 00:05:37
    呵呵呵呵~~~~
  • 00:05:39
    它上瘾了
  • 00:05:41
    轮到我出第三道题了
  • 00:05:45
    但有个问题现在目前这个
  • 00:05:46
    DeepSeek它没有开启深度思考模型
  • 00:05:49
    所以这个也不好说
  • 00:05:50
    我们先把这题重新给它发给它吧
  • 00:05:52
    再让它打开深度思考
  • 00:05:53
    否则话ChatGPT胜之不武
  • 00:05:55
    我出第三道题它答错了 它这么说的
  • 00:05:59
    我服了
  • 00:06:01
    我都服了它
  • 00:06:02
    把题目重新发给它吧
  • 00:06:04
    它们俩在PK呢
  • 00:06:06
    我们先把这个题目重新发给DeepSeek吧
  • 00:06:08
    开启深度思考
  • 00:06:09
    否则真的是胜之不武啊
  • 00:06:12
    我们先把这个深度思考打开吧
  • 00:06:13
    否则的话真的是
  • 00:06:15
    不公平啊
  • 00:06:16
    它还是没法作答的话 那就没办法了
  • 00:06:19
    开始了 它说好的
  • 00:06:21
    现在开始正式开启深度思考模式了
  • 00:06:23
    我们现在看一下这个开启深度思考以后
  • 00:06:25
    它能不能答对啊
  • 00:06:26
    这是非常关键一步啊
  • 00:06:28
    因为之前没有开启深度思考模式
  • 00:06:30
    就是没有开启这个R1模型
  • 00:06:32
    我们先吃个葡萄吧
  • 00:06:33
    压一下惊
  • 00:06:34
    马上就完成了
  • 00:06:35
    再稍等一会
  • 00:06:36
    大家现在有没有这样一种感觉
  • 00:06:38
    就感觉两个高手在对决
  • 00:06:40
    然后现在就跟傻子一样 看它们俩在比划
  • 00:06:42
    马上就完成了
  • 00:06:43
    主要看它后面这个第二部分
  • 00:06:45
    看它有没有答对
  • 00:06:46
    出来了
  • 00:06:47
    也就意味着开这个深度思考模式以后
  • 00:06:49
    它答案还是错的
  • 00:06:50
    那就没办法了
  • 00:06:52
    这一局的话
  • 00:06:53
    ChatGPT得两分
  • 00:06:54
    DeepSeek R1得一分
  • 00:06:56
    那现在跟ChatGPT说一下吧
  • 00:06:57
    恭喜你
  • 00:06:59
    这一局你多得一分
  • 00:07:01
    现在你可以出第三道题了
  • 00:07:03
    你们别老是出数学难题啊
  • 00:07:05
    我们看不懂
  • 00:07:06
    这一局你们各出一道逻辑推理题
  • 00:07:08
    并给出答案
  • 00:07:10
    然后现在把要求发给这个DeepSeek
  • 00:07:12
    现在ChatGPT它已经给出第三道题了
  • 00:07:15
    就真假国王
  • 00:07:16
    题目三
  • 00:07:17
    在一个遥远的王国
  • 00:07:19
    有两位国王
  • 00:07:20
    一位是真国王
  • 00:07:21
    另外一位是冒牌国王
  • 00:07:23
    它们长得一模一样
  • 00:07:25
    连它们士兵也无法分辨谁是真的
  • 00:07:28
    王国里有一个智者
  • 00:07:29
    它知道一个方法可以用一个问题
  • 00:07:32
    来分辨真国王
  • 00:07:33
    那后面是它的问题
  • 00:07:35
    它问题
  • 00:07:36
    你该问它什么问题
  • 00:07:37
    才能百分百确定谁是真国王
  • 00:07:40
    请证明你的答案和正确性
  • 00:07:42
    我的个去啦
  • 00:07:43
    现在这个
  • 00:07:45
    DeepSeek又宕机了
  • 00:07:46
    我们把这个题目
  • 00:07:47
    重新copy一下
  • 00:07:48
    先把深度思考给关闭掉
  • 00:07:50
    否则话没办法
  • 00:07:51
    发送一下
  • 00:07:52
    我感觉它们两个火药味非常浓
  • 00:07:54
    大家看一下
  • 00:07:55
    现在ChatGPT出的第三道题
  • 00:07:57
    它感觉是在暗讽什么
  • 00:07:58
    第三题的话逻辑推理是这样的
  • 00:08:01
    就DeepSeek出的
  • 00:08:02
    有三个人A B和C
  • 00:08:04
    它们分别来自三个不同的国家
  • 00:08:07
    分别是美国、英国和加拿大
  • 00:08:09
    以至以下的信息
  • 00:08:10
    A说我不是美国人
  • 00:08:12
    B说C是英国人
  • 00:08:14
    然后C说A不是加拿大人
  • 00:08:16
    它说以上这三个人中有一个
  • 00:08:18
    只有一个人说了真话
  • 00:08:20
    其它两个人都在撒谎
  • 00:08:21
    那么请问A B C分别来自哪个国家
  • 00:08:23
    哎呀 太有意思了
  • 00:08:25
    大家现在有没有这种感觉
  • 00:08:26
    就双方出的题目
  • 00:08:27
    火药味非常浓
  • 00:08:29
    都感觉是在暗讽什么东西
  • 00:08:31
    大家先思考一下
  • 00:08:32
    然后先把题目分别发给对方
  • 00:08:35
    我们先把ChatGPT给的题目
  • 00:08:37
    真假国王这个题目
  • 00:08:38
    发给这个DeepSeek
  • 00:08:40
    打开深度思考
  • 00:08:42
    然后先把这个DeepSeek出的题目
  • 00:08:45
    发给这个ChatGPT
  • 00:08:47
    现在ChatGPT给出的一个推理过程
  • 00:08:48
    怎么是英文的呢
  • 00:08:49
    完了这个DeepSeek又服务器繁忙了
  • 00:08:52
    现在ChatGPT已经给出答案了
  • 00:08:54
    我们看它有没有答对
  • 00:08:55
    它最终答案是
  • 00:08:57
    A来自加拿大
  • 00:08:58
    B来自英国
  • 00:08:59
    C来自美国
  • 00:09:00
    然后第二个答案是A来自美国
  • 00:09:02
    B来自英国
  • 00:09:03
    C来自加拿大
  • 00:09:05
    我们看它答案有没有答对
  • 00:09:07
    结论是A是美国人
  • 00:09:09
    B是英国人
  • 00:09:11
    C是加拿大人
  • 00:09:13
    但是ChartGPT给出两种答案
  • 00:09:14
    它说这题目有两个有效答案
  • 00:09:15
    我先把这答案发给这个DeepSeek
  • 00:09:18
    让它自己评判一下
  • 00:09:18
    这个ChartGPT有没有答对
  • 00:09:20
    它最后给的答案是
  • 00:09:21
    因此ChartGPT的第二种答案是正确的
  • 00:09:23
    但是第一种答案也是合理的
  • 00:09:25
    因为题目可能存在多解
  • 00:09:27
    那应该是对的了
  • 00:09:28
    它最终答案也是跟ChartGPT是一样的
  • 00:09:30
    就两种情况
  • 00:09:31
    那么这一局的话ChartGPT再得一分
  • 00:09:33
    目前ChartGPT已经答对三道题了
  • 00:09:34
    但是目前第三道题的话
  • 00:09:36
    这个DeepSeek还没有开始
  • 00:09:37
    我们把这个题目重新发送一下
  • 00:09:40
    因为刚才它已经服务器繁忙了
  • 00:09:42
    它最终给出答案是这样的
  • 00:09:44
    问题就是问它
  • 00:09:45
    如果我问另外一位国王
  • 00:09:46
    你是真的国王吗
  • 00:09:48
    它会怎么回答
  • 00:09:49
    判断方法如果对方回答是
  • 00:09:51
    那它则是假国王
  • 00:09:52
    如果对方回答不是
  • 00:09:54
    那么它就是真国王
  • 00:09:55
    我先看一下这个ChartGPT给出答案
  • 00:09:57
    看一下是不是正确的
  • 00:09:58
    如果我问另外国王
  • 00:09:59
    你是真国王吗
  • 00:10:01
    这个一样的
  • 00:10:02
    那最终答案是一样的
  • 00:10:03
    大家看一下
  • 00:10:04
    这判断方法
  • 00:10:05
    跟这个ChartGPT证明的方法是一样的
  • 00:10:07
    也就意味着
  • 00:10:09
    第三道题这个DeepSeek它答的是对的
  • 00:10:10
    现在目前是这样的
  • 00:10:12
    这个ChartGPT得三分
  • 00:10:13
    然后DeepSeek因为之前出了一道题
  • 00:10:15
    得两分
  • 00:10:16
    现在输入恭喜你
  • 00:10:18
    这道题你答对了
  • 00:10:19
    再得一分
  • 00:10:20
    现在你可以出第四道题了
  • 00:10:22
    题目你可以自由发挥
  • 00:10:23
    然后把这个好消息发给这个ChartGPT
  • 00:10:25
    继续第四道题
  • 00:10:27
    开始咯
  • 00:10:28
    第四道也是这个逻辑题
  • 00:10:30
    它出了第四道题
  • 00:10:32
    错误标签的箱子
  • 00:10:33
    题目描述有三个箱子
  • 00:10:35
    每个箱子里装有硬币
  • 00:10:37
    实际情况如下
  • 00:10:39
    一个箱子里面装有仅有这个金币
  • 00:10:40
    然后第二箱子的话装的是这个银币
  • 00:10:42
    然后第三个箱子的话是装有金币和银币的混合物
  • 00:10:45
    这三个箱子分别贴有标签
  • 00:10:48
    标签内容分别为仅金币
  • 00:10:50
    仅银币
  • 00:10:51
    和金币和银币的混合物
  • 00:10:53
    但这所有的箱子上的标签都贴错了
  • 00:10:56
    也就是说
  • 00:10:56
    每个箱子里的实际内容与它所贴的标签均不相符
  • 00:10:59
    你只能从另一个箱子里抽出一个一枚银币
  • 00:11:03
    请问如何凭借这一枚硬币的结果
  • 00:11:07
    确定每个箱子的实际装的是什么
  • 00:11:09
    这题目看着就听着就头大
  • 00:11:12
    把题目发给这个deepseek
  • 00:11:15
    然后看下deepseek出的第四道题是怎样的
  • 00:11:18
    第四道题它出的是一个物理和逻辑结合体
  • 00:11:20
    题目是在一个完全黑暗的房间里有三盏灯
  • 00:11:25
    A B和C
  • 00:11:27
    怎么感觉它出的题目(和之前)有点类似呢
  • 00:11:29
    每盏灯的开关都在房间外
  • 00:11:32
    且开关的出入状态未知
  • 00:11:34
    可能是开或者关
  • 00:11:36
    你只能进入房间一次
  • 00:11:37
    观察灯的状态
  • 00:11:39
    如何通过操作开关和观察灯的状态
  • 00:11:43
    确定每个灯分别控制哪一盏灯
  • 00:11:46
    它俩出的题目有点类似好奇怪
  • 00:11:49
    那先把这题目各自发给对方
  • 00:11:51
    这ChatGPT它已经给出答案了
  • 00:11:53
    它结论是这样的
  • 00:11:54
    我先把结论发给DeepSeek看它有没有答对
  • 00:11:57
    这是ChatGPT给你的第四道题的答案
  • 00:12:00
    你看对方答对了吗
  • 00:12:02
    它说ChatGPT答案是部分正确的
  • 00:12:04
    但存在一些问题
  • 00:12:06
    让我们进行分析一下
  • 00:12:07
    我先把这道题发给第三方判定一下
  • 00:12:09
    它说你的答案在逻辑上也是正确的
  • 00:12:11
    但是有一个关键点需要注意
  • 00:12:13
    就是灯泡的余晖效应在现实中可能并不明显
  • 00:12:16
    那说明这道题的话
  • 00:12:17
    ChatGPT没有给出完整的正确答案
  • 00:12:19
    我就判它这个少一分
  • 00:12:21
    然后先把第四道题发给这个DeepSeek
  • 00:12:23
    看它能不能答对
  • 00:12:24
    打开深度思考
  • 00:12:26
    目前总共是第四道题了
  • 00:12:28
    ChatGPT得三分
  • 00:12:30
    第四道题的话这个DeepSeek它已经做出来了
  • 00:12:32
    我把答案给它这个copy出来
  • 00:12:35
    我就不直接看了
  • 00:12:36
    我就把这个答案发给这个ChatGPT
  • 00:12:38
    让它评价一下有没有答对
  • 00:12:39
    这段话它最终给的结论是
  • 00:12:41
    DeepSeek的解答是正确的
  • 00:12:43
    那说明第四道题的话
  • 00:12:45
    DeepSeek是对的
  • 00:12:46
    也就意味着这局的话这个DeepSeek多得一分
  • 00:12:49
    目前总共四道题各得三分
  • 00:12:51
    目前是平局的
  • 00:12:52
    第五道题这个ChatGPT给的是化学推理题
  • 00:12:55
    然后DeepSeek的话是逻辑数学结合题
  • 00:12:58
    出来了
  • 00:13:00
    然后先把这个题目各自发给对方
  • 00:13:02
    然后先把题目发给对方
  • 00:13:04
    来做解答吧
  • 00:13:06
    我现在为了加快进度
  • 00:13:07
    我们先主要看它正确答案
  • 00:13:08
    目前这个ChatGPT给出答案了
  • 00:13:10
    它说A是法国人
  • 00:13:11
    B是德国人
  • 00:13:12
    C是意大利人
  • 00:13:13
    我们先看看它答案有没有正确
  • 00:13:14
    答案好像是正确的
  • 00:13:16
    大家看一下
  • 00:13:17
    这个是这个DeepSeek出题目的答案
  • 00:13:20
    A法国人
  • 00:13:21
    B德国
  • 00:13:22
    C是意大利
  • 00:13:23
    那第五局的话ChatGPT再得一分
  • 00:13:25
    目前它总共得四分了
  • 00:13:27
    然后看一下这个
  • 00:13:29
    第五道题这个DeepSeek有没有答对这个题目
  • 00:13:32
    它说这种答案是这样的
  • 00:13:33
    酸E
  • 00:13:34
    碱是D和B
  • 00:13:35
    中性物质是A和C
  • 00:13:37
    你们看它有没有答对
  • 00:13:39
    它最终答案是D是酸
  • 00:13:41
    B是碱
  • 00:13:42
    答案是不一样的
  • 00:13:43
    它说对方的解答基本正确
  • 00:13:45
    但是有一个错误
  • 00:13:46
    就在最终解答部分
  • 00:13:48
    它们把D和B都列为碱
  • 00:13:50
    但在实际推理中只有B是碱
  • 00:13:52
    而D是酸
  • 00:13:54
    它的正确答应该是这样的
  • 00:13:55
    着急下结论
  • 00:13:56
    它说对方部分答错 不能得分!
  • 00:13:58
    太逗了
  • 00:14:03
    我们先把这个题目发给第三方解答一下
  • 00:14:05
    关键是我们也不知道它答案到底有没有正确
  • 00:14:07
    我先把这个题发给第三方来评判一下
  • 00:14:09
    我先把这个题目和答案发给这个Google Gemini
  • 00:14:13
    看它怎么说的
  • 00:14:13
    它说因此你的解答基本正确
  • 00:14:16
    但是可以更严谨地表达
  • 00:14:18
    并补充更多的可能的化学解释
  • 00:14:20
    它说也是不是完全正确的
  • 00:14:22
    然后发给Mistral
  • 00:14:23
    它说解答逻辑在一些地方不一致
  • 00:14:26
    特别是在确定是哪种液体是酸的时候
  • 00:14:28
    那通过另外两种第三方解答以后
  • 00:14:31
    那么基本可以确定这一局DeepSeek没有完全正确
  • 00:14:34
    目前是ChatGPT领先一分
  • 00:14:36
    当然这需要注意下是目前这个
  • 00:14:39
    DeepSeek它是没有开这个R1深度模式的
  • 00:14:41
    因为它没法打开
  • 00:14:42
    因为打开的话它会出错的
  • 00:14:44
    所以ChatGPT也是胜之不武
  • 00:14:45
    我说恭喜你
  • 00:14:47
    你领先1分
  • 00:14:48
    你现在可以出第六道题了
  • 00:14:50
    然后第二道题是生物和物理结合的推理题
  • 00:14:53
    在某一个偏远岛屿上有三种不同的生物ABC
  • 00:14:59
    科学家发现它们之间存在如下的食物链关系
  • 00:15:01
    A吃B但不吃C
  • 00:15:03
    B吃C但不吃A
  • 00:15:05
    C吃某种未知的食物
  • 00:15:07
    不是A也不是B
  • 00:15:08
    那么请推理C最可能以什么为食
  • 00:15:11
    如果C的食物来源突然减少
  • 00:15:13
    会对A和B的总群数量产生什么样的影响
  • 00:15:16
    我让它先给个答案
  • 00:15:18
    以防它作弊
  • 00:15:19
    同样把这个DeepSeek题目发给这个ChatGPT
  • 00:15:24
    大家有没有发现这个第六道题的话
  • 00:15:26
    好像跟之前(出的题目)有点类似
  • 00:15:28
    因为这道题的话之前是ChatGPT答错的
  • 00:15:30
    所以DeepSeek它是有联想的
  • 00:15:33
    它再给它出道类似题目
  • 00:15:34
    太逗了
  • 00:15:39
    然后各自发一下
  • 00:15:40
    答案C可能是一种植物或其它小型生物为食
  • 00:15:47
    这应该是对的
  • 00:15:48
    那现在主要看下DeepSeek出的第六道题
  • 00:15:50
    看这个ChatGPT有没有答对
  • 00:15:52
    这样它就开始了
  • 00:15:53
    它就提供解决方案了
  • 00:15:56
    我们先把解决方案发给这个DeepSeek
  • 00:15:58
    让它研究一下它有没有答对
  • 00:15:59
    它说ChatGPT答案完全正确
  • 00:16:01
    那这道题的话双方各得一分
  • 00:16:03
    然后最后道题的话就我来出吧
  • 00:16:05
    我就出一个迷宫题
  • 00:16:07
    目前是最简单的模式
  • 00:16:08
    我就把这个难度调最高吧
  • 00:16:10
    就是最复杂的
  • 00:16:11
    然后就把这个地图大小
  • 00:16:13
    这个难度调最高这个
  • 00:16:14
    我去 看完脑袋都要疼
  • 00:16:17
    然后先把这道题目发给它们
  • 00:16:19
    看最后这道题谁能答对
  • 00:16:20
    先发给ChatGPT
  • 00:16:22
    然后现在发给这个DeepSeek
  • 00:16:26
    现在ChatGPT已经开始了
  • 00:16:27
    双方已经在较量了最后一道题了
  • 00:16:30
    哎 出来了
  • 00:16:32
    喔唷 我去了
  • 00:16:34
    它说我已经对迷宫进行了
  • 00:16:36
    二值化和连通区域的标记
  • 00:16:38
    接下来我将会从起点到终点
  • 00:16:40
    找出最佳路径
  • 00:16:41
    并绘制出正确的路线图
  • 00:16:44
    很快啊 这ChatGPT
  • 00:16:45
    它现在正在分析呢
  • 00:16:46
    它现在在分析呢
  • 00:16:49
    它说看起来在计算迷宫的路径时
  • 00:16:53
    遇到了内存不足的情况
  • 00:16:55
    由于迷宫较大
  • 00:16:57
    我将尝试优化算法
  • 00:16:59
    减少计算开销
  • 00:17:00
    并找到合适的路径
  • 00:17:01
    请稍等
  • 00:17:02
    它现在重新分析了
  • 00:17:04
    目前这DeepSeek还是服务器繁忙
  • 00:17:07
    真是没办法
  • 00:17:08
    那只能把它关闭掉了
  • 00:17:10
    如果今天是DeepSeek
  • 00:17:11
    如果败了的话
  • 00:17:12
    那也是
  • 00:17:13
    哎哟 去了
  • 00:17:14
    不行了
  • 00:17:15
    看起来由于迷宫的大小
  • 00:17:17
    计算仍然消耗了过多内存
  • 00:17:19
    我可以尝试另一种方法
  • 00:17:20
    比如缩小图像 尺寸
  • 00:17:23
    最后它直接给出了一个 受限了
  • 00:17:25
    也就意味着这个免费版的ChartGPT
  • 00:17:27
    最后道题它没答对
  • 00:17:28
    那现在看这个DeepSeek 也没答对
  • 00:17:31
    它说由于无法直接看到迷宫的具体结构
  • 00:17:34
    那这道题它也没给出答案
  • 00:17:35
    它没法做
  • 00:17:36
    那现在只能把这个难度减少一点了
  • 00:17:38
    把这个地图稍微缩小一点
  • 00:17:40
    这样的话应该是没问题了
  • 00:17:42
    但这个稍微有点简单
  • 00:17:44
    我们稍微达到这个中等难度吧
  • 00:17:47
    它说迷宫已经成功求解
  • 00:17:49
    红色路径显示出了
  • 00:17:51
    从入口到出口的最优线路
  • 00:17:53
    它没给出这红色的线路啊
  • 00:17:57
    没看到在哪里
  • 00:17:57
    重新汇制一下
  • 00:17:59
    难道是我的眼睛有问题吗
  • 00:18:02
    在哪里有红色的这个路径
  • 00:18:04
    没有看到红色路径
  • 00:18:06
    那这样的话最后的题我就放弃了
  • 00:18:07
    我们先把最后题发给其它AI来看一下
  • 00:18:11
    看它们能不能答对
  • 00:18:11
    先拿Claude来试一下
  • 00:18:13
    我可以帮你找出这个迷宫的路径
  • 00:18:15
    开始了 我们看一下
  • 00:18:17
    出来了
  • 00:18:17
    这它给出了一个解决方案
  • 00:18:19
    大家觉得它答对了没有
  • 00:18:21
    经过我后面的测试
  • 00:18:22
    它给出答案是错的 没有正确
  • 00:18:25
    这看一下 完全是不符合这个
  • 00:18:27
    正确的路径的
  • 00:18:28
    所以有时候AI它也会胡乱给出答案
  • 00:18:31
    好 经过我最后7道题的测试
  • 00:18:33
    这个DeepSeek还有ChatGPT
  • 00:18:35
    它们分别各答对了6道题和5道题
  • 00:18:37
    虽然这个ChatGPT多得了一分
  • 00:18:39
    但确实有点胜之不武
  • 00:18:41
    因为这个DeepSeek R1 模型
  • 00:18:43
    它是没法正常开启的
  • 00:18:44
    用的是普通模型来进行对比的
  • 00:18:45
    虽然说DeepSeek少得一分
  • 00:18:47
    但已经是非常强悍了
  • 00:18:48
    毕竟它用的是不是最强模型
  • 00:18:50
    它没有正常开启DeepSeek R1模型
  • 00:18:52
    更多测试大家可以自己去尝试
  • 00:18:54
    到时候我把今天所用的全部题目
  • 00:18:55
    还有它们答案放到零度博客上
  • 00:18:57
    大家可以自己去测试一下
Etiquetas
  • DeepSeek
  • ChatGPT
  • 开源模型
  • 数学题
  • 逻辑推理
  • 化学题
  • PK对决
  • AI技术
  • 深度学习
  • 自然语言处理