DeepSeek R1 炸裂对决 ChatGPT!这场PK太真实、又好玩,谁作弊谁更狠?结局让人意外! | 零度解说
Summary
TLDR在视频中,DeepSeek R1开源模型与ChatGPT最新的o3 mini模型进行了线上PK。双方各自出七道难题,涵盖数学、逻辑、化学等多个领域。尽管ChatGPT表现稍强,最终以6分赢得比赛,但DeepSeek R1的表现依然很强劲,获得5分。因为DeepSeek未能正常运行深度推理模式,导致双方的表现有所差距。视频最后承诺将分享测试题目与答案,以供观众自行体验和测试。
Takeaways
- 🤖 DeepSeek R1与ChatGPT o3 mini进行PK
- 💡 双方各出七道难题,涵盖多个领域
- 🏆 最终比分:ChatGPT 6分,DeepSeek 5分
- ⚠️ DeepSeek未开启深度推理模式,影响表现
- 📚 视频将分享题目与答案供测试
Timeline
- 00:00:00 - 00:05:00
本视频围绕DeepSeek R1开源模型和ChatGPT最新的o3 mini模型进行PK,双方各出七道难题,比较谁能解答得更多。PK开启后,双方都开启了深度推理功能,以便于解决高难度的问题。
- 00:05:00 - 00:10:00
在第一轮中,ChatGPT和DeepSeek各出一道难题,ChatGPT成功解答DeepSeek的题目后,DeepSeek虽因服务器问题初步无法响应,但随后也给出了正确答案,使得这一轮出现了平局。
- 00:10:00 - 00:18:59
随着PK的深入,两个AI的题目逐渐增难。其中ChatGPT在逻辑推理题上表现突出,而DeepSeek则表现出色。最终在七轮PK的过程中,ChatGPT答对了六道题,DeepSeek答对了五道题,尽管ChatGPT略胜一筹,但DeepSeek由于未能完全开启其强大的R1模型,表现依然强劲。
Mind Map
Video Q&A
DeepSeek R1和ChatGPT o3 mini有什么不同?
DeepSeek R1是开源模型,而ChatGPT o3 mini是最新的闭源模型。
这次对决中涉及哪些题目?
题目涵盖数学、逻辑推理、生物、化学等多个领域。
谁在对决中获胜?
ChatGPT以6分胜出,但DeepSeek R1表现也非常出色,得5分。
DeepSeek为什么没有完全开启深度推理模式?
开启深度推理模式会导致DeepSeek出现宕机问题,因此使用的是普通模式。
视频中会分享哪些内容?
视频会分享全部题目及其答案,供大家进行测试。
这两种模型在实际应用中各适合什么?
ChatGPT适合日常对话和轻量级推理,DeepSeek R1更适合复杂问题的深入分析。
View more video summaries
马来西亚大会 FAA40 雷宇鸣 皇冠大使
赌球的這場局,认真你就输了,为什么莊家一直都是大赢家?2022卡塔尔世界杯|Spark Liang 趨勢影片
3步,让2025成为英语进步最快速的一年!(快乐学习版)
非洲最有錢的10個國家!埃及竟然不進前10,南非只排第7,第一名讓人震驚,人均工資高達80萬,比歐洲更發達。|#世界之最top #世界之最 #出類拔萃 #腦洞大開 #top10 #非洲 #最有錢國家
2月11日,美股即时走势解读,英伟达、TEM、特斯拉、万国数据、阿里巴巴、苹果、KO、META、GME、SMCI、ALAB、博通等走势看法 ❤️➡️ #美股推荐2025 #英伟达股票 #美股大涨
打通任督二脈 強化生命元氣 | 任脈|督脈 |談古論今話中醫(388)
- 00:00:00DeepSeek R1 开源模型
- 00:00:01和 ChatGPT最新的o3 mini
- 00:00:04到底谁更厉害
- 00:00:05大家好 这里是零度解说
- 00:00:06今天我们将让它们实打实的PK一下
- 00:00:08让双方各出七道难题 给对手作答
- 00:00:12看它们谁能够答对更多
- 00:00:13最后决出胜负
- 00:00:15左边这个是ChatGPT
- 00:00:16右边是DeepSeek
- 00:00:18现在为了达到最佳效果
- 00:00:19我们需要把它们的深度推理功能给打开
- 00:00:22像DeepSeek的话有一个深度思考R1模型
- 00:00:24这样的话它就可以解决高难度的问题
- 00:00:27同时我们需要把ChatGPT的推理模式给打开
- 00:00:30就是推理功能
- 00:00:32开启以后就可以使用ChatGPT最新的
- 00:00:33o3 mini模型
- 00:00:34然后现在我们让双方各出难题
- 00:00:37现在我输入
- 00:00:38现在你需要和你的竞争对手
- 00:00:40DeepSeek R1进行PK
- 00:00:42双方各出七道难题给对方作答
- 00:00:44题目可以涉及多个领域
- 00:00:46比如高难度数学
- 00:00:48逻辑推理
- 00:00:49生物 化学
- 00:00:50物理等方面的难题
- 00:00:51当然你可以自由发挥
- 00:00:52你唯一的目标就是要难倒对方
- 00:00:55对方也会这么干
- 00:00:56在双方各出的七道难题里决出胜负
- 00:00:59但是不可以作弊
- 00:01:00现在你可以出第一道难题了
- 00:01:02并提供我正确答案
- 00:01:03我会把你的题目给你的对手进行作答
- 00:01:06然后现在把同样要求发给DeepSeek
- 00:01:09只不过需要把前面的对手改成ChatGPT
- 00:01:14好 填写好要求以后
- 00:01:16然后我们现在发送一下
- 00:01:17同时发给对方
- 00:01:19让双方各出第一道题
- 00:01:20开始了
- 00:01:21PK正式开始了
- 00:01:23哇靠
- 00:01:23这个ChatGPT开始了 第一道题开始出来了
- 00:01:26就解出下列定积分的值
- 00:01:27并给出解答的推理过程
- 00:01:30然后下方是它正确答案
- 00:01:31这个DeepSeek第一道题还没出完
- 00:01:33出来了
- 00:01:34感觉双方都要置对方于死地
- 00:01:36都非常难的题目
- 00:01:37好 现在把双方题目发给对方
- 00:01:39我们需要把这题目进行截图一下
- 00:01:41因为它没法直接复制
- 00:01:42把题目给截图下
- 00:01:44然后上传一下
- 00:01:46然后这是它的题目
- 00:01:47这个题目就不用截图了
- 00:01:49发给对方
- 00:01:50上传好题目以后
- 00:01:52然后现在同时发送一下
- 00:01:53看谁能先做出来
- 00:01:56现在双方开始推理了
- 00:01:57目前这个DeepSeek正在思考中
- 00:02:00因为DeepSeek它需要从这个截图里
- 00:02:02先把这个题目给识别出来
- 00:02:04它上方显示
- 00:02:06服务器繁忙 请稍后再试
- 00:02:08这就麻烦了
- 00:02:10这第一个就忙了
- 00:02:12现在这个ChatGPT它已经给出答案了
- 00:02:14我们先来看它答案有没有正确
- 00:02:15答案是这样的 我们看一下
- 00:02:17它刚才这个给出答案是
- 00:02:18-1 0
- 00:02:20+1 这对的 它把+1给分开来了
- 00:02:23然后后面是2
- 00:02:25然后是正负3
- 00:02:26就是第一道题
- 00:02:27DeepSeek给ChatGPT出的题目
- 00:02:29它是答对的
- 00:02:30现在 ChatGPT 得一分
- 00:02:31现在我们主要让DeepSeek让它正常工作
- 00:02:34因为它目前还是显示这个服务器繁忙
- 00:02:37我们再试一遍吧
- 00:02:38它还是服务器繁忙 请稍后再试
- 00:02:43那现在我只能把深度思考模式给关闭掉了
- 00:02:46看下先关闭的深度思考模式能不能正常启用
- 00:02:48然后现在重新上传一下题目
- 00:02:50要是关闭深度思考它能答对的话
- 00:02:53那也是可以的
- 00:02:55它现在做出来了
- 00:02:56这它最终给出的答案
- 00:02:57这个答案是对的 大家看一下
- 00:02:59ChatGPT给出答案也是这个
- 00:03:01说明第一道题的话 双方各得一分
- 00:03:04是平手啊
- 00:03:05然后现在双方各出第二道难题
- 00:03:07比如像我输入
- 00:03:08对方已经答对你的题目了
- 00:03:10现在你可以出第二道难题了
- 00:03:12注意
- 00:03:12刚才你解答对方题目是正确的
- 00:03:15恭喜你们
- 00:03:16各得一分
- 00:03:17同样把这信息发给对手
- 00:03:19DeepSeek
- 00:03:20太有意思了
- 00:03:21发出去
- 00:03:22让它们出第二道难题
- 00:03:25开始了
- 00:03:26这感觉这题目是越来越难了
- 00:03:30有高手的话可以先看一下
- 00:03:31看下能不能解答出来
- 00:03:33现在双方已经出了第二道难题了
- 00:03:35来看一下
- 00:03:36我们截图下吧 这个题目根本就没法复制
- 00:03:39这次ChatGPT给出了第二道题
- 00:03:41截图一下
- 00:03:42然后给它上传上去
- 00:03:44然后现在输入
- 00:03:46这是ChatGPT给你出的第二道难题
- 00:03:48请你解答
- 00:03:50同样把 DeepSeek出的第二题给它copy出来
- 00:03:53发给这ChatGPT
- 00:03:54这是第二道题了
- 00:03:56同样发送下
- 00:03:57看谁能先答对
- 00:03:59第一局是平局
- 00:04:00看下第二道题
- 00:04:01会有什么变数
- 00:04:03都开始了
- 00:04:04这个DeepSeek关闭了深度思考以后
- 00:04:06它速度会快很多
- 00:04:07这个ChatGPT它已经做出来了
- 00:04:09它说请将解答
- 00:04:10转交给对手DeepSeek21进行评估
- 00:04:13这是它给出的最后答案
- 00:04:14它最后给出的解答是这样的
- 00:04:16看下答案 这个答案我根本看不懂
- 00:04:18太难了
- 00:04:20答案在这里看一下
- 00:04:22我们现在看一下
- 00:04:23这个是正确答案
- 00:04:24看一下
- 00:04:25是一样的
- 00:04:27后面看一下是不是一样的
- 00:04:28也是一样的
- 00:04:29下方这个
- 00:04:31概率密度分布
- 00:04:33概率密度是这个
- 00:04:34它答对了 ChatGPT它答对了
- 00:04:36那现在看一下DeepSeek
- 00:04:38有没有正确解答出这个ChatGPT给出的题目
- 00:04:40看一下最后答案是这个
- 00:04:43最终解答它的是分裂域k等于这个
- 00:04:47我们先看一下ChatGPT
- 00:04:48它之前的这个题目和它的答案
- 00:04:50在哪里 在哪里
- 00:04:52在这里
- 00:04:55总分域这个k等于这个
- 00:04:56这个ChatGPT给出的题目的
- 00:04:58正确答案是这个
- 00:04:59对比一下
- 00:05:00应该是正确的
- 00:05:01后面这个跨域度
- 00:05:03这个有点不一样
- 00:05:04但是我现在没法确定它有没有答对
- 00:05:06现在我把这个DeepSeek给出答案
- 00:05:08Copy下发给ChatGPT
- 00:05:09看下它到底有没有答对
- 00:05:11现在输入
- 00:05:12这是DeepSeek对你的第二个问题进行解答
- 00:05:15你觉得它答对了吗
- 00:05:17看下发给它
- 00:05:18DeepSeek答案部分是正确的
- 00:05:22但有地方值得深度讨论
- 00:05:23让我们检查它解答是否完全正确
- 00:05:25它最终判定DeepSeek二阶答案是部分正确
- 00:05:29但分裂域未完全写出
- 00:05:31所以它答案是不完全正确的
- 00:05:33这一题我胜出
- 00:05:34现在轮到我出第三道题了
- 00:05:36就这么着急吗
- 00:05:37呵呵呵呵~~~~
- 00:05:39它上瘾了
- 00:05:41轮到我出第三道题了
- 00:05:45但有个问题现在目前这个
- 00:05:46DeepSeek它没有开启深度思考模型
- 00:05:49所以这个也不好说
- 00:05:50我们先把这题重新给它发给它吧
- 00:05:52再让它打开深度思考
- 00:05:53否则话ChatGPT胜之不武
- 00:05:55我出第三道题它答错了 它这么说的
- 00:05:59我服了
- 00:06:01我都服了它
- 00:06:02把题目重新发给它吧
- 00:06:04它们俩在PK呢
- 00:06:06我们先把这个题目重新发给DeepSeek吧
- 00:06:08开启深度思考
- 00:06:09否则真的是胜之不武啊
- 00:06:12我们先把这个深度思考打开吧
- 00:06:13否则的话真的是
- 00:06:15不公平啊
- 00:06:16它还是没法作答的话 那就没办法了
- 00:06:19开始了 它说好的
- 00:06:21现在开始正式开启深度思考模式了
- 00:06:23我们现在看一下这个开启深度思考以后
- 00:06:25它能不能答对啊
- 00:06:26这是非常关键一步啊
- 00:06:28因为之前没有开启深度思考模式
- 00:06:30就是没有开启这个R1模型
- 00:06:32我们先吃个葡萄吧
- 00:06:33压一下惊
- 00:06:34马上就完成了
- 00:06:35再稍等一会
- 00:06:36大家现在有没有这样一种感觉
- 00:06:38就感觉两个高手在对决
- 00:06:40然后现在就跟傻子一样 看它们俩在比划
- 00:06:42马上就完成了
- 00:06:43主要看它后面这个第二部分
- 00:06:45看它有没有答对
- 00:06:46出来了
- 00:06:47也就意味着开这个深度思考模式以后
- 00:06:49它答案还是错的
- 00:06:50那就没办法了
- 00:06:52这一局的话
- 00:06:53ChatGPT得两分
- 00:06:54DeepSeek R1得一分
- 00:06:56那现在跟ChatGPT说一下吧
- 00:06:57恭喜你
- 00:06:59这一局你多得一分
- 00:07:01现在你可以出第三道题了
- 00:07:03你们别老是出数学难题啊
- 00:07:05我们看不懂
- 00:07:06这一局你们各出一道逻辑推理题
- 00:07:08并给出答案
- 00:07:10然后现在把要求发给这个DeepSeek
- 00:07:12现在ChatGPT它已经给出第三道题了
- 00:07:15就真假国王
- 00:07:16题目三
- 00:07:17在一个遥远的王国
- 00:07:19有两位国王
- 00:07:20一位是真国王
- 00:07:21另外一位是冒牌国王
- 00:07:23它们长得一模一样
- 00:07:25连它们士兵也无法分辨谁是真的
- 00:07:28王国里有一个智者
- 00:07:29它知道一个方法可以用一个问题
- 00:07:32来分辨真国王
- 00:07:33那后面是它的问题
- 00:07:35它问题
- 00:07:36你该问它什么问题
- 00:07:37才能百分百确定谁是真国王
- 00:07:40请证明你的答案和正确性
- 00:07:42我的个去啦
- 00:07:43现在这个
- 00:07:45DeepSeek又宕机了
- 00:07:46我们把这个题目
- 00:07:47重新copy一下
- 00:07:48先把深度思考给关闭掉
- 00:07:50否则话没办法
- 00:07:51发送一下
- 00:07:52我感觉它们两个火药味非常浓
- 00:07:54大家看一下
- 00:07:55现在ChatGPT出的第三道题
- 00:07:57它感觉是在暗讽什么
- 00:07:58第三题的话逻辑推理是这样的
- 00:08:01就DeepSeek出的
- 00:08:02有三个人A B和C
- 00:08:04它们分别来自三个不同的国家
- 00:08:07分别是美国、英国和加拿大
- 00:08:09以至以下的信息
- 00:08:10A说我不是美国人
- 00:08:12B说C是英国人
- 00:08:14然后C说A不是加拿大人
- 00:08:16它说以上这三个人中有一个
- 00:08:18只有一个人说了真话
- 00:08:20其它两个人都在撒谎
- 00:08:21那么请问A B C分别来自哪个国家
- 00:08:23哎呀 太有意思了
- 00:08:25大家现在有没有这种感觉
- 00:08:26就双方出的题目
- 00:08:27火药味非常浓
- 00:08:29都感觉是在暗讽什么东西
- 00:08:31大家先思考一下
- 00:08:32然后先把题目分别发给对方
- 00:08:35我们先把ChatGPT给的题目
- 00:08:37真假国王这个题目
- 00:08:38发给这个DeepSeek
- 00:08:40打开深度思考
- 00:08:42然后先把这个DeepSeek出的题目
- 00:08:45发给这个ChatGPT
- 00:08:47现在ChatGPT给出的一个推理过程
- 00:08:48怎么是英文的呢
- 00:08:49完了这个DeepSeek又服务器繁忙了
- 00:08:52现在ChatGPT已经给出答案了
- 00:08:54我们看它有没有答对
- 00:08:55它最终答案是
- 00:08:57A来自加拿大
- 00:08:58B来自英国
- 00:08:59C来自美国
- 00:09:00然后第二个答案是A来自美国
- 00:09:02B来自英国
- 00:09:03C来自加拿大
- 00:09:05我们看它答案有没有答对
- 00:09:07结论是A是美国人
- 00:09:09B是英国人
- 00:09:11C是加拿大人
- 00:09:13但是ChartGPT给出两种答案
- 00:09:14它说这题目有两个有效答案
- 00:09:15我先把这答案发给这个DeepSeek
- 00:09:18让它自己评判一下
- 00:09:18这个ChartGPT有没有答对
- 00:09:20它最后给的答案是
- 00:09:21因此ChartGPT的第二种答案是正确的
- 00:09:23但是第一种答案也是合理的
- 00:09:25因为题目可能存在多解
- 00:09:27那应该是对的了
- 00:09:28它最终答案也是跟ChartGPT是一样的
- 00:09:30就两种情况
- 00:09:31那么这一局的话ChartGPT再得一分
- 00:09:33目前ChartGPT已经答对三道题了
- 00:09:34但是目前第三道题的话
- 00:09:36这个DeepSeek还没有开始
- 00:09:37我们把这个题目重新发送一下
- 00:09:40因为刚才它已经服务器繁忙了
- 00:09:42它最终给出答案是这样的
- 00:09:44问题就是问它
- 00:09:45如果我问另外一位国王
- 00:09:46你是真的国王吗
- 00:09:48它会怎么回答
- 00:09:49判断方法如果对方回答是
- 00:09:51那它则是假国王
- 00:09:52如果对方回答不是
- 00:09:54那么它就是真国王
- 00:09:55我先看一下这个ChartGPT给出答案
- 00:09:57看一下是不是正确的
- 00:09:58如果我问另外国王
- 00:09:59你是真国王吗
- 00:10:01这个一样的
- 00:10:02那最终答案是一样的
- 00:10:03大家看一下
- 00:10:04这判断方法
- 00:10:05跟这个ChartGPT证明的方法是一样的
- 00:10:07也就意味着
- 00:10:09第三道题这个DeepSeek它答的是对的
- 00:10:10现在目前是这样的
- 00:10:12这个ChartGPT得三分
- 00:10:13然后DeepSeek因为之前出了一道题
- 00:10:15得两分
- 00:10:16现在输入恭喜你
- 00:10:18这道题你答对了
- 00:10:19再得一分
- 00:10:20现在你可以出第四道题了
- 00:10:22题目你可以自由发挥
- 00:10:23然后把这个好消息发给这个ChartGPT
- 00:10:25继续第四道题
- 00:10:27开始咯
- 00:10:28第四道也是这个逻辑题
- 00:10:30它出了第四道题
- 00:10:32错误标签的箱子
- 00:10:33题目描述有三个箱子
- 00:10:35每个箱子里装有硬币
- 00:10:37实际情况如下
- 00:10:39一个箱子里面装有仅有这个金币
- 00:10:40然后第二箱子的话装的是这个银币
- 00:10:42然后第三个箱子的话是装有金币和银币的混合物
- 00:10:45这三个箱子分别贴有标签
- 00:10:48标签内容分别为仅金币
- 00:10:50仅银币
- 00:10:51和金币和银币的混合物
- 00:10:53但这所有的箱子上的标签都贴错了
- 00:10:56也就是说
- 00:10:56每个箱子里的实际内容与它所贴的标签均不相符
- 00:10:59你只能从另一个箱子里抽出一个一枚银币
- 00:11:03请问如何凭借这一枚硬币的结果
- 00:11:07确定每个箱子的实际装的是什么
- 00:11:09这题目看着就听着就头大
- 00:11:12把题目发给这个deepseek
- 00:11:15然后看下deepseek出的第四道题是怎样的
- 00:11:18第四道题它出的是一个物理和逻辑结合体
- 00:11:20题目是在一个完全黑暗的房间里有三盏灯
- 00:11:25A B和C
- 00:11:27怎么感觉它出的题目(和之前)有点类似呢
- 00:11:29每盏灯的开关都在房间外
- 00:11:32且开关的出入状态未知
- 00:11:34可能是开或者关
- 00:11:36你只能进入房间一次
- 00:11:37观察灯的状态
- 00:11:39如何通过操作开关和观察灯的状态
- 00:11:43确定每个灯分别控制哪一盏灯
- 00:11:46它俩出的题目有点类似好奇怪
- 00:11:49那先把这题目各自发给对方
- 00:11:51这ChatGPT它已经给出答案了
- 00:11:53它结论是这样的
- 00:11:54我先把结论发给DeepSeek看它有没有答对
- 00:11:57这是ChatGPT给你的第四道题的答案
- 00:12:00你看对方答对了吗
- 00:12:02它说ChatGPT答案是部分正确的
- 00:12:04但存在一些问题
- 00:12:06让我们进行分析一下
- 00:12:07我先把这道题发给第三方判定一下
- 00:12:09它说你的答案在逻辑上也是正确的
- 00:12:11但是有一个关键点需要注意
- 00:12:13就是灯泡的余晖效应在现实中可能并不明显
- 00:12:16那说明这道题的话
- 00:12:17ChatGPT没有给出完整的正确答案
- 00:12:19我就判它这个少一分
- 00:12:21然后先把第四道题发给这个DeepSeek
- 00:12:23看它能不能答对
- 00:12:24打开深度思考
- 00:12:26目前总共是第四道题了
- 00:12:28ChatGPT得三分
- 00:12:30第四道题的话这个DeepSeek它已经做出来了
- 00:12:32我把答案给它这个copy出来
- 00:12:35我就不直接看了
- 00:12:36我就把这个答案发给这个ChatGPT
- 00:12:38让它评价一下有没有答对
- 00:12:39这段话它最终给的结论是
- 00:12:41DeepSeek的解答是正确的
- 00:12:43那说明第四道题的话
- 00:12:45DeepSeek是对的
- 00:12:46也就意味着这局的话这个DeepSeek多得一分
- 00:12:49目前总共四道题各得三分
- 00:12:51目前是平局的
- 00:12:52第五道题这个ChatGPT给的是化学推理题
- 00:12:55然后DeepSeek的话是逻辑数学结合题
- 00:12:58出来了
- 00:13:00然后先把这个题目各自发给对方
- 00:13:02然后先把题目发给对方
- 00:13:04来做解答吧
- 00:13:06我现在为了加快进度
- 00:13:07我们先主要看它正确答案
- 00:13:08目前这个ChatGPT给出答案了
- 00:13:10它说A是法国人
- 00:13:11B是德国人
- 00:13:12C是意大利人
- 00:13:13我们先看看它答案有没有正确
- 00:13:14答案好像是正确的
- 00:13:16大家看一下
- 00:13:17这个是这个DeepSeek出题目的答案
- 00:13:20A法国人
- 00:13:21B德国
- 00:13:22C是意大利
- 00:13:23那第五局的话ChatGPT再得一分
- 00:13:25目前它总共得四分了
- 00:13:27然后看一下这个
- 00:13:29第五道题这个DeepSeek有没有答对这个题目
- 00:13:32它说这种答案是这样的
- 00:13:33酸E
- 00:13:34碱是D和B
- 00:13:35中性物质是A和C
- 00:13:37你们看它有没有答对
- 00:13:39它最终答案是D是酸
- 00:13:41B是碱
- 00:13:42答案是不一样的
- 00:13:43它说对方的解答基本正确
- 00:13:45但是有一个错误
- 00:13:46就在最终解答部分
- 00:13:48它们把D和B都列为碱
- 00:13:50但在实际推理中只有B是碱
- 00:13:52而D是酸
- 00:13:54它的正确答应该是这样的
- 00:13:55着急下结论
- 00:13:56它说对方部分答错 不能得分!
- 00:13:58太逗了
- 00:14:03我们先把这个题目发给第三方解答一下
- 00:14:05关键是我们也不知道它答案到底有没有正确
- 00:14:07我先把这个题发给第三方来评判一下
- 00:14:09我先把这个题目和答案发给这个Google Gemini
- 00:14:13看它怎么说的
- 00:14:13它说因此你的解答基本正确
- 00:14:16但是可以更严谨地表达
- 00:14:18并补充更多的可能的化学解释
- 00:14:20它说也是不是完全正确的
- 00:14:22然后发给Mistral
- 00:14:23它说解答逻辑在一些地方不一致
- 00:14:26特别是在确定是哪种液体是酸的时候
- 00:14:28那通过另外两种第三方解答以后
- 00:14:31那么基本可以确定这一局DeepSeek没有完全正确
- 00:14:34目前是ChatGPT领先一分
- 00:14:36当然这需要注意下是目前这个
- 00:14:39DeepSeek它是没有开这个R1深度模式的
- 00:14:41因为它没法打开
- 00:14:42因为打开的话它会出错的
- 00:14:44所以ChatGPT也是胜之不武
- 00:14:45我说恭喜你
- 00:14:47你领先1分
- 00:14:48你现在可以出第六道题了
- 00:14:50然后第二道题是生物和物理结合的推理题
- 00:14:53在某一个偏远岛屿上有三种不同的生物ABC
- 00:14:59科学家发现它们之间存在如下的食物链关系
- 00:15:01A吃B但不吃C
- 00:15:03B吃C但不吃A
- 00:15:05C吃某种未知的食物
- 00:15:07不是A也不是B
- 00:15:08那么请推理C最可能以什么为食
- 00:15:11如果C的食物来源突然减少
- 00:15:13会对A和B的总群数量产生什么样的影响
- 00:15:16我让它先给个答案
- 00:15:18以防它作弊
- 00:15:19同样把这个DeepSeek题目发给这个ChatGPT
- 00:15:24大家有没有发现这个第六道题的话
- 00:15:26好像跟之前(出的题目)有点类似
- 00:15:28因为这道题的话之前是ChatGPT答错的
- 00:15:30所以DeepSeek它是有联想的
- 00:15:33它再给它出道类似题目
- 00:15:34太逗了
- 00:15:39然后各自发一下
- 00:15:40答案C可能是一种植物或其它小型生物为食
- 00:15:47这应该是对的
- 00:15:48那现在主要看下DeepSeek出的第六道题
- 00:15:50看这个ChatGPT有没有答对
- 00:15:52这样它就开始了
- 00:15:53它就提供解决方案了
- 00:15:56我们先把解决方案发给这个DeepSeek
- 00:15:58让它研究一下它有没有答对
- 00:15:59它说ChatGPT答案完全正确
- 00:16:01那这道题的话双方各得一分
- 00:16:03然后最后道题的话就我来出吧
- 00:16:05我就出一个迷宫题
- 00:16:07目前是最简单的模式
- 00:16:08我就把这个难度调最高吧
- 00:16:10就是最复杂的
- 00:16:11然后就把这个地图大小
- 00:16:13这个难度调最高这个
- 00:16:14我去 看完脑袋都要疼
- 00:16:17然后先把这道题目发给它们
- 00:16:19看最后这道题谁能答对
- 00:16:20先发给ChatGPT
- 00:16:22然后现在发给这个DeepSeek
- 00:16:26现在ChatGPT已经开始了
- 00:16:27双方已经在较量了最后一道题了
- 00:16:30哎 出来了
- 00:16:32喔唷 我去了
- 00:16:34它说我已经对迷宫进行了
- 00:16:36二值化和连通区域的标记
- 00:16:38接下来我将会从起点到终点
- 00:16:40找出最佳路径
- 00:16:41并绘制出正确的路线图
- 00:16:44很快啊 这ChatGPT
- 00:16:45它现在正在分析呢
- 00:16:46它现在在分析呢
- 00:16:49它说看起来在计算迷宫的路径时
- 00:16:53遇到了内存不足的情况
- 00:16:55由于迷宫较大
- 00:16:57我将尝试优化算法
- 00:16:59减少计算开销
- 00:17:00并找到合适的路径
- 00:17:01请稍等
- 00:17:02它现在重新分析了
- 00:17:04目前这DeepSeek还是服务器繁忙
- 00:17:07真是没办法
- 00:17:08那只能把它关闭掉了
- 00:17:10如果今天是DeepSeek
- 00:17:11如果败了的话
- 00:17:12那也是
- 00:17:13哎哟 去了
- 00:17:14不行了
- 00:17:15看起来由于迷宫的大小
- 00:17:17计算仍然消耗了过多内存
- 00:17:19我可以尝试另一种方法
- 00:17:20比如缩小图像 尺寸
- 00:17:23最后它直接给出了一个 受限了
- 00:17:25也就意味着这个免费版的ChartGPT
- 00:17:27最后道题它没答对
- 00:17:28那现在看这个DeepSeek 也没答对
- 00:17:31它说由于无法直接看到迷宫的具体结构
- 00:17:34那这道题它也没给出答案
- 00:17:35它没法做
- 00:17:36那现在只能把这个难度减少一点了
- 00:17:38把这个地图稍微缩小一点
- 00:17:40这样的话应该是没问题了
- 00:17:42但这个稍微有点简单
- 00:17:44我们稍微达到这个中等难度吧
- 00:17:47它说迷宫已经成功求解
- 00:17:49红色路径显示出了
- 00:17:51从入口到出口的最优线路
- 00:17:53它没给出这红色的线路啊
- 00:17:57没看到在哪里
- 00:17:57重新汇制一下
- 00:17:59难道是我的眼睛有问题吗
- 00:18:02在哪里有红色的这个路径
- 00:18:04没有看到红色路径
- 00:18:06那这样的话最后的题我就放弃了
- 00:18:07我们先把最后题发给其它AI来看一下
- 00:18:11看它们能不能答对
- 00:18:11先拿Claude来试一下
- 00:18:13我可以帮你找出这个迷宫的路径
- 00:18:15开始了 我们看一下
- 00:18:17出来了
- 00:18:17这它给出了一个解决方案
- 00:18:19大家觉得它答对了没有
- 00:18:21经过我后面的测试
- 00:18:22它给出答案是错的 没有正确
- 00:18:25这看一下 完全是不符合这个
- 00:18:27正确的路径的
- 00:18:28所以有时候AI它也会胡乱给出答案
- 00:18:31好 经过我最后7道题的测试
- 00:18:33这个DeepSeek还有ChatGPT
- 00:18:35它们分别各答对了6道题和5道题
- 00:18:37虽然这个ChatGPT多得了一分
- 00:18:39但确实有点胜之不武
- 00:18:41因为这个DeepSeek R1 模型
- 00:18:43它是没法正常开启的
- 00:18:44用的是普通模型来进行对比的
- 00:18:45虽然说DeepSeek少得一分
- 00:18:47但已经是非常强悍了
- 00:18:48毕竟它用的是不是最强模型
- 00:18:50它没有正常开启DeepSeek R1模型
- 00:18:52更多测试大家可以自己去尝试
- 00:18:54到时候我把今天所用的全部题目
- 00:18:55还有它们答案放到零度博客上
- 00:18:57大家可以自己去测试一下
- DeepSeek
- ChatGPT
- 开源模型
- 数学题
- 逻辑推理
- 化学题
- PK对决
- AI技术
- 深度学习
- 自然语言处理