网易首页 > 网易号 > 正文 申请入驻

DeepSeekV3小版本升级实测堪比V3.5,非推理模型也有“啊哈时刻”

0
分享至

梦晨 发自 凹非寺
量子位 | 公众号 QbitAI

DeepSeek V3升级了,新版本V3-0324。

官方轻描淡写只说是“小版本升级”,但很多人实测下来可一点也不小。



把流行的小球弹跳测试,提升难度到4维空间超立方体也没问题。

天哪,如果这只是一个小更新,那我想象不出大更新会是什么样子。



编程这块,只需一句提示词开发一个完整产品着陆页,带自适应布局带动效,被评价为与Claude 3.7 Sonnet同一水平。



由于发布时间太短,还没有正式测评结果,不过在开发者Xeophon的个人Benchmark上所有指标都有大提升,成为该测试下最好的非推理模型。



不是推理模型也有“啊哈时刻”

DeepSeek-V3-0324并非推理模型,在回答之前不会给出思考过程,但依然遵循一定的思维方式分解问题。

走入死胡同的话,还表现出自主回到上一步重新思考的能力。

在“9.11和9.9那个大”、“Straberry有多少个r”已经不成问题的今天,最新折磨AI的难题是“让7米长的甘蔗通过2米高1米宽的门”。

在量子位的测试中,DeepSeek-V3-0324先是像它的前辈以及许多其他AI一样碰壁。



碰壁之后开始重新思考题目本身的含义,后面依旧陷入误区,但突然在中文解题过程中夹杂一句英语思考,类似DeepSeek-R1技术报告中的“啊哈时刻”

等等,这似乎与之前的对角线方法相似,也许我遗漏了什么。



顿悟之后,突然就走上了正确的道路,注意到了题目中没直接提到的隐藏条件。



虽然从计算过程看,还是没理解到问题的本质,但好歹得出了解决方案,还认识到了自己的误区。



依旧免费, 依旧开源

像这样的优秀模型依旧免费, 依旧开源,权重文件已火速上线HuggingFace,使用最宽松的MIT协议。



所有权重文件加起来占硬盘空间约688GB,与初代v3保持一致,说明依然是671B参数的MoE模型,目前没有更多技术细节,还需等待官方进一步发布公告。

目前在官网和官方APP(关闭深度思考即可)、HuggingFace等渠道都能体验到v3-0324。



也可以到大模型竞技场去与其他模型pk,不过投票结果还要等一段时间才能出来。



当然最让大家期待的还是,v3更新了,r2还会远吗?



官网试玩:

https://chat.deepseek.com/

HuggingFace:

https://huggingface.co/deepseek-ai/DeepSeek-V3-0324/blob/main/README.md

参考链接:
[1]https://x.com/TheXeophon/status/1904225899957936314
[2]https://x.com/Yuchenj_UW/status/1904223627509465116
[3]https://x.com/risphereeditor/status/1904194061780590773

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

/阅读下一篇/

200亿机器人独角兽被曝爆雷,官方回应来了

返回网易首页 下载网易新闻客户端
相关推荐
热点推荐
小米汽车事故背后:耀眼的智驾,仓促的2秒钟

小米汽车事故背后:耀眼的智驾,仓促的2秒钟

36氪
2025-04-01 22:58:27
台湾统一方式可能出人意料:77年前毛主席的奇谋,是最佳解决方案

台湾统一方式可能出人意料:77年前毛主席的奇谋,是最佳解决方案

东方寻史
2025-03-29 09:38:38
梁朝伟发文:来我的公司,包你在海外狂赚

梁朝伟发文:来我的公司,包你在海外狂赚

红星新闻
2025-04-01 17:36:12
最新战报!丁俊晖4连鞭夺赛点,9-3领先世界冠军,塞尔比创纪录!

最新战报!丁俊晖4连鞭夺赛点,9-3领先世界冠军,塞尔比创纪录!

刘姚尧的文字城堡
2025-04-02 03:34:58
杭州男子弄丢6岁妹妹,16年后出差陪客户喝酒,看见女服务员愣了

杭州男子弄丢6岁妹妹,16年后出差陪客户喝酒,看见女服务员愣了

兰姐说故事
2025-03-30 17:20:06
广东4月将有4轮冷空气及4轮降水!再迎倒春寒可能性较小

广东4月将有4轮冷空气及4轮降水!再迎倒春寒可能性较小

南方都市报
2025-04-02 10:53:09
科尔称赞巴特勒表现:季后赛吉米 这确实是真的

科尔称赞巴特勒表现:季后赛吉米 这确实是真的

直播吧
2025-04-02 11:00:31
不要乱摸好吗?“黑人”咸猪手韩国美女啦啦队员 遭球迷怒喷

不要乱摸好吗?“黑人”咸猪手韩国美女啦啦队员 遭球迷怒喷

直播吧
2025-04-02 11:54:22
那年我因好奇去捐精,15年后却收到法庭传单,我多了个老婆和孩子

那年我因好奇去捐精,15年后却收到法庭传单,我多了个老婆和孩子

白云故事
2025-03-28 12:25:06
看不到他的丁 丁,这可怎么办啊?

看不到他的丁 丁,这可怎么办啊?

性学研究僧
2025-03-25 19:26:27
一场1-2爆出大冷门,大黑马创造奇迹淘汰劲敌,阿隆索不敢相信

一场1-2爆出大冷门,大黑马创造奇迹淘汰劲敌,阿隆索不敢相信

足球狗说
2025-04-02 04:51:48
9-11,8-11!陈垣宇连输2局,0-2落后欧洲冠军,国乒出局第2人?

9-11,8-11!陈垣宇连输2局,0-2落后欧洲冠军,国乒出局第2人?

刘姚尧的文字城堡
2025-04-02 12:07:55
特朗普称4月2日是“解放日”,世界将见证美国的“历史性转折”

特朗普称4月2日是“解放日”,世界将见证美国的“历史性转折”

远方的狮
2025-04-01 23:30:38
对华连续下重手后,加拿大新总理叫嚣:中国不是我们的合适伙伴

对华连续下重手后,加拿大新总理叫嚣:中国不是我们的合适伙伴

boss外传
2025-04-01 14:40:03
台海战役一旦爆发,这些中国城市或成敌方重击目标

台海战役一旦爆发,这些中国城市或成敌方重击目标

书中自有颜如玉
2025-03-26 18:15:11
一战提升0.6%!本场过后库里三分命中率39.9% 距超4成一步之遥

一战提升0.6%!本场过后库里三分命中率39.9% 距超4成一步之遥

直播吧
2025-04-02 10:49:20
她获得 2025 年 AVN 最佳国际新星奖

她获得 2025 年 AVN 最佳国际新星奖

吃瓜党二号头目
2025-04-02 08:16:21
罗湖这家粤菜老字号正式谢幕,市民暖心打卡告别

罗湖这家粤菜老字号正式谢幕,市民暖心打卡告别

南方都市报
2025-04-02 11:17:19
68亿!40亿!东方财富和拓维信息,彻底爆了!

68亿!40亿!东方财富和拓维信息,彻底爆了!

风风顺
2025-04-02 06:56:12
河南项城一制药厂非法生产过程中发生爆炸

河南项城一制药厂非法生产过程中发生爆炸

新京报
2025-04-01 19:58:15
2025-04-02 13:47:00
量子位 incentive-icons
量子位
追踪人工智能动态
10263文章数 176076关注度
往期回顾 全部

科技要闻

对智能驾驶的宣传,不能再含糊其辞了

头条要闻

牛弹琴:王毅访俄 当着普京的面谈到特朗普拉拢俄罗斯

体育要闻

杀人犯儿子?他已成东詹最可靠护法

娱乐要闻

《浪姐6》三公结果曝光!全场喊黑幕

财经要闻

"家装第一股"东易日盛资金链断裂真相

汽车要闻

小米SU7爆燃事故 雷军: 会用行动回答大家的问题

态度原创

艺术
家居
亲子
旅游
军事航空

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

家居要闻

美式复古 设计大胆独特

亲子要闻

爸爸用参照物法哄娃睡觉,哄个娃都整上相对运动了。

旅游要闻

油菜花开 这些赏花方式请查收

军事要闻

视频直击:东部战区远火实弹射击现场