网易首页 > 网易号 > 正文 申请入驻

DeepSeek最新模型硬刚o1!英伟达科学家等大佬:这才配叫OpenAI

0
分享至

OpenAI怎么也没想到,o3还在画饼阶段,中国一夜之间就冒出来两个能和o1打对台的模型。

1月20日,月之暗面正式推出多模态思考模型Kimi k1.5,并首次公开该模型的训练技术报告。

Kimi k1.5在short-CoT(短链思考)方面达到领先水平,在其他多个测试中也大幅超越GPT-4和Claude Sonnet 3.5。在Long-CoT(长链思考)方面,该模型在多个领域的表现也与o1持平。

同一天,DeepSeek也正式开源R1推理模型,并发布技术报告。R1在多个基准测试中也与o1持平,并且成本只有o1的三十分之一。

随着R1模型的开源,英伟达科学家Jim Fan称:“我们生活在这样一个时代:由非美国公司保持OpenAI最初的使命——做真正开放的前沿研究、为所有人赋能。”Perplexity CEO Aravind Srinivas表更是直言:“DeepSeek才配叫做OpenAI。”

不过,R1依然面临着开源模型V3一样的毛病。有网友向他提问“谁训练你的时,它回答道:“我是被OpenAI开发的”。

DeepSeek、Kimi新模型发布“撞车”,硬刚OpenAI

北京时间1月20日,月之暗面发布了多模态思考模型Kimi k1.5。

在short-CoT模式下,Kimi k1.5的数学、代码、视觉多模态和通用能力大幅超越了GPT-4o和Claude 3.5 Sonnet,领先幅度高达550%。在Long-CoT模式下,Kimi k1.5的数学、代码、多模态推理能力达到了OpenAI o1正式版的水平。

月之暗面表示,这应该是全球范围内,有OpenAI之外的公司首次实现o1正式版的多模态推理性能。

图片来源:X

同一天,DeepSeek也正式开源R1推理模型,允许所有人在遵循MIT License(注:被广泛使用的一种软件许可条款)的情况下,蒸馏R1训练其他模型。

在数学、代码和自然语言推理等任务上,R1的性能比肩o1正式版。同时根据DeepSeek公布的测试数据,R1在美国AIME 2024、MATH-500和SWE-bench Verified测试中的比分均高于o1。AIME 2024和MATH-500测试专注于数学能力,SWE-bench Verified则用于评估AI模型解决现实世界软件问题的能力。

图片来源:X

更重要的是,R1的价格只有o1的约三十分之一,百万token输出只需16元人民币,相较而言,o1的百万token输出需要60美元(约合人民币436元)

图片来源:DeepSeek官网

另外,R1的参数量较低,开发人员可以用相对较低的成本在本地运行模型。Exo Lab创始人Alex Cheema在家使用7个MacMini串联一个MacBook成功运行起了R1模型。他感叹道:“AGI(通用人工智能)到家了。”

图片来源:X

英伟达科学家等大佬:DeepSeek才配叫OpenAI

R1的技术文档发布后,英伟达高级研究科学家Jim Fan第一时间对论文进行研究,之后发出了这样的感慨:“我们生活在这样一个时代:由非美国公司保持OpenAI最初的使命——做真正开放的前沿研究、为所有人赋能。

他补充道:“DeepSeek-R1不仅开源了大量模型,还泄露了所有训练秘密。他们可能是第一个显示 RL(强化学习)飞轮发挥主要作用、持续增长的OSS项目。(对AI研究的)影响不仅可以通过‘内部实现了ASI’或‘草莓计划’等神话名称来实现,也可以通过简单地转储原始算法和matplotlib学习曲线来产生影响。”

Jim Fan的每一句话都在戳喜欢搞神秘,卖期货的OpenAI的肺管子。

图片来源:X

实际上,业界有这种看法的人还不少。Abacus ai的CEO Bindu Reddy评价道:“这是开源AGI的胜利,一家来自中国的小型初创公司击败了所有人”。

UC Berkeley教授Alex Dimakis也认为,DeepSeek现在已经处于领先位置,美国公司可能需要迎头赶上了。

Perplexity CEO Aravind Srinivas表更是直言:“DeepSeek才配叫做OpenAI。”

图片来源:X

除了对OpenAI的讽刺之外,Jim Fan还深入解读了R1模型的创新之处。

他表示,R1模型纯粹由RL驱动,完全没有SFT(“冷启动”)。这让人想起 AlphaZero——从头开始掌握围棋、将棋和国际象棋,而无需先模仿人类大师级的动作。

而且,R1使用由硬编码规则计算的真值奖励,避免使用任何RL容易攻击的学习奖励模型。随着训练的进行,模型的思考时间稳步增加。Jim Fan强调,这不是预先编程好的,而是一种模型自主的突发特性,并且模型也出现了自我反省和探索行为。

DeepSeek还使用了一种名为GRPO(组相对策略优化)的新优化方法,有效减少了内存使用。GRPO由DeepSeek于2024年2月发明。这也是为什么家用设备也能完整运行R1的原因。

基于此,有网友指出,鉴于Deepseek仍在使用GRPO等GPU性能较差的方法,可以推断出,该公司可能没有很多功能强大的Hopper GPU。这意味着,算力训练成本也是极低的。

有网友评价,这是AI的“顿悟时刻”:“R1-Zero(注:R1是R1-Zero调整后的模型)证明模型可以自我开发推理策略。举个例子:当遇到问题时,它学会了回溯并质疑其最初的假设——这是一种从未明确编程的行为。”这代表着DeepSeek的新模型已经能够具有像人类一样的自主学习能力了。

知名AI评测员Matthew Berman表示,R1拥有他所见过的最像人类的内心独白。

图片来源:X

然而,R1依然面临着开源模型V3一样的毛病。有网友向他提问谁训练你的时,它回答道:“我是被OpenAI开发的”。

图片来源:X

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中纪委2026年“放大招”!严查四类人!伸过手的一个都跑不了!

中纪委2026年“放大招”!严查四类人!伸过手的一个都跑不了!

细说职场
2026-05-25 12:14:00
米体:意大利诺接近执教那不勒斯,阿莱格里基本出局

米体:意大利诺接近执教那不勒斯,阿莱格里基本出局

懂球帝
2026-05-26 22:36:25
一个多月涨了近140%!紧急澄清后,002297,跌停

一个多月涨了近140%!紧急澄清后,002297,跌停

大众证券报
2026-05-26 10:35:26
花生再次被关注!调查发现:糖尿病常吃花生不过半年或有4好处

花生再次被关注!调查发现:糖尿病常吃花生不过半年或有4好处

芹姐说生活
2026-05-15 23:37:01
河南一女子超市购物抽奖中世界杯门票欲转让,网友称愿50万收票,超市方回应

河南一女子超市购物抽奖中世界杯门票欲转让,网友称愿50万收票,超市方回应

潇湘晨报
2026-05-26 15:11:42
庆祝阿森纳夺冠,“雪儿”宋雪莹身穿厄德高球衣主持天下足球

庆祝阿森纳夺冠,“雪儿”宋雪莹身穿厄德高球衣主持天下足球

懂球帝
2026-05-26 09:51:18
号称是“净化灵魂”的地方,却暗藏罪恶,布达拉宫里面有什么?

号称是“净化灵魂”的地方,却暗藏罪恶,布达拉宫里面有什么?

抽象派大师
2026-05-17 02:15:03
央视三胎宣传片惹争议,脱离现实强行把孕妇塑造成超人式幸福?

央视三胎宣传片惹争议,脱离现实强行把孕妇塑造成超人式幸福?

番外行
2026-05-24 09:14:38
东风导弹泄密案!间谍郭万钧一家三口,全部被处以死刑

东风导弹泄密案!间谍郭万钧一家三口,全部被处以死刑

番外行
2026-03-31 08:28:28
腾讯“附近的工作”上线任务模式 零工匹配从“找岗”变“派单”

腾讯“附近的工作”上线任务模式 零工匹配从“找岗”变“派单”

环球网资讯
2026-05-26 17:26:21
银行大势已定!不出意外的话,2026年起我国的银行将迎来3大洗牌

银行大势已定!不出意外的话,2026年起我国的银行将迎来3大洗牌

三农老历
2026-05-26 20:54:19
44岁伊万卡惊艳大哥巴哈马婚礼,和19岁侄女海中同框,更健美高挑

44岁伊万卡惊艳大哥巴哈马婚礼,和19岁侄女海中同框,更健美高挑

译言
2026-05-26 10:20:30
突发!北京朝阳发生火情!

突发!北京朝阳发生火情!

朝阳通
2026-05-26 11:54:20
53岁袁立突发重病!病床素颜照曝光,身处上海顶级医院治疗

53岁袁立突发重病!病床素颜照曝光,身处上海顶级医院治疗

行者聊官
2026-05-23 14:57:01
阿斯:弗里克开季将仅有11名一线队员

阿斯:弗里克开季将仅有11名一线队员

懂球帝
2026-05-26 20:04:12
对俄罗斯而言,前线局势正变得极其严峻,乌克兰可能取得突破

对俄罗斯而言,前线局势正变得极其严峻,乌克兰可能取得突破

山河路口
2026-05-26 14:48:48
领证前夜婆婆立规矩:年薪200万必须上交,我笑着点头宣布2个决定

领证前夜婆婆立规矩:年薪200万必须上交,我笑着点头宣布2个决定

阿凯销售场
2026-05-26 21:35:54
荨麻,不要读xún má,丢不起那个人!

荨麻,不要读xún má,丢不起那个人!

未央看点
2026-05-19 08:54:23
无缘欧冠!40岁魔笛累了:考虑世界杯后退役 皇马邀他回归

无缘欧冠!40岁魔笛累了:考虑世界杯后退役 皇马邀他回归

叶青足球世界
2026-05-26 20:48:46
宋凯致信赵松源:足协全力保障球员留洋;期待你在欧洲成才

宋凯致信赵松源:足协全力保障球员留洋;期待你在欧洲成才

懂球帝
2026-05-26 17:52:07
2026-05-26 23:07:00
每日经济新闻 incentive-icons
每日经济新闻
中国主流财经全媒体平台。
1580514文章数 2726278关注度
往期回顾 全部

科技要闻

中国AI要向外卷,而不只是做第二个OpenAI

头条要闻

留神峪煤矿"暗面"矿工发声:遇检查时矿上就提前封堵

头条要闻

留神峪煤矿"暗面"矿工发声:遇检查时矿上就提前封堵

体育要闻

上赛季差点降入英甲,下赛季要踢英超了

娱乐要闻

台媒贴脸!S妈被问大S嗑药当场沉默

财经要闻

中国铝行业爆单 下一个“煤炭”大周期?

汽车要闻

涉水加强 福特烈马亚马逊限量版上市 售价39.98万

态度原创

房产
健康
数码
教育
时尚

房产要闻

招商地产接盘碧桂园!海口这个烂尾豪宅,要彻底改命?

外泌体抗衰,什么时候能用上?

数码要闻

平板618促销“摆烂”:苹果不降价,小米降200,全靠国补撑场面

教育要闻

教育的最高境界就是把孩子培养成幸福的普通人。

蓝色系穿搭太适合夏天了!快来看看这些穿搭示范,美得不重样

无障碍浏览 进入关怀版