DeepSeek赢麻了，首个推理模型就超越OpenAI o1|谷歌|数学|知名企业|openai|deepseek

DeepSeek赢麻了，首个推理模型就超越OpenAI o1

分享至

今年早些时候，国内科技公司DeepSeek（深度求索）因V2模型一举成名，成名的原因简单粗暴，主打高性价比。在当时，DeepSeek V2的API定价约等于谷歌的七分之一，GPT-4 Turbo的七十分之一。

时隔几个月，这家被业界冠以“AI界拼多多”之称的公司，迅速推出首个推理模型「DeepSeek-R1预览版」。该模型一经推出，便在AIME以及全球顶级编程竞赛（codeforces）等权威评测中，大幅超越了GPT4o，甚至o1-preview，一夜之间轰动全球。

时间倒退回今年5月前后，在大模型领域，国内各大厂牌内卷最凶猛，创立于2023年4月的DeepSeek一战成名，毫无疑问是当时的“黑马”。但是，人们提起DeepSeek总是带着“高性价比”的标签，不自觉让大家忽视他们强大的技术力。

如今，推理模型DeepSeek-R1预览版在AIME和MATH这两个关键基准测试上超越了OpenAI o1，大家终于不只以“性价比”来衡量DeepSeek。

这里简单解释一下，AIME在美国数学竞赛（AMC）中难度等级最高，所以常被用来测试不同模型解决推理问题的性能。DeepSeek-R1预览版在解决这些复杂数学问题时拥有极强的“拆解能力”，能够将复杂任务分解为更小的步骤并逐一执行，从而提高其准确性。

同时，DeepSeek-R1预览版的思维过程是完全透明的，允许用户验证不同阶段得出的答案。

值得注意的是，DeepSeek-R1预览版与OpenAI o1模型类似，会根据问题的复杂度，在回答前“思考”一会儿，有时甚至长达数十秒。

就在该预览版发布后不久，DeepSeek便表示计划开源DeepSeek-R1并发布API，果然，这就是开源精神。在中国所有大模型创业公司中，DeepSeek是为数不多未做to C应用的公司，而且坚持开源，深受社区欢迎。

此次一战成名，全世界不少人对DeepSeek这家中国公司产生兴趣。虽然DeepSeek是打响“价格战”后让大家熟知，但深入了解后发现，DeepSeek不仅没有烧钱补贴，甚至有利润。

在DeepSeek-R1预览版后，低调的“技术大牛”形象深入人心，让我们更加期待DeepSeek（深度求索）未来继续带来更多惊艳的AI模型。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

手机 / 数码

房产 / 家居

DeepSeek赢麻了，首个推理模型就超越OpenAI o1

“已全面投产，需求惊人”

媒体："末日武器"疑被俄第一个投入实战 麻烦真的大了

媒体："末日武器"疑被俄第一个投入实战 麻烦真的大了

点燃队唯一会防守的球员，是真靠谱啊

王宝强被指涉嫌欺诈1亿

杨伟民:应加大对低收入群体转移支付力度

10万级的星海S7 也能带来高配生活

态度原创

故宫珍藏的墨迹《十七帖》，比拓本更精良，这才是地道的魏晋写法

松弛感穿搭太适合冬天了，减龄又好看

第二款PS4独占游戏要实现模拟 《最后的守护者》计划中

尽管Pro Max极具吸引力 但iPhone基本机型依然畅销

宝宝可爱的瞬间，举杯动作竟如此娴熟！

媒体："末日武器"疑被俄第一个投入实战麻烦真的大了

媒体："末日武器"疑被俄第一个投入实战麻烦真的大了

第二款PS4独占游戏要实现模拟《最后的守护者》计划中

尽管Pro Max极具吸引力但iPhone基本机型依然畅销