网易首页 > 网易号 > 正文 申请入驻

DeepSeek冲击波已经到达美股:全球技术团队争相“复现”R1

0
分享至

北京时间 1 月 28 日,美股收盘,英伟达下跌 16.86%,市值蒸发 5888.62 亿美元(约合人民币 4.27 万亿元),创下美股纪录。业界分析这与 DeepSeek 带来的冲击直接相关,该公司在训练明星产品 DeepSeek-V3 开源大模型的过程中,仅使用了 2,048 块 H800 显卡,这与英伟达与 OpenAI 们所讲的技术故事有所不同。

一位英伟达发言人在评价 DeepSeek 的成果时表示:“DeepSeek 是一个出色的 AI 技术进步,也是测试时间尺度(Test Time Scaling)的一个完美例子,”“DeepSeek 的工作说明了如何利用这一技术来创建新的模型。”当地时间 1 月 27 日,美国总统特朗普表示中国 AI 应用的突然兴起对于美国科技公司来说“应该是一个警钟”,但他同时表示仍对美国公司保持期望。

全世界技术圈还在以饱满的热情热议 DeepSeek,该公司也适时发布了一系列名为 Janus Pro 的基于视觉的多模态 AI 开源模型,并表示模型性能优于 OpenAI 的 DALL-E 3。

新模型是对去年底推出的 Janus 的升级。Janus Pro 通过升级训练流程、数据质量和模型大小对 Janus 进行了改进,从而提高了图像稳定性和细节丰富性。Janus-Pro 通过添加 7,200 万张高质量合成图像并将其与真实世界数据进行平衡,实现了更具视觉吸引力和更稳定的图像输出。

Janus Pro 系列模型参数的大小从 1B 到 7B 不等,参数较多的模型比参数较少的模型表现更好。目前,Janus Pro 已经获得了 MIT 协议许可,这意味着它可以在商业上不受限制地使用。

DeepSeek 将 Janus Pro 描述为“新颖的自回归框架”,它既能理解图片又能生成图片,兼具图像生成、视觉问答和图像字幕等功能。DeepSeek 表示,在 GenEval 和 DPG Bench 中两个 AI 评估基准,这一系列模型中参数最大的 Janus-Pro-7B 击败了 DALL-E 3 以及 PixArt alpha、Emu3-Gen 和 Stability AI 的 Stable Diffusion XL 等型号。

DeepSeek 在 Hugging Face 上的一篇文章中写道:“Janus Pro 的简单性、高度灵活性和有效性使其成为下一代统一多模式模型的有力候选者。”

要知道,只需一台普通电脑就能运行 Janus-Pro-7B,同时可以生成分辨率为 384x384 的图。网友“冷雨寻双”表示这就好比“用五菱宏光跑出了保时捷的加速度”。虽然图片的尺寸不算太大,但是考虑到其参数只有 7B,所以正如 DeepSeek 在上述文章中所写的:“Janus Pro 旨在实现性能和计算成本之间的平衡。”目前,在 Hugging Face 上,Janus-Pro 位居模型下载排行榜第二名,第一名则是 DeepSeek-R1。

通过发布 Janus Pro 7B,DeepSeek 将其范围从语言处理扩展到计算机视觉这一关键领域。由于 Janus Pro 7B 不需要大量的计算资源,因此可以大大降低希望将先进视觉 AI 集成到企业业务的门槛。无论是初创公司还是大型公司,都可以在不产生过高基础设施成本的情况下来部署先进的视觉智能模型。

与此同时,DeepSeek 的 APP 已经登上苹果应用商店排行榜榜首,超过了ChatGPT。不过,1 月 27 日,DeepSeek 表示其服务器遭到大规模恶意攻击,因此它暂停了注册。

因为最近一系列产品的良好表现,AMD 已宣布集成 DeepSeek-V3 到 MI300X GPU。许多技术团队也在尝试复现这一技术成果,来自美国加州大学伯克利分校、香港科技大学和 Hugging Face 的研究人员均已成功复现 DeepSeek 模型。这些研究人员发现仅仅使用强化学习,无需使用监督微调,仅用 30 美元就能见证“奇迹”。

比如,加州大学伯克利分校的研究人员在 CountDown 游戏中复现了 DeepSeek R1-Zero。他们证明只需使用强化学习,让参数仅有 3B 的基础语言模型也能实现自我验证和自我搜索。

香港科技大学的研究人员使用 8K 个样本,成功在 7B 模型上复现 DeepSeek-R1-Zero 和 DeepSeek-R1 的训练。具体来说,他们以 Qwen2.5-Math-7B 作为基础模型,通过对其进行强化学习,在不进行监督微调和没有使用奖励模型的情况下,让 Qwen2.5-Math-7B 在 AIME 基准上达到 33.3% 的准确率,在 AMC 上达到 62.5% 的准确率,在 MATH 上达到 77.2% 的准确率。

而 Hugging Face 则已官宣其复刻了 DeepSeek R1 的所有流程(pipeline),其从 DeepSeek-R1 中蒸馏出来高质量语料库,复现了 R1-Distill 模型。

总的来说,由 DeepSeek 引起的震撼还在持续。犹记得一年前的 2024 开年,人们都在关注 OpenAI 的 Sora。一年后的 2025 年开年,所有注意力都转移到 DeepSeek 身上,这似乎是“换了人间”。

编辑:李航

参考资料

https://futurism.com/silicon-valley-shambles-chinese-startup-deepseek

https://techcrunch.com/2025/01/27/viral-ai-company-deepseek-releases-new-image-model-family/

https://venturebeat.com/ai/deepseek-unleashes-janus-pro-7b-vision-model-amidst-ai-stock-bloodbath-igniting-fresh-fears-of-chinese-tech-dominance/

https://www.reuters.com/technology/artificial-intelligence/hedge-flow-hedge-funds-were-pausing-us-ai-bets-deepseek-emerged-says-goldman-2025-01-27/

https://www.reuters.com/technology/artificial-intelligence/what-is-deepseek-why-is-it-disrupting-ai-sector-2025-01-27/

https://www.reuters.com/technology/deepseeks-janus-pro-ai-model-beats-rivals-image-generation-2025-01-27/

https://www.reuters.com/technology/artificial-intelligence/chinese-ai-startup-deepseek-overtakes-chatgpt-apple-app-store-2025-01-27/

https://www.cnbc.com/2025/01/27/nvidia-calls-chinas-deepseek-r1-model-an-excellent-ai-advancement.html

https://www.nbcnews.com/tech/innovation/trump-china-deepseek-ai-wake-call-rcna189526

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
曲终人散!欧冠结束,萨尔布吕肯俱乐部态度变了,樊振东错付了?

曲终人散!欧冠结束,萨尔布吕肯俱乐部态度变了,樊振东错付了?

天天热点见闻
2026-05-20 08:08:38
60岁大爷被曝后,黄一鸣特殊嗜好照片曝光,这次王思聪也救不了她

60岁大爷被曝后,黄一鸣特殊嗜好照片曝光,这次王思聪也救不了她

林轻吟
2026-05-20 14:23:20
一只瘦小的猪蹄,距今2000多年了,汉代士兵却来不及吃掉

一只瘦小的猪蹄,距今2000多年了,汉代士兵却来不及吃掉

收藏大视界
2026-05-18 18:28:57
56票:50票,赖清德弹劾案结果公布,中国大陆对赖清德的称呼变了

56票:50票,赖清德弹劾案结果公布,中国大陆对赖清德的称呼变了

流史岁月
2026-05-20 13:50:03
突发!离队!才一年!再见了弗拉格

突发!离队!才一年!再见了弗拉格

左右为篮
2026-05-20 07:45:11
徐威没想到!张怡宁13岁女儿徐俏俏,如今成了两口子最大的骄傲

徐威没想到!张怡宁13岁女儿徐俏俏,如今成了两口子最大的骄傲

蹲坑看世界
2026-05-20 12:28:57
“倒水”般的大暴雨,下到破纪录!“将蔓延上千公里”

“倒水”般的大暴雨,下到破纪录!“将蔓延上千公里”

网络易不易
2026-05-20 10:51:49
黄奇帆:合理调节我国出口顺差规模,人民币汇率可适度升值,适度延长带薪休假时长

黄奇帆:合理调节我国出口顺差规模,人民币汇率可适度升值,适度延长带薪休假时长

红星资本局
2026-05-19 19:27:17
女装T恤越来越薄,都快变透视装了,夏天穿白T到底该怎么穿内衣啊?

女装T恤越来越薄,都快变透视装了,夏天穿白T到底该怎么穿内衣啊?

果壳
2026-05-19 12:22:40
电摩价格直接对半砍!大批车型疯狂降价,内行人道出真实缘由

电摩价格直接对半砍!大批车型疯狂降价,内行人道出真实缘由

音乐时光的娱乐
2026-05-20 13:04:56
命中带财库的三大生肖!天生富贵命,今年早晚崛起财神站你身后!

命中带财库的三大生肖!天生富贵命,今年早晚崛起财神站你身后!

毅谈生肖
2026-05-20 11:48:42
外交部:中国坚决反对美国向中国台湾地区出售武器的立场是一贯的、明确的

外交部:中国坚决反对美国向中国台湾地区出售武器的立场是一贯的、明确的

极目新闻
2026-05-18 15:53:11
160人抢1个学位!中签率最低0.6%!阳光分班后,佛山公办更香了?

160人抢1个学位!中签率最低0.6%!阳光分班后,佛山公办更香了?

乐居好房
2026-05-20 09:36:36
汪小菲心酸取关小玥儿,张兰坦然承认,并接受一切事物发生

汪小菲心酸取关小玥儿,张兰坦然承认,并接受一切事物发生

一盅情怀
2026-05-18 17:34:12
火箭打造全新后场!双控卫首发,2神射撑起2阵,新人升任第3控卫

火箭打造全新后场!双控卫首发,2神射撑起2阵,新人升任第3控卫

梅亭谈
2026-05-20 13:50:49
篮协开出100万大罚单!女篮霸主涉嫌打假球被重罚:球员终身禁赛

篮协开出100万大罚单!女篮霸主涉嫌打假球被重罚:球员终身禁赛

篮球快餐车
2026-05-20 11:14:24
大S年轻时房间曝光,太过诡异引人不适,难怪有人曾说活不过50岁

大S年轻时房间曝光,太过诡异引人不适,难怪有人曾说活不过50岁

草莓解说体育
2026-05-11 20:49:33
关注:2026是中国青年就业最难的一年,没有之一!

关注:2026是中国青年就业最难的一年,没有之一!

叶初七
2026-05-20 12:06:51
寿命较长的男人,晨起后一般有3个特征,若你全符合,恭喜很健康

寿命较长的男人,晨起后一般有3个特征,若你全符合,恭喜很健康

奇妙的本草
2026-05-20 12:20:08
温情论调下暗藏性别歧视祸根

温情论调下暗藏性别歧视祸根

烽火瞭望者
2026-05-20 06:23:57
2026-05-20 15:11:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16725文章数 514969关注度
往期回顾 全部

财经要闻

白酒榜|汾酒营收净利双增 口子窖"造富"

头条要闻

媒体:特朗普不希望"台独"倚仗美 马科斯堪称回应得快

头条要闻

媒体:特朗普不希望"台独"倚仗美 马科斯堪称回应得快

体育要闻

不再美丽的阿森纳,终于成为英超冠军

娱乐要闻

舒淇大方承认:卸了妆就是50 岁的模样

科技要闻

一文看懂谷歌I/O2026:谷歌打响智能体大战

汽车要闻

焕新极氪009上市41.38万起 齐家版让MPV回归家庭

态度原创

时尚
房产
本地
公开课
军事航空

为了攻克渐冻症,她把自己活成了“破冰”的人

房产要闻

别被中介带了节奏,你的房子可能比你想的值钱

本地新闻

最近的潮汕人,堪比家里有人考上了清华北大

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

特朗普暂缓打击伊朗 称系应中东三国请求

无障碍浏览 进入关怀版