网易首页 > 网易号 > 正文 申请入驻

新版DeepSeek V3深夜突袭!4bit量化版在512GB M3 Ultra上跑出20 tokens/s

0
分享至

整理 | 屠敏

出品 | CSDN(ID:CSDNnews)

没有任何公告、没有发布博客文章、没有营销宣传,就连 README.md 也是空空如也,DeepSeek 悄悄在深夜上线了一款 685B 的大模型——DeepSeek-V3-0324,并直接发布在 Hugging Face(https://huggingface.co/deepseek-ai)。

即使如此低调,该模型一经上线仍然引发了业界广泛关注。

和之前 DeepSeek v3 版本所采用的自定义许可证有所不同,DeepSeek-V3-0324 采用的是 MIT 开源协议,允许开发人员可以在商业项目中使用,并且几乎不受任何限制地对其进行修改。

DeepSeek-V3-0324 依然采用 Mixture-of-Experts(MoE)架构,与传统大模型相比,计算效率大幅提升。其总参数量高达 6850 亿,但实际在特定任务期间仅激活约 370 亿参数,从而降低计算成本。

此外,该模型引入了两项关键技术:

  • 多头潜在注意力(MLA):增强了模型在长篇文本中保持上下文的能力。

  • 多标记预测(MTP):允许每一步生成多个 token。

这两项技术让 DeepSeek-V3-0324 在推理效率和长文本处理能力上表现更优,将输出速度提高了近 80%。

当然,DeepSeek-V3-0324 这一次吸引众人关注,不仅是因为其强大的能力,还因为其部署方式——它可在高端消费级硬件上本地运行,特别是搭载 M3 Ultra 芯片的 Apple Studio。

对此,苹果机器学习工程师、AI 研究员 Awni Hannun 在社交媒体 X 上表示:“4 位量化后的 DeepSeek-V3-0324,在搭载 mlx-lm 的 512GB M3 Ultra 上,推理速度可达每秒 20 个 token!”

虽然说售价 74249 元起的 Mac Studio 并非普通大众级设备,但能够在本地运行如此庞大的模型的能力与通常与最先进 AI 相关的数据中心要求大不相同。

开发者工具专家 Simon Willison 指出,经过 4-bit 量化后,该模型的存储占用减少至 352GB,使其能够在搭载 M3 Ultra 芯片的高端消费级硬件上运行。

Simon Willison 称,如果你有这台机器,就可以用他的开源 llm-mlx 插件(https://github.com/simonw/llm-mlx)运行它,不过其自己还没试过:

llm mlx download-model mlx-community/DeepSeek-V3-0324-4bit
llm chat -m mlx-community/DeepSeek-V3-0324-4bit

这一突破意味着,过去依赖多张 Nvidia GPU、高功耗数据中心运行的大模型,如今可以在功耗不到 200 瓦的 Mac Studio 上运行,挑战了 AI 行业对基础设施需求的传统认知。

除此之外,在这款模型上线之后,很多人也进行了比较。AI 研究员 Xeophon 在 X.com 上表示:“DeepSeek V3 在所有指标上均大幅进步,已是最强的开源非推理模型,超越了 Sonnet 3.5。”

如果更多测试验证这一结论,它的表现甚至可能优于当前商业 AI 领先者 Claude Sonnet 3.5。更重要的是,DeepSeek-V3-0324 完全开源,任何人都可以免费下载使用,而 Sonnet 3.5 仍需要付费订阅。这让 DeepSeek 在开源 AI 生态中更具吸引力。

有业内人士推测,DeepSeek-V3-0324 可能是 DeepSeek-R2 的基础版本。

如果 R2 延续 R1 的发展路径,它或将成为 OpenAI 即将发布的 GPT-5 的有力竞争者。两者的路线截然不同——OpenAI 依赖封闭生态和巨额资金,而 DeepSeek 选择开源和高效计算,AI 未来的竞争格局或将因此改变。

当前,用户可通过多种方式体验这一新模型:

  • 本地运行:模型权重已发布至 Hugging Face(https://huggingface.co/deepseek-ai/DeepSeek-V3-0324),但需强大硬件支持。

  • 云端推理:OpenRouter 提供免费 API 访问,支持对话体验;也有用户猜测 DeepSeek 官方聊天平台(chat.deepseek.com)可能已更新至最新模型,因为感觉体验有所提升。


具身智能正在迎来类百模大战的阶段,NVIDIA 创始人兼 CEO 黄仁勋直言通用机器人的时代已经到来。但关于具身智能,我们仍然还有着许多的疑问,3 月 28 日(星期五)晚 19:30,CSDN《万有引力》栏目特别邀请到了深耕具身智能的专家一起共话《十问具身智能:我们离通用机器人还有多远?》,欢迎朋友们点击预约,一起关注。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一篇《狗日的腾讯》引爆全网!3Q大战,彻底改写中国互联网

一篇《狗日的腾讯》引爆全网!3Q大战,彻底改写中国互联网

流苏晚晴
2026-05-26 18:05:28
孙中山曾称:中国要想在亚洲当大哥,必须把首都搬到这三个地方

孙中山曾称:中国要想在亚洲当大哥,必须把首都搬到这三个地方

浩渺青史
2026-05-27 00:21:06
原版身材就是顶!伊芙体模亲自下场cos

原版身材就是顶!伊芙体模亲自下场cos

奶凶的小霸王
2026-05-26 15:47:03
为什么今年没人提“消费降级”了?

为什么今年没人提“消费降级”了?

黯泉
2026-05-20 17:47:21
真是无耻至极!印尼又想与中国加强人工智能合作!

真是无耻至极!印尼又想与中国加强人工智能合作!

达文西看世界
2026-05-28 11:53:27
湖人易主后启动大清洗,内部人直呼“疯狂”

湖人易主后启动大清洗,内部人直呼“疯狂”

晚风知我意21
2026-05-29 02:02:13
霍震霆苦苦维持的“豪门体面”,被朱玲玲撕得稀碎,王晶早有爆料

霍震霆苦苦维持的“豪门体面”,被朱玲玲撕得稀碎,王晶早有爆料

落雪听梅a
2026-05-28 23:31:11
胡慧中携26岁胖女儿上海同框,母女颜值差距大

胡慧中携26岁胖女儿上海同框,母女颜值差距大

荒野老五
2026-05-28 17:52:12
绝代双骄 38岁梅西与41岁C罗均6次征战世界杯 历史唯二:最后一舞

绝代双骄 38岁梅西与41岁C罗均6次征战世界杯 历史唯二:最后一舞

风过乡
2026-05-29 06:50:54
中俄管道没谈成,普京转头产生大胆想法!先从中国的一个邻国下手

中俄管道没谈成,普京转头产生大胆想法!先从中国的一个邻国下手

璀璨幻行者
2026-05-28 10:16:51
日报:中东政治格局正在迎来新变化

日报:中东政治格局正在迎来新变化

参考消息
2026-05-27 18:48:07
西方人不解!为啥中国改朝换代那么多次,都非要承认自己是中国?

西方人不解!为啥中国改朝换代那么多次,都非要承认自己是中国?

鹤羽说个事
2026-05-28 22:56:57
比预售价狠降3万!蔚来ES9上市即王炸,理想L9还怎么卖?

比预售价狠降3万!蔚来ES9上市即王炸,理想L9还怎么卖?

凡兮说
2026-05-28 12:27:42
这跟光着有啥区别?戛纳闭幕式,真空上阵、副乳突出,露的好辣眼

这跟光着有啥区别?戛纳闭幕式,真空上阵、副乳突出,露的好辣眼

小兰聊历史
2026-05-27 02:42:03
重磅!蒙古高控卫试训雄鹿 首位NBA球员?中国后卫断档太久

重磅!蒙古高控卫试训雄鹿 首位NBA球员?中国后卫断档太久

你看球呢
2026-05-28 10:05:39
连休3天!上海多校通知:下周一放假1天!期末考时间最早6.16开考

连休3天!上海多校通知:下周一放假1天!期末考时间最早6.16开考

一口娱乐
2026-05-29 00:05:42
知名户外主播发生意外,Z疮发作大便失禁,恶臭难挡被取笑

知名户外主播发生意外,Z疮发作大便失禁,恶臭难挡被取笑

新游戏大妹子
2026-05-27 12:54:49
反转再反转!举伞女子俩人并非父女关系,学校承认撒谎了望能谅解

反转再反转!举伞女子俩人并非父女关系,学校承认撒谎了望能谅解

汉史趣闻
2026-05-28 10:30:54
人情世故?阿根廷带了17名4年前旧将+放弃维拉锋霸 詹俊点出3隐患

人情世故?阿根廷带了17名4年前旧将+放弃维拉锋霸 詹俊点出3隐患

风过乡
2026-05-29 07:07:23
东风导弹泄密案!间谍郭万钧一家三口,全部被处以死刑

东风导弹泄密案!间谍郭万钧一家三口,全部被处以死刑

番外行
2026-03-31 08:28:28
2026-05-29 07:44:49
CSDN incentive-icons
CSDN
成就一亿技术人
26588文章数 242292关注度
往期回顾 全部

科技要闻

利润跌27%:快手只剩“可灵”这张牌?

头条要闻

17岁少年吸食笑气还帮KTV老板性侵未成年人 二人获刑

头条要闻

17岁少年吸食笑气还帮KTV老板性侵未成年人 二人获刑

体育要闻

唐斯经历的一切,此刻的他与尼克斯

娱乐要闻

林俊杰七七与大哥嫂子的瓜剪不断理还乱

财经要闻

小米仍需一次创业

汽车要闻

从智驾兜底到自研4nm芯片,再到迪迪虾,比亚迪智能化战略凭什么封神?

态度原创

本地
亲子
时尚
教育
公开课

本地新闻

用剪纸的方式,打开江苏扬州

亲子要闻

孩子没被幼儿园录取没学上!网友:晚生二十年怕是只有幼儿园文凭

光脚、背“外卖盒”、羽毛头饰...早春秀谁赢了?

教育要闻

学生上了高中学习真的很吃力

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版