网易首页 > 网易号 > 正文 申请入驻

一文读懂DeepSeek-V3.2核心技术DSA:API疯狂降价性能不减的背后

0
分享至


DeepSeek 刚刚发布的实验模型 DeepSeek V3.2 引入了自研的稀疏注意力机制DSA,虽然是一个小版本的更新,但API价格最高降幅高达75%,这简直太残暴了


据DS官方的公众号发布,DeepSeek-V3.2-Exp 是一个实验性的版本。是一个迈向新一代架构的中间步骤,V3.2-Exp 在 V3.1-Terminus 的基础上引入了 DeepSeek Sparse Attention,说明deepseek还在憋大招,而这个DSA是非常关键的,deepseek也在公众号说了,作为一个实验性的版本,DeepSeek-V3.2-Exp 虽然已经在公开评测集上得到了有效性验证,但仍然需要在用户的真实使用场景中进行范围更广、规模更大的测试,以排除在某些场景下效果欠佳的可能,诚挚希望广大用户在对比测试中提供宝贵的反馈意见,反馈链接:

https://feedback.deepseek.com/dsa

DSA首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升

那么DSA究竟是如何工作的?

DSA 的两大核心组件

DSA 的设计思想是先筛选,后计算。它将复杂的注意力计算分解为两个协同工作的核心组件:


1.闪电索引器 (Lightning Indexer):一个轻量级的筛选器。它的任务是快速扫描整个上下文,为每个查询(Query)找出最相关的少数关键信息(Key)。为了追求极致的速度,它使用了非常小的键缓存(每个 token 仅 128 维)

2.稀疏多潜在注意力 (Sparse Multi-Latent Attention, MLA):一个重量级的计算器。它只对索引器筛选出的关键信息进行完整维度的注意力计算,从而避免了对海量无关信息的无效计算。它的键缓存更大(每个 token 512 维),以保证计算的精确性

DSA 的四步工作流程

DSA 的整个计算过程可以分解为以下四个步骤:

第一步:查询与键的投影 (Query & Key Projection)

与标准 Transformer 模型类似,输入的隐藏状态(hidden states)首先会被投影到查询(Query)和键(Key)空间,并融入旋转位置编码(rotary embeddings)来保留位置信息

创新之处在于:DSA 在这一步还会从隐藏状态中为每个注意力头(per-head)额外投影出一组权重。这组权重将在后续步骤中用于重新调整注意力得分(logits),让模型可以动态地为不同头分配不同的重要性


第二步:索引器评分 (Indexer Scoring)

闪电索引器开始工作。它使用轻量级的键缓存,快速计算查询(Q)与所有键(K)的点积得分(Q·K),并进行掩码(mask)和缩放(scale)

随后,它会用第一步生成的逐头权重来乘以这些得分。这一步的目的是让模型自主学习并放大那些在当前上下文中更重要的注意力头的信号

为了最大化硬件效率,这个评分过程运行在 DeepSeek 自研的DeepGEMM上,该算子为英伟达的 Hopper 和 Blackwell 架构 GPU 提供了深度优化


第三步:Top-k 选择 (Top-k Selection)

评分完成后,索引器会为每个查询,从整个上下文的所有 token 中,选出得分最高的 2048个 token。这些被选中的 token 被认为是与当前查询最相关的部分

(一个特殊情况:如果上下文的总长度本身就小于或等于 2048,那么索引器会选中所有 token,此时 DSA 的行为等同于全注意力)


第四步:执行稀疏 MLA (Sparse MLA)

最后,轮到重量级的稀疏多潜在注意力(MLA)登场。它会获取第三步筛选出的 2048 个 token 的索引,然后调用高效的 FlashMLA 稀疏计算核(sparse kernel),只在这部分优中选优的数据上执行注意力计算

由于计算范围被大幅缩小,它可以跳过所有不相关的上下文位置,从而极大地提升了计算速度和内存效率


DSA 的设计精髓在于其完美的权衡:

精确性:通过 Top-k 筛选机制,确保了注意力计算集中在最相关的信息上,避免了在无用信息上分散注意力,从而保持了极高的精度

高速度:通过闪电索引器、专门优化的稀疏计算核(FlashMLA)以及更小的缓存设计,极大地降低了计算复杂度和内存占用,实现了闪电般的速度

正如 网友@teortaxesTex所评论的:“AGI 将是稀疏的”。DeepSeek 的 DSA 机制,用一个微型的全注意力索引器作为导航,精准地指导了后续的大规模稀疏计算,这无疑是通往高效通用人工智能的一条极具前景的技术路径。DeepSeek 在注意力机制上的不断探索和果断迭代,也展现了其强大的技术创新能力

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
省了100万欧元!郑智为西海岸敲定巴西外援,一分钱没花,了不起

省了100万欧元!郑智为西海岸敲定巴西外援,一分钱没花,了不起

罗掌柜体育
2026-02-25 10:04:13
轻伤二级有多严重?平顶山打人夫妻或将面临3-7年刑期

轻伤二级有多严重?平顶山打人夫妻或将面临3-7年刑期

民言民语
2026-02-25 09:07:07
限时价16.19万元/双色车身设计 天籁·鸿蒙座舱S380大师版上市

限时价16.19万元/双色车身设计 天籁·鸿蒙座舱S380大师版上市

太平洋汽车
2026-02-24 17:12:57
《飞驰3》夺冠《镖人》成黑马,春节档的宝你押对了吗?

《飞驰3》夺冠《镖人》成黑马,春节档的宝你押对了吗?

TVB的四小花
2026-02-25 09:41:21
张兰曝马筱梅生子细节,对准S家句句戳心,强调和大S子女是一家人

张兰曝马筱梅生子细节,对准S家句句戳心,强调和大S子女是一家人

查尔菲的笔记
2026-02-25 15:43:46
骑士109-94大胜尼克斯 球员评价:5人优秀,2人及格,2人低迷

骑士109-94大胜尼克斯 球员评价:5人优秀,2人及格,2人低迷

篮球资讯达人
2026-02-25 11:31:45
马筱梅晒照曝光细节:和刘诗诗伊能静住同款月子中心,宝宝是反耳

马筱梅晒照曝光细节:和刘诗诗伊能静住同款月子中心,宝宝是反耳

离离言几许
2026-02-25 00:04:08
8000元相亲餐男子尿遁逃单!女子被迫买单,婚介甩锅:与我们无关

8000元相亲餐男子尿遁逃单!女子被迫买单,婚介甩锅:与我们无关

今朝牛马
2026-02-01 21:14:04
全国统一执行!3月1日起,公职人员戴上紧箍咒,老百姓迎来大便利

全国统一执行!3月1日起,公职人员戴上紧箍咒,老百姓迎来大便利

墨印斋
2026-02-24 19:49:07
“太恐怖,iPhone半夜自己给陌生人打47分钟电话!”

“太恐怖,iPhone半夜自己给陌生人打47分钟电话!”

都市快报橙柿互动
2026-02-25 11:28:41
墨西哥女孩不听亲友劝阻远嫁中国,断了往来,5年后全家求援助

墨西哥女孩不听亲友劝阻远嫁中国,断了往来,5年后全家求援助

雅俗共赏1
2025-09-03 14:00:28
墨毒枭悬赏杀军人?48小时后墨军万人部队压境,复仇火苗掐灭!

墨毒枭悬赏杀军人?48小时后墨军万人部队压境,复仇火苗掐灭!

孙錫北漂拍客
2026-02-25 07:08:31
挑衅?赫伊森4天后更新社媒,转发了一张2个猴子的图片,仍不道歉

挑衅?赫伊森4天后更新社媒,转发了一张2个猴子的图片,仍不道歉

风过乡
2026-02-25 05:48:56
一场最糙的晚会,AI含量为0,甚至还有演出事故,让人想起84年春晚

一场最糙的晚会,AI含量为0,甚至还有演出事故,让人想起84年春晚

大厂观察
2026-02-24 14:04:59
精神小妹的生活原来是这样的!网友:终于知道她们为啥都这么瘦了

精神小妹的生活原来是这样的!网友:终于知道她们为啥都这么瘦了

深度报
2026-02-11 23:35:03
今天夜间北京将迎雨雪天气 明天最高气温降至4℃体感阴冷

今天夜间北京将迎雨雪天气 明天最高气温降至4℃体感阴冷

北青网-北京青年报
2026-02-25 09:00:04
电影《镖人:风起大漠》总票房破9亿

电影《镖人:风起大漠》总票房破9亿

界面新闻
2026-02-25 14:39:15
黎晴的真实身份曝光!原来,这才是蔡孝乾出卖吴石和朱枫的真相

黎晴的真实身份曝光!原来,这才是蔡孝乾出卖吴石和朱枫的真相

完善法
2026-02-25 13:00:28
俺们村里的娜娜

俺们村里的娜娜

细雨中的呼喊
2026-02-24 07:05:54
“让我先走,我去贵州提亲”!江西小伙独自驾车932公里提亲获全网祝福:女友事前不知情,已成功定亲,决定初九订婚!

“让我先走,我去贵州提亲”!江西小伙独自驾车932公里提亲获全网祝福:女友事前不知情,已成功定亲,决定初九订婚!

大象新闻
2026-02-24 10:44:03
2026-02-25 16:44:49
AI寒武纪 incentive-icons
AI寒武纪
专注于人工智能,科技领域
1033文章数 396关注度
往期回顾 全部

科技要闻

“机器人只跳舞,没什么用”

头条要闻

中方就涉乌克兰问题的决议草案投弃权票 中国代表发声

头条要闻

中方就涉乌克兰问题的决议草案投弃权票 中国代表发声

体育要闻

曝雄鹿计划今夏追小卡 字母哥渴望与其并肩作战

娱乐要闻

撒贝宁到沈阳跑亲戚 老婆李白模特身材

财经要闻

GEO乱象:谁为AI营销的泡沫买单?

汽车要闻

750km超长续航 2026款小鹏X9纯电版将于3月2日上市

态度原创

教育
时尚
旅游
房产
本地

教育要闻

刚刚!2026山东单招综评报名,常见问题,流程公布!

普通人穿衣别太老气横秋!这些穿搭给你灵感,保暖耐看两不误

旅游要闻

安徽固镇:春节期间接待游客62.5万人次 旅游总花费3.4亿元

房产要闻

330万人涌入!春节全国楼市,第一个卖爆的区域出现了!

本地新闻

津南好·四时总相宜

无障碍浏览 进入关怀版