网易首页 > 网易号 > 正文 申请入驻

计算机|DeepSeek V3发布,加速AI应用落地

0
分享至

文|杨泽原 丁奇 马庆刘 孙竟耀

近日,DeepSeek-V3的正式发版引起AI业内广泛高度关注,其在保证了模型能力的前提下,训练效率和推理速度大幅提升。我们认为,DeepSeek新一代模型的发布意味着AI大模型的应用将逐步走向普惠,助力AI应用广泛落地;同时训练效率大幅提升,亦将助力推理算力需求高增。我们持续看好AI产业链的加速落地机遇,建议重点关注AI应用、AI Infra、AI算力三大主线。

事项:

12月26日,DeepSeek-V3(深度求索)首个版本正式发布并同步开源,已在网页端和API全面上线。其在训练效率和推理速度上相较历史模型有了大幅提升,同时可保证领先的模型能力表现,引起业内高度关注。

模型:数学、代码等能力优异,API性价比较高。

参考官方论文,DeepSeek v3为6710亿参数MoE架构模型,激活37B,在14.8T token上进行了预训练。能力上,模型暂不支持多模态输入,但在通识和专业知识测试集上表现优秀,MMLU pro正确率75.9%,GPQA-Diamond正确率59.1%,达到国内第一梯队,接近Claude 3.5 Sonnet的水平;并且在数学和代码领域测试表现突出,MATH 500正确率90.2%,SWE-bench正确率42.0%,Codeforces得分51.6,超越所有非o系列模型。模型生成速度达到60TPS,是前代模型的三倍。定价上,API定价为输入每百万tokens 0.5元(缓存命中)/2元(缓存未命中),输出每百万tokens 8元,与字节Doubao-pro-256k定价输入每百万tokens 5元,输出每百万tokens 9元的水平相当,在国产模型中性价比较高。

应用:国产模型能力提升、价格下降,支撑全领域AI应用加速。

豆包pro、DeepSeek v3等国产模型连续发布。模型能力上,国产模型在文本和知识能力上接近GPT-4、Claude、Llama等海外前沿模型水平,多模态能力逐步完备,逻辑和代码能力在非o1技术路线下达到可用水平。价格上,国产模型API百万tokens输出普遍定价10元以内,是GPT-4o的1/3甚至更低。我们预计模型性价比持续提升下,国内AI应用依托丰富生态和成熟流量加速各领域落地。其中,Agent模式有望以更长的任务流程、更好的场景理解、更高的自主能力,成为所有互联网用户的数字助手,在企业管理、教育、办公、金融等领域展现应用价值。

算力:DeepSeek训练效率大幅提升,助力推理算力需求高增。

1)训练效率大幅提升,GPT4的训练成本约为DeepSeek V3的6.2倍。根据DeepSeek V3的官方技术文档,本次DeepSeek的训练仅使用了2048个H800 GPU,总训练GPU卡时为2788千小时(其中预训练为2664千小时),平均到每个GPU上,仅为1361小时,约合56.7天。与之相对比,根据英伟达CEO黄仁勋在GTC2024上的演讲内容,GPT-4 MoE使用8000个H100训练了90天,合计约为17280千卡时,相当于DeepSeek V3的6.2倍。

2)训练效率提升归因:我们认为DeepSeek V3训练提效的原因主要包括低精度计算、小参数量、高质量数据等方面。精度方面,根据英伟达官方文档,其GPU的8位精度算力通常是16位精度算力的2倍,因此数据精度从FP16降低到FP8可以贡献一倍效率提升。参数方面,GPT-4 MoE模型总参数量达到1800B,而按照DeepSeek V3官方文档,其总参数量只有671B,约为GPT-4 MoE的1/3,同时,DeepSeek的激活参数大约为37B,而GPT4-MoE每次推理激活的参数量约为280B,二者约为7.57倍关系;数据方面,GPT-4 MoE使用了13万亿(1300B)token,而DeepSeek V3使用的token数量约为14.8万亿(1480B),数据量相差不大,但DeepSeek V3技术文档提及了使用模型生成训练数据等,因此我们认为数据质量或有较大幅度提升。此外,采用负载均衡、更好的流水线策略亦是其官方提及的提升训练效率的重要原因。

3)从推理侧助推AI普惠,带动推理算力需求倍增,打开更广阔算力市场空间。我们认为,DeepSeek模型相比GPT4模型更小的参数量也意味着更低的推理成本,推理成本的降低,将是AI应用普及的前奏,正如4G提速降费给我国移动互联网产业提供了助力。当前AI应用渗透率仍然较低,产业仍在早期,根据我们在2024年12月13日外发的报告《计算机行业“智能网联”系列报告54—算力需求测算:Agent+Sora》,随着Agent成为流量入口,渗透率达到30%左右,全球Agent的推理token数量将增长3个数量级以上,且视频生成与实时视频理解等形态的AI同样有望带来巨量需求增长,并且根据我们对视频生成模型的测算,视频推理算力需求将有望达到训练算力需求的2-3个数量级以上。算力需求的指数级提升与模型训练推理成本的下降将构成产业飞轮,带动全产业链扩张,随着AI进一步普及到日常生活与产业当中,我们认为推理算力需求将仍然驱动AI算力产业链持续增长。

风险因素:

AI核心技术发展不及预期,AI被不当使用造成严重社会影响,企业数据安全风险,信息安全风险,行业竞争加剧。

投资策略:建议关注AI全产业相关投资机会,综合梳理以下投资主线:

1)AI 应用:伴随模型能力升级,Agent等应用形式有望加速落地,带动办公、教育、管理、端侧、具身智能等应用领域公司加速兑现业绩弹性。

2)AI Infra:模型场景化与行业化发展催生数据服务和模型平台需求,产业发展确定性高。

3)AI算力:AI应用加速落地带动推理端算力新需求。

本文源自:中信证券研究

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
常旅客在机场休息室坚决不做的五件事

常旅客在机场休息室坚决不做的五件事

行走的知识库
2025-01-04 00:53:44
被特朗普“盯上”后,格陵兰岛自治政府总理再发声:“有必要”从丹麦独立

被特朗普“盯上”后,格陵兰岛自治政府总理再发声:“有必要”从丹麦独立

环球网资讯
2025-01-04 15:50:12
南方歼36又来了,歼20大编队“护航”

南方歼36又来了,歼20大编队“护航”

三叔的装备空间
2025-01-04 17:28:12
云朵不会因为不能再唱刀郎的四首歌而一蹶不振,相反,凤凰已涅槃

云朵不会因为不能再唱刀郎的四首歌而一蹶不振,相反,凤凰已涅槃

梦野艳齐说人文
2025-01-04 09:38:12
上海市委常委会用一整天时间召开2024年度民主生活会

上海市委常委会用一整天时间召开2024年度民主生活会

澎湃新闻
2025-01-04 22:54:28
44岁的张静初,她在直播做什么?

44岁的张静初,她在直播做什么?

观察鉴娱
2025-01-05 09:40:03
萧山有多少人家开地暖了?多名网友晒12月电费,省电王出现了……

萧山有多少人家开地暖了?多名网友晒12月电费,省电王出现了……

萧内网
2025-01-04 21:34:40
美国再将11家中企列入实体清单!

美国再将11家中企列入实体清单!

EETOP半导体社区
2025-01-04 09:35:13
湖南21岁女孩因长得漂亮,怀疑农村父母是人贩子,坚持要找富豪父母,结果出来后全家沉默了

湖南21岁女孩因长得漂亮,怀疑农村父母是人贩子,坚持要找富豪父母,结果出来后全家沉默了

财经三分钟pro
2024-12-18 17:32:25
美记:史密斯受伤让斯通改变主意,火箭72小时内拿下巴特勒

美记:史密斯受伤让斯通改变主意,火箭72小时内拿下巴特勒

埃文凯尔
2025-01-04 21:30:16
高铁15分钟直达!海景不输巴厘岛,物价不到三亚一半,太宝藏了

高铁15分钟直达!海景不输巴厘岛,物价不到三亚一半,太宝藏了

匿旅
2025-01-04 17:40:24
印度网友:中国是个贫穷且落后的国家!网友:不是落后,实在下不了口

印度网友:中国是个贫穷且落后的国家!网友:不是落后,实在下不了口

笑熬浆糊111
2025-01-05 00:06:20
施工员:丈夫出差我去男闺蜜家喝酒,晚上不想回去,丈夫:离婚

施工员:丈夫出差我去男闺蜜家喝酒,晚上不想回去,丈夫:离婚

施工员小天哥
2025-01-04 08:48:18
诺基亚6600很吸睛:4.7英寸小屏+2亿像素,小巧强悍

诺基亚6600很吸睛:4.7英寸小屏+2亿像素,小巧强悍

小柱解说游戏
2025-01-03 00:12:44
北京报价尼克斯,辽宁签第4外援!丁彦雨航参加补测,深圳1签1裁

北京报价尼克斯,辽宁签第4外援!丁彦雨航参加补测,深圳1签1裁

懂球社
2025-01-05 09:28:24
村干部陆秀兴,递补为省委委员

村干部陆秀兴,递补为省委委员

新京报政事儿
2025-01-05 09:39:31
主场14连胜联赛第一!广厦险胜北控 孙铭徽14+10+15连续两场三双

主场14连胜联赛第一!广厦险胜北控 孙铭徽14+10+15连续两场三双

醉卧浮生
2025-01-04 21:50:00
中美对峙黄岩岛!拜登似乎执意要在卸任之前,把中国拉进场!

中美对峙黄岩岛!拜登似乎执意要在卸任之前,把中国拉进场!

小企鹅侃世界
2025-01-04 14:21:55
于正等多位圈内人声讨赵露思,曝其被打内幕,暗指其撒谎装可怜!

于正等多位圈内人声讨赵露思,曝其被打内幕,暗指其撒谎装可怜!

古希腊掌管月桂的神
2025-01-02 10:20:12
爆冷!文班35+18+4,约基奇41+18+9,保罗创纪录,西部第八易主

爆冷!文班35+18+4,约基奇41+18+9,保罗创纪录,西部第八易主

篮球大视野
2025-01-04 12:40:18
2025-01-05 10:20:49
金融界 incentive-icons
金融界
投资者信赖的财经金融门户网站
5221303文章数 542883关注度
往期回顾 全部

科技要闻

中国政府拟限制磷酸铁锂技术出口

头条要闻

俄乌士兵肉搏画面披露 乌士兵死前请求"让我安静死去"

头条要闻

俄乌士兵肉搏画面披露 乌士兵死前请求"让我安静死去"

体育要闻

76人29分大胜双杀篮网 拉塞尔伤退恩比德28+12+6

娱乐要闻

星光大赏好炸裂!一个比一个抓马

财经要闻

人去楼空!多地被曝关店

汽车要闻

10万元级无图智驾 悦也PLUS全路况实测

态度原创

教育
时尚
本地
艺术
军事航空

教育要闻

妈妈辅导作业时强调,要仔细想,答案是不会自己跳出来的

过年这样穿体面又贵气!真招人喜欢!助你惊艳全场

本地新闻

云游中国|冰雪“祁”缘照进现实,谁懂多震撼

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

军事要闻

以军袭击加沙地带已致至少66人死亡

无障碍浏览 进入关怀版