国海证券发布计算机行业报告,解读DeepSeek在算法创新和算力需求方面的影响。报告指出DeepSeek通过优化模型结构和训练方法降低训练成本并开源,提升了推理算力需求,可能重塑国产AI估值。尽管短期内对训练侧算力需求有影响,但中长期推理算力需求将持续增长。此外,DeepSeek推动AI应用普及,支持端侧部署,并受到北美厂商重视。
DeepSeek探索出一条“算法创新+有限算力”的新路径,开源AI时代或已至,国产AI估值或将重塑。
Q1:DeepSeek对于算力的影响?——Jevons悖论:短期训练侧算力需求或受影响,但DeepSeek推理价格下降吸引更多用户调用模型,带来英伟达H100 GPU的租赁价格提升,故表明算力需求量短期仍呈提升趋势,中长期推理算力需求有望持续增长。
Q2:文本与多模态对算力的需求差别?——多模态模型大规模应用,或将升级算力需求。Sora将大模型训练数据从大规模的文本/图像,发展到视频数据,提升了新的维度,这或将数倍提升算力需求。
Q3:对芯片未来格局的影响?——训练:NV仍具备计算与生态护城河,DeepSeek带来模型训练算力使用效率提升,NV高等级芯片或主要用于探索AGI;推理:推理化、国产化、ASIC化为三大趋势。
Q4:DeepSeek系列模型为何引起轰动?——技术与开源:DeepSeek优化模型结构(MLA+MOE、MTP)、模型训练方法(DualPipe)、针对性GPU优化(FP8混合精度等)等内容,降低了训练成本,同时进行开源,各下游企业可以直接通过本地部署或云端调用,降低了调用成本。
Q5:模型未来侧重Dense还是Sparse(MOE)?——一个通才(Dense)能够处理多个不同的任务,但一群专家(MoE)能够更高效、更专业地解决多个问题。
Q6:蒸馏模型的定义与发展潜力?——蒸馏可以减少原本大参数模型部署的硬件需求高、推理时间长、成本高昂的缺点,更有利于本地部署、推理业务、应用与端侧发展。
Q7:多模态的演进路径?——AI大模型技术和应用逐渐从文本扩展至更多模态。
Q8:DeepSeek发生后对应用侧的影响?——DeepSeek在推动降本、强推理等驱动下,有望加速AI应用普及度迎来跨越式提升。
Q9:DeepSeek发布对于端侧的影响?——DeepSeek决定支持用户进行“模型蒸馏”,已更新线上产品的用户协议,有望加速AI在端侧进程,未来手机、PC、小型设备等端侧或可部署。
Q10:北美增加Capex的用意,以及对deepseek的看法?——北美CSP厂商增加资本开支至服务器与数据中心,继续发展模型预训练与推理侧,重视deepseek技术与发展。
关注互联互通社区公众号,回复以下编号,可快速下载相关专题报告合辑。
DEEP001:Deepseek,国产AI应用的“诺曼底时刻”
DEEP002:DeepSeek,技术颠覆or创新共赢
DEEP003:DeepSeeK开启AI算法变革元年
DEEP004:Deepseek发布R1模型,OpenAI推出智能体“Operator”
DEEP005:DeepSeek:从入门到精通
DEEP006:DeepSeek 15天指导手册——从入门到精通
DEEP007:DeepSeek R1深度解析及算力影响几何
DEEP008:DeepSeek激活创新竞争,AI应用迎来“安卓时刻”
DEEP009:DeepSeek 爆火过程详细报告
DEEP010:深度解读DeepSeek:原理与效应
DEEP011:DeepSeek如何赋能职场应用
DEEP012:DeepSeek-R1颠覆性在于实现AI平权,重估资产价值
DEEP013:2025普通人如何抓住DeepSeek红利
DEEP014:DeepSeek研究框架
DEEP015:DeepSeek:从入门到精通(7大场景+50案例+全套提示词)
DEEP016:DeepSeek入门宝典,共4册
DEEP017:DeepSeek十问十答
DEEP018:DeepSeek行业应用实践报告
DEEP019:DeepSeek使用教程蓝皮书:从入门到进阶完整指南
DEEP020:DeepSeek+DeepResearch应用报告
DEEP021:适合投资人的DeepSeek分析报告
DEEP022:DeepSeek火爆全球-AI生态加速繁荣
DEEP023:DeepSeek与AI幻觉研究报告
DEEP024:DeepSeek模型本地部署与应用构建
DEEP025:DeepSeek系列报告之AI+医疗
DEEP026:DeepSeek:全球AI影响(应用)
DEEP027:2025年DeepSeek行业级应用白皮书
DEEP028:DeepSeek行业应用案例集
DEEP029:详解DeepSeek:模型训练、优化及数据处理的技术精髓
DEEP030:2025年DeepSeek背景、模型技术及其对AI行业的影响分析报告
DEEP031:DeepSeek与AIGC应用
DEEP032:DeepSeek提示词工程和落地场景
DEEP033:DeepSeek大模型赋能高校教学和科研
DEEP034:DeepSeek完全实用手册-从技术原理到使用技巧
DEEP035:Deepseek背景综述及在金融领域应用场景初探
DEEP036:DeepSeek自学手册:从理论到实践
DEEP037:山东大学:DeepSeek应用与部署
DEEP038:DeepSeek零基础入门手册
DEEP039:DeepSeek 搞钱指令库
DEEP040:DeepSeek大模型及其企业应用实践
DEEP041:湖南大学:我们该如何看待DeepSeek
DEEP042:DeepSeek在金融银行的应用方案
DEEP043:DeepSeek大模型生态报告
DEEP044:2025DeepSeek技术全景解析
DEEP045:DeepSeek给我们带来的创业机会
DEEP046:使用DeepSeek赋能家庭教育
DEEP047:DeepSeek原理与落地应用
DEEP048:DeepSeek私有化部署和一体机
DEEP049:DeepSeek大模型赋能政府数字化转型
DEEP050:DeepSeek企业落地应用讲义精华全版
DEEP051:从DeepSeek到Manus:AI如何重塑企业价值
DEEP052:deepseek对算力产业的影响
DEEP053:DeepSeek模型解读报告
DEEP054:DeepSeek十大关键问题解读
以下是报告部分内容
声明
来源:国海证券,互联互通社区推荐阅读,版权归作者所有。文章内容仅代表作者独立观点,不代表互联互通社区立场,转载目的在于传递更多信息。如涉及作品版权问题,请联系我们删除或做相关处理!
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.