总结一下海外现在对DeepSeek的看法..|推理|人工智能|deepseek

分享至

　　DeepSeek的出现直接打爆了当前全球市场的主要交易逻辑，下面是我们摘录的全球外资机构/媒体对其观点的精要合集：

　　高盛交易台：这件事的重要性其实并不在于说DeepSeek是中国开发的，或者它迅速登上苹果应用商店的下载榜单，而在于它似乎在AI技术效率上取得了根本性突破。从多个复杂的角度来看，它显著提升了推理的有效性。

　　据某些测量指标显示，其效率比其他模型高出40-50倍。如果能以更少的资源实现更多的功能，必然引发对容量需求的重新思考。这无疑会引发巨大的争论。

　　虽然在半导体设备或AI数据层推理的细微差别上并非专家，但鉴于这一主题此前为市场增加了巨大的市值，我们认为市场可能会迅速逆转。之前被称作“Power Up”的板块如今或将“Power Down”。半导体/AI/科技板块今天可能面临更大压力，或许也能解释为何近期英伟达（NVDA）股价持续回调。

　　 早期资金流动迹象？

　　我们的交易台注意到半导体领域出现了战术性做空的早期迹象，尽管规模尚未显著。我们将密切关注资金流动的进一步发展。

　　 高盛研究： 中国开发的模型在变得更加灵活，计算成本显著降低（例如DeepSeek模型的推理成本大幅下降），这 将为后续更广泛的AI应用/AI扩散提供更多空间。

　　在过去一周内，DeepSeek R1、字节跳动的豆包-1.5 Pro以及Moonshot的Kimi k1.5模型几乎同时发布，引起了投资者的高度关注。这背后是中国AI玩家在基准性能与全球同行相比不断进步，同时显著降低了训练/推理成本和计算资源需求。

　　尽管我们对各模型的性能不发表具体看法，但注意到近期模型改进和成本优化的来源可能包括：

　　 1）专家混合（Mixture-of-Expert，MoE）架构 ，该架构为每项任务使用更少的激活参数；2）对后训练阶段的重视（如深度思考模式和推理能力的引入）；3）成本优化，例如资源高效的训练方法，特别是在高端芯片供应受限/不确定的背景下，中国玩家更注重效率最大化；4）模型的强化学习（RL）功能，这些模型能够通过时间不断自我改进，这是通用人工智能（AGI）的一个重要方面。

　　同时，我们注意到包括DeepSeek R1/V3和阿里巴巴的Qwen在内的中国开源模型，由于其透明度和显著较低的每token价格，自发布以来吸引了广泛的开发者兴趣。

　　 摩根士丹利： 1月24日，包括CNBC和IT Media AI+在内的多家媒体报道称，中国人工智能初创公司DeepSeek于去年12月底以开源软件的形式发布了一款大型语言模型（LLM）。

　　 DeepSeek——中国开发的开源且更便宜的ChatGPT替代品——正在受到越来越多的关注，其搜索量数据有所体现。 DeepSeek在Google上的搜索量现已达到ChatGPT在美国搜索量的39%，以及ChatGPT全球相对搜索量的21%。

　　图：美国和全球ChatGPT与Deepseek的搜索兴趣水平对比

　　 据报道，该模型开发耗时2个月，成本不到600万美元，使用Nvidia H800芯片开发。 文章指出，根据第三方基准测试，新模型的准确性优于Llama3.1、GPT-4o和Claude Sonnet 3.5。同时，DeepSeek的“r1”推理模型在许多类别中也超越了OpenAI最新的“o1”模型。

　　尽管我们尚未核实这些报道的真实性，但如果上述内容属实，并且先进的LLM确实能够以之前投资成本的一小部分开发出来，那么生成式AI的运行最终可能会从超算缩减到工作站、办公室计算机，甚至是个人电脑。

　　这种趋势可能会推动对相关产品（芯片和半导体设备）的需求增加，从而使半导体设备行业（SPE）从生成式AI需求的扩散中受益。

　　美银：中国的DeepSeek模型竞争力十足，但新规（美国最新的AI战略、半导体出口管制政策，以及近期的AI扩散框架）可能削弱其未来发展潜力；

　　瑞银：中国近期发布的生成式AI模型，例如字节跳动的Doubao和DeepSeek v3，因其在推理能力和多模态（如视觉、语音和视频生成）方面的显著提升而引发市场关注。

　　第三方基准测试显示，中国领先的基础模型正逐步缩小与OpenAI的GPT-4o之间的性能差距。此外，这些模型在训练和推理成本上显著降低，得益于软硬件创新。

　　例如，DeepSeek v3的6710亿参数模型仅以600万美元的计算预算完成训练，仅为Meta Llama-3成本的十一分之一，其高效的训练能力让市场大为惊叹。

　　图：Deepseek的成本比较

　　值得注意的是，针对垂直行业和轻量化边缘计算的模型也在蓬勃发展，它们为各类行业客户和消费电子提供了更具成本效益和定制化的解决方案，其中一些甚至具备早期代理功能。

　　更高的AI成本效率或将吸引更多行业参与者：DeepSeek的研究表明，其在2048台H800 GPU上实现全球领先性能的能力引发了关于训练效率、AI可及性和竞争力的市场讨论。

　　我们认为，LLM在训练和推理技术上的创新可能会降低生成式AI应用的进入门槛和采用难度，从而吸引更多的供应商和用户进入市场。行业调查显示，由于采用成本的降低，AI生态系统和客户兴趣正在快速增长。

　　2025年AI相关资本开支是否会继续增长？

　　是的。DeepSeek在2048台H800 GPU上实现领先性能的能力引发了关于LLM训练效率、AI可及性和竞争力的市场讨论。我们预计2025年AI相关资本开支将因以下三大原因加速增长：

　　1）DeepSeek的创新将通过降低成本实现AI的普及化，使更多公司能够参与。

　　2）随着模型规模和复杂性的不断提升，仍需要更大的GPU集群。

　　3）更高的AI采用率可能会带动AI推理GPU需求的快速增长。

　　基础模型在推理和多模态能力上取得重大进展

　　近期的前沿模型更新中，一些推理模型（如OpenAI o1）在数学和编码能力上取得了显著进展，例如Moonshot k0-math和DeepSeek R1。这些模型的高级推理能力不仅减少了幻觉现象（错误输出）的频率，还在代理推理和规划方面表现出色。图像和视频生成模型在图像质量、3D建模和复杂提示的语义理解方面也有了明显提升。此外，大模型在视觉推理能力上的进步还催生了新的边缘应用和用户界面创新。

　　DeepSeek等中国模型的创新和显著的成本效益不仅推动了行业的发展，还可能重塑AI市场格局，推动AI技术的普及化和更广泛的应用。随着生成式AI的快速发展，相关技术的突破将带来更多资本投入和市场活力。

　　汇丰：中国不仅公有云AI模型API的成本在下降，开源大语言模型（LLM）的训练成本也因技术进步而不断降低。2023年12月，中国AI初创企业高飞旗下的DeepSeek发布了其新开源LLM DeepSeek-v3，在性能上接近海外领先的内部模型（如GPT-4o和Claude-3.5-Sonnet），但训练所需的计算成本仅约600万美元，为同类模型的约10%。

　　William Blair：从地缘政治角度来看，美国正日益陷入与中国的AI军备竞赛，两国都在努力实现通用人工智能（AGI）。本周早些时候中国发布的DeepSeek-R1模型（一个开源、低成本的中国模型，与OpenAI的o1模型具备竞争力）进一步凸显了中国在这一领域仍然是一个强大的竞争对手。

　　Drivingeco：DeepSeek-R1不仅是技术上的突破，也是开源项目在人工智能领域日益深远影响的标志。其先进的架构和低成本使得高质量的推理工具变得更加普及，能够惠及更多的用户和企业。

　　 这一进展可能还会影响对专有模型的研发思路，迫使行业领导者重新审视其定价和可访问性策略。 凭借效率、性能与开放性相结合的优势，R1可能会重新定义市场对AI推理模型的期待标准。

　　展望未来， DeepSeek-R1为AI创新树立了新的标杆，证明了效率与性能可以与可访问性并存。 在关键基准测试中的成功以及其对经济的潜在影响，使其成为在以专有模型为主导的市场中的一项颠覆性工具。

　　随着行业的发展，R1可能为人工智能研发铺设出一条更加协作和可持续的道路，从而惠及开发者和终端用户。通过其开源许可和对效率的关注，DeepSeek-R1不仅与当前的行业领导者竞争，还为人工智能未来的发展树立了新的愿景。

　　 彭博： DeepSeek质疑AI的资本回报率（ROIC）

　　 纳斯达克今晨下跌4%，导火索是周末新闻 ：由中国量化基金创始人梁文峰于2023年创立的AI初创公司DeepSeek发布了一篇详细论文，阐述如何用600万美元的预算构建一个能够在无人工监督下自动学习和改进的大型语言模型。

　　相比之下，OpenAI在类似产品上每年花费50亿美元；谷歌预计2024年的资本支出将飙升至500亿美元以上；微软仅投资OpenAI就已支出超过130亿美元。

　　与此同时，其他中国AI项目也正在快速崛起，表明中国在AI领域的能力正迅速提升，这可能颠覆此前关于中美技术差距的认知。前谷歌CEO埃里克·施密特承认了这一变化，并指出中国在最近几个月已大幅赶上。

　　 WSJ： 强大的开源模型兴起，使开发者能够以更少的投入利用现有技术，从而 让小型团队也能具备竞争力。DeepSeek的策略是基于现有模型迭代改进，而非从零开始，这使其能够更高效地缩小差距。 这种方法引发了对单一模型高投入可持续性的质疑，尤其是OpenAI在获得大量资金支持的情况下依然未实现盈利。

　　随着AI格局的演变，创造性解决方案的重要性可能与资本投入同样重要。OpenAI正面临日益加剧的压力，需证明其模型成本的合理性，而这种动态变化表明，构建AI模型可能成为一场“财务陷阱”

　　 CNBC： 中国新AI模型DeepSeek如何威胁美国主导地位， 一家鲜为人知的中国AI实验室最近引发了硅谷的恐慌。这家名为DeepSeek的实验室发布了一款AI模型，不仅在性能上超越了美国最先进的模型，而且开发成本更低，所需芯片性能也不如对手。DeepSeek于去年12月底推出了一款免费且开源的大语言模型。据称，这款模型仅用了两个月时间开发，耗资不到600万美元，使用的是英伟达性能较低的H800芯片。

　　 这一进展引发了关于美国在人工智能领域全球领先地位是否正在缩小的担忧，也对美国科技巨头在AI模型和数据中心上的巨额投入提出了质疑。 在一系列第三方基准测试中，DeepSeek的模型在复杂问题解决、数学和编程等领域的准确性上，超越了Meta的Llama 3.1、OpenAI的GPT-4o以及Anthropic的Claude Sonnet 3.5。周一，DeepSeek发布了名为r1的推理模型，在许多第三方测试中也胜过了OpenAI最新的o1模型。

　　微软首席执行官萨提亚·纳德拉周三在瑞士达沃斯世界经济论坛上表示：“看到DeepSeek的新模型实在令人印象深刻。他们在开发一款能够高效推理并极具计算效率的开源模型方面做得非常出色。我们必须非常严肃地看待来自中国的这些进展。”

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.