开源=为爱发电？DeepSeek 们到底怎么赚钱？｜图文|unix|linux|apache|高吞吐量内核|deepseek

开源=为爱发电？DeepSeek 们到底怎么赚钱？｜图文

2025-03-17 18:43:32　来源: 柴知道

北京举报

分享至

这是2024 年的百度——

这是2025 年的百度——

别笑，还是那句话，“人不能被困在 flag 里......小陈你说对吧？”

也不是针对百度。在 DeepSeek 爆火之后，各家巨头、中头、小头都第一时间接入了。由于官网卡到没法儿用，我还氪金买了 API。

蹭热度的，赶热闹的，炒股的，大家都很开心——但没听说谁给 DeepSeek 的开发者付过一分钱，连我们的 API 都是去第三方渠道买的......

我们还问了微博大 V@蚁工厂，他经营的软件公司已经部署 DeepSeek 了，确实一分钱都没给。

那我们不禁好奇，这一堆做开源大模型的都是为爱发电吗？都听说以后要靠“生态”赚钱，这生态到底是什么？

视频版

↓↓ 看完这个视频就知道了 ↓↓

↑↑ 信我，真的超级好看 ↑↑

图文版

虽然都是开源，但不是所有的开源大模型都像 DeepSeek 这样慷慨，这主要看它们遵循哪种开源协议。

Deepseek采用的是最开放的MIT开源协议：

你可以随便把 Deepseek 打包进软件或服务，自用、商用、套壳拿去卖钱都可以，记得署名就行——基本上就是随便用。

另一种同样开放的协议是Apache 2.0。比如大模型六小龙里“智谱”的开源模型，用的就是 Apache 2.0 协议。它跟 MIT 只在署名之类的地方有区别，但都是可以拿去商用的。

并不是所有人都舍得把自己最先进的模型开源出来分享。像马斯克的 xAI ，只以Apache 2.0 协议开源了旧的grok-1，更先进的 grok-2 和 grok-3 都没有开源。

另一个广受欢迎的开源大模型，阿里旗下的Qwen 系列，就比较复杂了：它们大部分用的是Apache 2.0，但Qwen 2.5-3B等个别模型用的是阿里自己制定的Qwen Research协议，要求只能用于研究和评估，商用的话需要单独申请。

而扎克伯格旗下的Llama 系列，限制就更多一点。

比如 llama 3 允许普通人和中小公司商用，如果在 llama 3 发布时，公司已经是一个月活用户超过7 亿的巨头，那就要单独跟 Meta 单独商用许可。按照这个协议，华为、百度、腾讯什么的，就不能像用 deepseek 那样随意部署了——不知道这是不是 llama 日后赚钱的方式之一。

而且 llama 3 的协议里还特地说明，用户不能拿 llama 3 的生成结果，去训练 llama 3 和衍生品之外的其他大模型。总之，是大方中透露着一丝狡黠～

但不管用哪种协议，做开源大模型都要投入大量成本，又给你免费用，到底图什么呢？

当然，有可能人家已经格局打开，就是图一乐。但研发成本总要覆盖吧，钱从哪里来？

如果是自己赚钱的话，那目前最常见的盈利模式是——卖算力，卖苦力，和卖生态。

比如有 6710 亿参数的满血版 DeepSeek R1，至少需要 8 张 H100 或 A100 以上级别的 GPU 才能勉强跑起来。普通人和我们这种囊中羞涩的小团队，根本玩不起。

所以开发大模型的公司就可以把自己的算力出租给你——也就是卖 API，按对话字数（token）收费。

做大模型的基本家家都卖 API。但按照 DeepSeek 官方的收费标准，聊个几百万字才几十块钱，如果是深夜“激情夜话”，还能更便宜。根据 DeepSeek 披露的数据，目前他们卖 API 的理论利润率能达到545%，相当出色，震惊全场。

但这个利润率能维持多久并不好说，因为卖 API 实在太卷了，很多公司现在注册就送几百万 Token。

更重要的是，像我们的 API根本就不是在 DeepSeek 官方买的：因为 DeepSeek 可以免费商用，所以任何一个有算力的公司，都可以部署 DeepSeek，再卖给你 API。卖开源大模型的 API 没有什么门槛，想维持高利润自然也难。

据说 OpenAI 内部，也认为卖 API 没有钱景。

阿里也在最新的财报电话会议中承认，Qwen 靠卖 API 是挣不了钱的。

卖算力不行，还能卖苦力——也就是按照客户需求微调、定制大模型。

比如电商需要智能客服，游戏需要智能 NPC，政府机关需要智能公务员......这都需要结合各行业的需求和数据，微调大模型，获得最佳效果。

像智谱就成功地拿到了一些企业和政府订单，在 2024 年商业化收入翻倍；阿里的 Qwen 据说拿到了国行 iPhone 的订单。

不管是卖算力还是卖苦力，赚的都是辛苦钱。

所以卖生态，可能才是最快最有想象力的赚钱方式。“生态”听起来有点虚，我们不妨来看看阿里的实操示范：

出于保密，或者针对化定制的需求，很多公司需要自行部署开源大模型。但他们也不会自己去买一堆硬件回来，再招人维护，所以最终还是要把大模型部署在云服务器上。

那如果你用的是阿里开源的 Qwen 模型，那最可能部署在哪家的云服务上呢？

当然是阿里云——这正是阿里在财报电话中说的：虽然 Qwen 本身不赚钱，但能引导用户使用阿里云的其他服务，让阿里云整理多赚钱，所以大模型是“云服务中非常非常重要的一部分”。在阿里看来，未来大模型会成为像“电”一样的基础设施，而云计算就像是输送电力的电网，是最清晰的盈利模式。

资本市场显然也认可这一点：在 DeepSeek 爆发后，高涨的算力需求推高了所有云计算板块的股票，直接推动阿里的市值暴涨了 1000 亿——这可能是对大模型构建“生态”来赚钱最好的诠释。

了解科技界的朋友对这样的故事都不会陌生：比如你手机上 Android 操作系统也是开源的。

虽然各家厂商都可以魔改 Android，但 Google 还是能凭借系统组件把用户引入自己的生态系统，然后凭借广告、Google Play 抽成，售卖包括 Gmail 在内的整个 Google 云服务，赚得盆满钵满。

就算不赚钱，做生态对大厂也至关重要。关于这一点，扎克伯格在 2024 年这篇讲 llama 开源为什么有利于 Meta 的文章中说得很清楚：

扎克伯格说，根据 Meta 之前的经验，如果自己家的产品只能放在别人家的生态上，势必会受到很多限制。比如 Facebook 就饱受苹果的“苹果税”“隐私政策”等等的影响，广告收入一度大打折扣。

但通过开源大模型，汇集各方的聪明才智，在短短两三年时间里，开源大模型的表现就已经接近 ChatGPT 了。这能让 Meta 避免大模型市场被闭源厂商所垄断，以免日后再次出现“人在屋檐下，不得不低头”的情况。只要做到这一点，就算大模型不直接赚钱，也是对 Meta 业务的巨大帮助。

所以站在巨头的角度来说，如果可以通过开源巩固自己的生态，是再好不过了；就算做不到，那也要努力通过开源，避免被限制到其他巨头的生态里。也许这才是它们开源大模型的动机。

但最后，我们还是没能回答DeepSeek 这样的“小厂”，到底怎么靠开源挣钱的问题。

好消息是，人家并不需要我们操心：

DeepSeek 的母公司幻方是一家量化基金公司，靠金融投资赚钱。据说深度求索的目标是实现 AGI（通用人工智能），目前不在意盈利问题。所以 DeepSeek 爆火之后，官网一度卡死，连 API 充值通道都关闭了，人家也是安安稳稳过完年才不慌不忙加了算力，因为本来就不靠我们这些普通用户去赚钱。

但坏消息是，以后到底有什么商业模式？目前没人知道。

甚至也不排除一种可能，就是像风靡世界的 Linux 一样，没什么商业模式。

从 1970 年代开始，一些大公司就在开发闭源的 Unix 系统。到了 90 年代，Linus Torvalds 开发了开源的Linux 系统，逐渐蚕食了 Unix 的市场。如今大多数云计算、服务器和移动操作系统，都是基于 Linux 开发的。

那 Linux 赚大钱了吗？并没有。Linux 系统的内核是由 Linus Torvalds 一个人编写的，目前由非营利机构Linux 基金会管理，主要靠大公司缴纳的会员费和社会各界的捐赠过日子。

但科技史会记住 Linux：作为全球首个成功地大规模开源项目，Linux 打破垄断，做到了真正的技术普惠，是科技行业的隐形引擎。

DeepSeek 们也一样，它让我们每个人都能玩到最先进的大模型产品，极大地冲击了闭源大模型的垄断生态，避免最先进的技术只掌握在少数几个巨头的手上。

我们当然希望他们都能赚到钱，但没赚到又怎样？科技史上，注定会有你们的一页。

下期见！

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.