这是2024 年的百度——
这是2025 年的百度——
别笑,还是那句话,“人不能被困在 flag 里......小陈你说对吧?”
也不是针对百度。在 DeepSeek 爆火之后,各家巨头、中头、小头都第一时间接入了。由于官网卡到没法儿用,我还氪金买了 API。
蹭热度的,赶热闹的,炒股的,大家都很开心——但没听说谁给 DeepSeek 的开发者付过一分钱,连我们的 API 都是去第三方渠道买的......
我们还问了微博大 V@蚁工厂,他经营的软件公司已经部署 DeepSeek 了,确实一分钱都没给。
那我们不禁好奇,这一堆做开源大模型的都是为爱发电吗?都听说以后要靠“生态”赚钱,这生态到底是什么?
视频版
↓↓ 看完这个视频就知道了 ↓↓
↑↑ 信我,真的超级好看 ↑↑
图文版
虽然都是开源,但不是所有的开源大模型都像 DeepSeek 这样慷慨,这主要看它们遵循哪种开源协议。
Deepseek采用的是最开放的MIT开源协议:
你可以随便把 Deepseek 打包进软件或服务,自用、商用、套壳拿去卖钱都可以,记得署名就行——基本上就是随便用。
另一种同样开放的协议是Apache 2.0。比如大模型六小龙里“智谱”的开源模型,用的就是 Apache 2.0 协议。它跟 MIT 只在署名之类的地方有区别,但都是可以拿去商用的。
并不是所有人都舍得把自己最先进的模型开源出来分享。像马斯克的 xAI ,只以Apache 2.0 协议开源了旧的grok-1,更先进的 grok-2 和 grok-3 都没有开源。
另一个广受欢迎的开源大模型,阿里旗下的Qwen 系列,就比较复杂了:它们大部分用的是Apache 2.0,但Qwen 2.5-3B等个别模型用的是阿里自己制定的Qwen Research协议,要求只能用于研究和评估,商用的话需要单独申请。
而扎克伯格旗下的Llama 系列,限制就更多一点。
比如 llama 3 允许普通人和中小公司商用,如果在 llama 3 发布时,公司已经是一个月活用户超过7 亿的巨头,那就要单独跟 Meta 单独商用许可。按照这个协议,华为、百度、腾讯什么的,就不能像用 deepseek 那样随意部署了——不知道这是不是 llama 日后赚钱的方式之一。
而且 llama 3 的协议里还特地说明,用户不能拿 llama 3 的生成结果,去训练 llama 3 和衍生品之外的其他大模型。总之,是大方中透露着一丝狡黠~
但不管用哪种协议,做开源大模型都要投入大量成本,又给你免费用,到底图什么呢?
当然,有可能人家已经格局打开,就是图一乐。但研发成本总要覆盖吧,钱从哪里来?
如果是自己赚钱的话,那目前最常见的盈利模式是——卖算力,卖苦力,和卖生态。
比如有 6710 亿参数的满血版 DeepSeek R1,至少需要 8 张 H100 或 A100 以上级别的 GPU 才能勉强跑起来。普通人和我们这种囊中羞涩的小团队,根本玩不起。
所以开发大模型的公司就可以把自己的算力出租给你——也就是卖 API,按对话字数(token)收费。
做大模型的基本家家都卖 API。但按照 DeepSeek 官方的收费标准,聊个几百万字才几十块钱,如果是深夜“激情夜话”,还能更便宜。根据 DeepSeek 披露的数据,目前他们卖 API 的理论利润率能达到545%,相当出色,震惊全场。
但这个利润率能维持多久并不好说,因为卖 API 实在太卷了,很多公司现在注册就送几百万 Token。
更重要的是,像我们的 API根本就不是在 DeepSeek 官方买的:因为 DeepSeek 可以免费商用,所以任何一个有算力的公司,都可以部署 DeepSeek,再卖给你 API。卖开源大模型的 API 没有什么门槛,想维持高利润自然也难。
据说 OpenAI 内部,也认为卖 API 没有钱景。
阿里也在最新的财报电话会议中承认,Qwen 靠卖 API 是挣不了钱的。
卖算力不行,还能卖苦力——也就是按照客户需求微调、定制大模型。
比如电商需要智能客服,游戏需要智能 NPC,政府机关需要智能公务员......这都需要结合各行业的需求和数据,微调大模型,获得最佳效果。
像智谱就成功地拿到了一些企业和政府订单,在 2024 年商业化收入翻倍;阿里的 Qwen 据说拿到了国行 iPhone 的订单。
不管是卖算力还是卖苦力,赚的都是辛苦钱。
所以卖生态,可能才是最快最有想象力的赚钱方式。“生态”听起来有点虚,我们不妨来看看阿里的实操示范:
出于保密,或者针对化定制的需求,很多公司需要自行部署开源大模型。但他们也不会自己去买一堆硬件回来,再招人维护,所以最终还是要把大模型部署在云服务器上。
那如果你用的是阿里开源的 Qwen 模型,那最可能部署在哪家的云服务上呢?
当然是阿里云——这正是阿里在财报电话中说的:虽然 Qwen 本身不赚钱,但能引导用户使用阿里云的其他服务,让阿里云整理多赚钱,所以大模型是“云服务中非常非常重要的一部分”。在阿里看来,未来大模型会成为像“电”一样的基础设施,而云计算就像是输送电力的电网,是最清晰的盈利模式。
资本市场显然也认可这一点:在 DeepSeek 爆发后,高涨的算力需求推高了所有云计算板块的股票,直接推动阿里的市值暴涨了 1000 亿——这可能是对大模型构建“生态”来赚钱最好的诠释。
了解科技界的朋友对这样的故事都不会陌生:比如你手机上 Android 操作系统也是开源的。
虽然各家厂商都可以魔改 Android,但 Google 还是能凭借系统组件把用户引入自己的生态系统,然后凭借广告、Google Play 抽成,售卖包括 Gmail 在内的整个 Google 云服务,赚得盆满钵满。
就算不赚钱,做生态对大厂也至关重要。关于这一点,扎克伯格在 2024 年这篇讲 llama 开源为什么有利于 Meta 的文章中说得很清楚:
扎克伯格说,根据 Meta 之前的经验,如果自己家的产品只能放在别人家的生态上,势必会受到很多限制。比如 Facebook 就饱受苹果的“苹果税”“隐私政策”等等的影响,广告收入一度大打折扣。
但通过开源大模型,汇集各方的聪明才智,在短短两三年时间里,开源大模型的表现就已经接近 ChatGPT 了。这能让 Meta 避免大模型市场被闭源厂商所垄断,以免日后再次出现“人在屋檐下,不得不低头”的情况。只要做到这一点,就算大模型不直接赚钱,也是对 Meta 业务的巨大帮助。
所以站在巨头的角度来说,如果可以通过开源巩固自己的生态,是再好不过了;就算做不到,那也要努力通过开源,避免被限制到其他巨头的生态里。也许这才是它们开源大模型的动机。
但最后,我们还是没能回答DeepSeek 这样的“小厂”,到底怎么靠开源挣钱的问题。
好消息是,人家并不需要我们操心:
DeepSeek 的母公司幻方是一家量化基金公司,靠金融投资赚钱。据说深度求索的目标是实现 AGI(通用人工智能),目前不在意盈利问题。所以 DeepSeek 爆火之后,官网一度卡死,连 API 充值通道都关闭了,人家也是安安稳稳过完年才不慌不忙加了算力,因为本来就不靠我们这些普通用户去赚钱。
但坏消息是,以后到底有什么商业模式?目前没人知道。
甚至也不排除一种可能,就是像风靡世界的 Linux 一样,没什么商业模式。
从 1970 年代开始,一些大公司就在开发闭源的 Unix 系统。到了 90 年代,Linus Torvalds 开发了开源的Linux 系统,逐渐蚕食了 Unix 的市场。如今大多数云计算、服务器和移动操作系统,都是基于 Linux 开发的。
那 Linux 赚大钱了吗?并没有。Linux 系统的内核是由 Linus Torvalds 一个人编写的,目前由非营利机构Linux 基金会管理,主要靠大公司缴纳的会员费和社会各界的捐赠过日子。
但科技史会记住 Linux:作为全球首个成功地大规模开源项目,Linux 打破垄断,做到了真正的技术普惠,是科技行业的隐形引擎。
DeepSeek 们也一样,它让我们每个人都能玩到最先进的大模型产品,极大地冲击了闭源大模型的垄断生态,避免最先进的技术只掌握在少数几个巨头的手上。
我们当然希望他们都能赚到钱,但没赚到又怎样?科技史上,注定会有你们的一页。
下期见!
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.