国内AIGC领域的最大一笔收购案诞生了。创业仅四个多月后,大模型创业公司光年之外被美团以20.65亿元全资收购。
而就在消息传出前几天,光年之外创始人、美团联合创始人王慧文被曝出现健康问题,不得不离岗。4个月之前,王慧文一头扑进大模型时,美团王兴当即表示,要用真金白银去支持这个睡在他下铺的兄弟。而今,王兴更是直接把这个摊子给全盘接手了。
光年之外回归美团的事件,也令数日前一场关于“大模型创业是否还有价值”的讨论,更加引人深思。
6月26日,猎豹移动董事长兼CEO傅盛,和金沙江创投主管合伙人朱啸虎之间,隔空进行了一番“创业价值”的争论。
傅盛在微信上转载了关于朱啸虎的一篇文章。该文引述了朱啸虎的如下观点:“ChatGPT对创业公司很不友好,未来两三年内请大家放弃融资幻想。”但傅盛对此表示反对:“硅谷一半的创业企业都围绕ChatGPT开始了,我们的投资人还能这么无知者无畏。”
接下来,两位大佬展开了一番唇枪舌剑。从表面看来,这是他们站在投资人和创业者不同立场上的意见分歧。但在辩论之后,他们却在另一层面上形成共识——通用大模型之路上,很难再出现像BAT一样的公司了。而光年之外的被收购,似乎也成为了这个观点的佐证之一。
大模型创业,已经太卷了。科技部下属中国科学技术信息研究所发布的《中国人工智能大模型地图研究报告》显示,截至5月28日,国内10亿级参数规模以上基础大模型至少已发布了79个。但现在,新的问题,也随之而来:我们是否需要这么多的大模型?到底什么样的大模型创业才是真正有价值的?火爆的大模型领域,是否也会泡沫碎一地?
01、通用大模型,只能活5家?
曾几何时,再造一个“中国版ChatGPT”成为科技圈竞相追逐的目标。
从今年3月开始,国内科技企业纷纷发布了自己的大模型产品。除了百度、阿里等大厂外,其他二线互联网大佬也按捺不住激情,纷纷跳下海创业。以5000万美元“高调进场”的王慧文多次提出“通用大模型是必干的”;搜狗创始人王小川成立了百川智能,并在不久前发布了70亿参数大模型baichuan-7b。
但现在,关于AI大模型的一些担忧正在逐渐浮出水面。
回顾之前两位大佬的争论,在傅盛的朋友圈发布后不到半个小时,朱啸虎的留言反驳就来了,他认为现在99%的价值都是GPT创造的,所以创业公司在这个领域就没有什么机会,创造不了太多价值了。
傅盛则回应称,通用大模型解决不了所有问题,这就是创业公司的机会,像BAT这样的创业梦,他已经放弃了。
6月27日,朱啸虎又发文解释说,之前的对话造成了很多误解,其实他应该是国内垂直AIGC领域真正出手最多的早期投资人了。他也强调,实际上,自己核心的观点是让大家不要再“迷信”通用大模型——到了明年,GPT-3.5将成为日用品,3年后GPT-4大模型也将如此。
这并不是新鲜的观点了。今年4月,百度董事长李彦宏就表示,国内AI大模型创业公司想成为“下一个OpenAI”的机会很低,没有必要重复造轮子。当时,王小川很不服气,“历史上每次发生大的变化,都有创业公司的机会,并且创业公司会比大公司跑得快。”
但眼下,关于大模型“泡沫”的焦虑,在业界悄然蔓延开来。
今年2月就积极投身大模型创业的出门问问创始人李志飞,在两个月之后表示自己已经是“大模型劝退派”。他认为国内将会有几十家聚焦落地的大模型,“卷出天际,大概率跟上一代AI公司一样商业化异常艰难”。
实际上,大模型对人才和资金密度的需求,远非消费互联网时代的项目可比。据估算,ChatGPT这类大模型的训练一次的成本接近千万美元,运营成本一个月要数百万美元。此外,算力也成为一大制约瓶颈。英伟达曾透露,训练GPT-3大约使用了1000张A100 GPU芯片,该芯片官方价格约1万美元/张。在国内市场上,受制于贸易限制,英伟达高性能芯片供给也严重不足。
大厂之所以能在大模型上狂奔猛进,是基于它们本身的长项:在大算力、算法研发方面的持续投入能力,在人工智能领域的长期积累,在数据和产业场景方面的天然优势。百度和阿里这样的巨头已经占据了先机、开始布局生态的情况下,后续入场的选手们面临的压力也可想而知。
原微软全球执行副总裁、奇绩创坛创始人兼CEO陆奇在一次分享活动中透露,据其了解,国内约有20万张A100芯片,今天的国际头部大模型团队可能需要用1万张H100芯片(H100的性能比A100更高,1万张H100相当于10万张A 100),而从目前的算力情况来看,国内未来能有这样资源体量的团队可能不超过两个。
另一方面,通用大模型的商业化前景仍然不明晰。即使是ChatGPT,大家对它的热情也有点消退了。
利用AI写论文、写代码,ChatGPT在C端应用的铺开,让它在今年年初瞬间“火爆”。其开发厂商OpenAI也在通过开放API端口给开发者,以及对C端用户收费变现。但现在,ChatGPT对C端市场的吸引力正在下降。
根据数据分析工具SimilarWeb的数据,ChatGPT的访问量增速出现明显下降,其环比增长率从今年1月的131.6%下降到了5月的2.8%,并预计在6月可能达到负数。OpenAI还开放了ChatGPT的第三方插件商店,但目前为止,其中大部分插件的下载数量也仅有几万次。
因此,以朱啸虎为代表的投资人们的纠结也就可以理解了:从投资回报率考虑,他们当然期待投出下一个平台级的企业。但目前看来,通用大模型似乎只能是大厂才能“玩得起”的游戏。
时间进入6月之后,关于大模型的市场情绪也出现了明显下跌。
从2月高调入局后,光年之外还没有推出相应的大模型和应用,王慧文就离开了岗位,让外界猜测是否大模型创业“压力太大”。今年端午节前,昆仑万维创始人周亚辉前妻李琼以支持AI大模型为名套现22亿元,引发昆仑万维股价当日暴跌。一系列事情的发生,也给大模型产业的未来,抹上了一丝冷色。
这次浪潮来得突然而猛烈,又缺乏可以对标的对象。尽管截至今年5月底国内已有了79个大模型,但有多少做通用大模型的公司能够在竞争中活下来,尚在未定之天。远望资本创始合伙人、迅雷创始人程浩认为:“中国版ChatGPT”只会在5家公司里产生:BAT+字节+华为。“创业公司和那些借概念炒股价的上市公司,很难有机会。”
在程浩看来,大厂比创业公司有流量、烧得起钱,更重要的是,大厂还拥有“自带场景”的核心优势。对于创业公司,“它们唯一的机会是开源。但是,这一点巨头也能够做到。”他告诉「市界」。
02、大模型创业的机会在哪里?
对通用大模型的创业机会表示悲观之后,朱啸虎建议大部分创业者应当“场景优先,数据为王”。
“如果说国内上半年大模型创业是火热状态的话,那么我可以说,硅谷的热度是它的十倍。”一位大模型领域从业人员说。一位投资人也认可:“在美国,如果一家科技公司没有提到过如何和大模型相结合,反而是奇怪的。”
程浩说,这波技术革命之所以能带动业界的高亢情绪,主要是,和上一次AI浪潮重点集中在计算机视觉领域的发展相比,这轮大语言模型代表的自然语言处理(NLP)技术的进步。这意味着,比起以前机器的视觉能力,现在是AI“大脑”和交互能力得到了提升,ChatGPT更是让终端用户也感知到了这一点。技术突破和前所未有的全新应用结合,能够带来更为广阔的市场机会。
这一点是没有人能否认的。回顾点燃傅盛和朱啸虎争论的“导火索”,是朱啸虎在一次活动中的演讲。他表示,GPT-4大模型问世后,企业服务领域可能还要面对“漫漫无期”的寒冬。但这是因为ChatGPT太强大了,已经拥有使用场景的企业,通过ChatGPT很容易就能为自己的产品加上AI功能。可利用它的玩家多了,这种情况对于创业公司反而是不利的,是一种降维打击。
从这一点上来看,朱啸虎讲得也没有问题。“这类有场景的企业,通过ChatGPT大模型,它们很容易地就能把AI能力加在自己的产品上。”程浩说。对于“AI+”企业来说,大家都能够调用ChatGPT,在大模型上做应用壁垒太低,价值也随之被削薄了,新玩家再要进入的难度也就加大了。
但他也认为,这并不意味着大模型创业价值的消失。正如傅盛所表达的:大模型是公有数据的缩略图,但是公有数据解决不了所有流程。
架构在大模型之上,即使是在细分场景上的创业,或对已有场景效率的提升,都能带来新的机会。这就是创业的价值所在。
开放API端口,让大模型变得更加易用。“任何技术的突破都会存在明、暗两条线。”澜码科技创始人、CEO周健说,“明线是应用场景不断被解锁,暗线是技术应用的成本下降、技术走向平民化。”在他看来,大语言模型技术的不断突破和发展,将使得NLP能力可以如同云计算、水、电等基础设施一样,可以被随需取用。更重要的是,其使用成本将大幅下降,这会改变很多商业逻辑。“对于软件产业来说,大模型让软件的边界变得更加灵活,可以使用自然语言进行交互。”
澜码科技作为大模型产业中的中间层创业公司,就是基于底层的⼤语⾔模型,为企业提供智能体应用平台。通俗一点来说,可以将之理解为提供一个基于大模型的“AI中台”,让企业实现智能调用智能体。例如,澜码科技内部开发了一个行程安排助手,通过分析用户的邮件、微信聊天记录,就能给出下周的行程安排。
在通用大模型上搞不过大厂,创业公司们只好一边拓展新的业务场景,一边也“卷”起了垂直行业大模型。
实际上,对不少行业应用场景而言,通用大模型也并非全然适合。程浩就曾指出,这方面更核心的问题是各行各业都有自己的“Know-How”,而这更多地是在企业自己的私有数据库里。
达观数据副总经理吕文超曾告诉「市界」,对于其服务的多数金融客户而言,使用大模型,基于公网调用数据是具有数据安全问题的,同时,出于成本以及和行业场景更好地结合这方面的考虑,它们对大模型私有化也提出了要求。对此,达观数据也进行了可私有化部署的“曹植”大模型的研发。
在自动驾驶领域,毫末智行也在今年上半年,发布了自动驾驶生成式大模型DriveGPT,中文名为“雪湖·海若”。
通义千问大模型发布时,阿里云智能集团董事长、CEO张勇曾说:“所有行业、所有应用、所有软件、所有服务都值得基于新型人工智能技术、基于AIGC各方面技术支撑、大模型支撑重做一遍。”对于垂直行业中的龙头们来说,这同样也是不应该错过的机会。越来越多的腰部公司,也加入了垂直大模型的赛道。
“GPT”的前缀,开始五花八门,变得越来越丰富。今年5月,学而思宣布进行自研数学大模型MathGPT的研发,面向全球数学爱好者和科研机构。半个月后,深信服发布了国内首个自研安全大模型,成为安全领域GPT技术应用首秀。在房地产领域,我爱我家联合第四范式,推出了业内首个房产经纪大模型。互联网医疗行业中,医联率先推出了医疗大语言模型MedGPT。
事实上,这是大厂们也关注到的趋势。百度、阿里的通用语言大模型,也已经迈入了各行各业。6月19日,腾讯云的大模型终于揭开了面纱。但这次,它并没有发布一个类似ChatGPT的通用大模型,而是将重点放在了行业大模型上。腾讯云公布了其MaaS全景图,依托腾讯云TI平台打造行业大模型精选商店,面向金融、文旅、政务等十大行业,提供了超过50个解决方案。
大模型卷向了千行百业。有业内人士表示,接下来,行业大模型或将迎来一波发布的高潮。
大模型泡沫或许存在。但程浩认为,如果真能实现落地,泡沫也终将消失。陆奇也提出,当前 AI 大模型时代还处于早期阶段,经过高速增长之后,泡沫破裂将是必然现象,然而,在泡沫破裂之后,新的黎明将降临;届时,新一代更强大的企业将从破碎的泡沫中崛起,占据产业制高点。
除了具备先发优势的企业外,对于其他创业者来说,做不成平台级的公司,只要对行业场景的理解能力更强、落地能力更强,未来的商业空间也就越可期待。
即使能像光年之外一样,及时被大厂收购,也未必不是一条很好的路。
(作者 | 杨 洁,编辑 | 孙春芳)
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.