网易首页 > 网易号 > 正文 申请入驻

李彦宏揭开认知误区:开源解决不了效率问题,大模型差距越来越大

0
分享至

白小交 发自 凹非寺
量子位 | 公众号 QbitAI
大模型之间的差距会越来越大!

李彦宏最新内部讲话曝光,一时间引发行业热议。

毕竟在当前各种大模型横扫榜单测试集、多项得分超过GPT-4o的现象中,很容易给人一种假象:下一个GPT-4o、下一个OpenAI就要诞生了

为什么会这么说?李彦宏进一步解释道,大模型的天花板很高,现在距离理想情况还相差非常远,所以模型要不断快速迭代、更新和升级。

这背后需要能几年、十几年如一日地投入,不断满足用户需求,降本增效。

除此之外,他还表示开源模型效率不高,解决不了算力问题,而智能体是大模型最重要的发展方向。

百度一直以来作为大模型应用的先行者,掌舵人李彦宏此次谈话无疑也是给行业带来一份实际意义上的参考。

一起来看看他到底说了什么。

李彦宏内部谈话曝光:三个大模型认知误区

内部谈话中李彦宏提出了三点思考,正好回应了当前正受关注的认知误区:大模型之间的差距在缩小吗?大模型技术已经接近天花板了吗?为什么说商业化模型更有性价比?

首先,大模型差距不是越来越小,而是越来越大。

一上来,李彦宏就反对了外界对大模型能力差距缩小的看法,认为模型之间的差距仍然显著,并且会越来越多。他指出,尽管新发布的模型在测试集上表现良好,但这并不能证明它们与最先进的模型如GPT-4o之间的差距已经缩小。

他解释说,很多模型在发布后,通过打榜、猜测试题目、答题技巧,从榜单上看 ,也许模型的能力已经很接近了,“但到实际应用中,实力还是有明显差距的。”

一方面,模型之间的差距是多维的。模型能力的评估除了包括理解、生成和逻辑推理等多维度,以及相应的成本和推理速度。此外,对测试集的过度拟合可能导致对模型能力的误解。

如今大模型已经来应用阶段,他认为,真正的衡量标准应是模型在实际应用中能否满足用户需求和产生价值。因此在百度实际使用过程中,他不允许技术人员去打榜。

另一方面,模型天花板很高。今天能做到的,距离想要实现的效果还很远,所以模型还需要不断去迭代更新。只有持续几年甚至十几年地投入,才能让模型满足用户需求、满足场景、满足提升效率或降低成本等需求。这也是保持竞争力的关键

由此李彦宏认为,所谓的领先12个月或者落后18个月没有那么重要。哪怕你能保证永远领先竞争对手6个月,那就赢了

其次,开源模型解决不了商业应用中的效率问题

在讲话中,李彦宏强调,开源模型需要用户自行部署和维护,这导致其GPU使用率低,无法有效分担推理成本。而闭源模型通过用户共享资源和分摊研发成本,实现了更高的效率与效果。

目前文心大模型3.5、4.0,GPU使用率都能达到90%多。

正如前面所言,评价一个模型,维度是多方面的,不仅是看到榜单上的多项能力,也要看效果看效率。当大模型加速驶入商业应用之后,在追求高效率和低成本的情况下,开源模型并没有优势。

李彦宏明确表示,在大模型时代,算力的高效利用是决定模型成败的关键,而开源模型无法解决这一问题。

最后,智能体是大模型最重要的发展方向,低门槛让应用转化变得更加直接和高效。

大模型发展过程主要会经历哪几个阶段?在内部讲话中, 李彦宏给出了明确的答案。

首先是的Copilot阶段,辅助人类进行操作;接着是Agent智能体阶段,具备自主使用工具和自我进化能力;最后是AI Worker阶段,能够独立完成多种工作。

其中智能体作为大模型最重要的发展方向,相比于大家都在关注的多模态,尚未形成行业共识。但在百度的产品中,比如文心智能体平台AgentBuilder已经让智能体的潜力已经开始被认可。

而其中低门槛这一特性,让从模型到应用的转化变得简单,促使大量新智能体在百度平台上被创造。

李彦宏强调,借助百度的用户基础和需求,智能体可以更好地满足市场需求,推动其进一步发展。

百度智能体实践已进入深水区

总结下来,李彦宏谈到的这几点思考,如果说前两点,还说的是现在,说的是当下,那么智能体就代表着未来。而这一切的背景前提,正好同当前大模型发展驶入深水区阶段不无关系。

如今随着基础模型更新速度放缓,大模型应用逐渐深入产业,企业面临着更复杂的市场环境和技术挑战。简单的技术迭代已不足以满足市场的多样化需求。

人们对大模型的期待与看法也随之改变,模型的参数量以及榜单分数不再作为模型能力的核心指标,开源不开源其实也并不重要。

产业界对AI的需求,已经不仅仅是单纯的技术追求,解决实际问题才是衡量大模型的唯一标准。在这一过程中,更多问题和挑战不容忽视,比如推理与算力的成本问题,以及处理业务效率等。

那么本身在行业长期且持续投入的百度,面对当前这一命题,自然是给中国众多大模型提供了一份发展参考。

答案就是智能体

所以这次李彦宏内部谈话,其实也不仅仅是关于行业认知,还有来自百度智能体实践的有力验证和体现。

在此之前,李彦宏在多次讲话中强调,智能体代表了AI时代的未来趋势。

作为一个几乎“放之四海而皆准”的大模型应用,智能体不仅门槛低,甚至不需要编程技能,就能让用户轻松开发出功能强大的应用。李彦宏形象地将智能体比作“AI时代的网站”,预示着它将形成一个数百万量级的庞大生态。这种广泛的应用潜力使得智能体成为各行各业的“Super APP”,推动了AI技术的普及和应用。

与之相应的,是百度在智能体领域的布局显著。

通过文心智能体平台AgentBuilder,百度已经吸引了20万开发者和6.3万企业入驻,并在2023年7月免费开放文心大模型4.0。这一举措使得开发者在构建智能体时可以灵活选择适合的模型版本,大大降低了开发的门槛。

并且在短短时间内,百度智能体展现出大模型应用强大的潜力。据百度2024年Q2季度财报,智能体在百度生态的分发量正在快速上升,7月日均分发次数超800万,较5月翻倍。

热门智能体包括内容创作、性格测试和日程规划等,涵盖教育、法律及B2B等多个行业。百度的智能体生态吸引了1.6万家商户参与,形成了用户、开发者和服务商共赢的局面。

李彦宏强调,智能体的发展不仅依赖于技术创新,更需紧密结合用户需求。随着用户对智能体的需求不断上升,使得这些智能体能够快速迭代。而只有智能体生态持续扩展,才能推动AI技术在各个领域的深入应用。

在大模型应用逐渐深入的当下,百度的智能体实践无疑为行业提供了重要的借鉴和启示。

大模型热潮进入洗牌期

今年以来已经明显感知到的是,随着大模型技术的不断发展和应用的深入,行业正在进入一个新的阶段。这个阶段的特点是,大模型玩家格局已基本形成:有自研和可持续研发大模型能力的玩家开始向头部聚集

与此同时,大模型应用和落地开始进入生态建设期

越来越多看好大模型前景的创业者,不再会纠结是不是要自研或者自建大模型的问题,而是更加关注如何利用现有的大模型解决实际的痛点需求和问题。

在这个过程中,智能体作为最小的AI应用实现方式,展现出了巨大的潜力。它低门槛轻量化,能够快速在行业中铺开并实现覆盖,满足效率和成本两大需求。随着基础模型的不断增强,智能体应用可以变得更加简单和广泛。

这也是李彦宏看好智能体的核心原因所在。

通过李彦宏讲话,我们可以看出百度的战略重点正在发生转向。卷基础模型的阶段已经过去,现在更加重要的是如何通过智能体构建起丰富多彩的应用生态,让生态成为百度大模型、文心的护城河。

这意味着,百度将更加重视智能体在应用生态中的价值和意义,通过不断完善智能体平台和工具,吸引更多开发者和企业加入,共同打造一个繁荣的AI应用生态。

未来,智能体将不仅限于内容创作和日程规划等基本功能,会拓展到更多专业领域,如医疗、金融和法律服务等,为用户提供个性化和高效的解决方案。

为了实现这一愿景,企业需要持续投入资源进行技术创新与迭代,不断优化算法和提升用户体验。

当然,在这个过程中也会面临一些重要的课题,比如数据隐私与安全性,智能体的管理和维护等。但是,任何一项技术应用驶入深水区都会面临这样那样的挑战。

随着智能体生态的不断壮大,百度正引领行业走向一个更加智能化和高效的未来,为各行业带来新的机遇与挑战。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
汤淼瘫痪19年,母亲妻子另嫁,9岁女儿陪伴,生活有保障

汤淼瘫痪19年,母亲妻子另嫁,9岁女儿陪伴,生活有保障

嘴角上翘的弧度
2026-05-31 22:47:28
疙瘩汤又火了!调查发现:糖尿病常吃疙瘩汤,或能降低6类并发症

疙瘩汤又火了!调查发现:糖尿病常吃疙瘩汤,或能降低6类并发症

白宸侃片
2026-06-01 12:45:58
直到伊朗下令轰炸美空军基地,全世界才惊觉:中国有句话说得很对

直到伊朗下令轰炸美空军基地,全世界才惊觉:中国有句话说得很对

铁锤侃侃而谈
2026-06-01 14:20:49
徐志胜带女友和父母聚餐,疑好事将近!女友是圈外人,家境优渥

徐志胜带女友和父母聚餐,疑好事将近!女友是圈外人,家境优渥

露珠聊影视
2026-06-01 14:07:15
著名球星、英格兰前国脚被捕!

著名球星、英格兰前国脚被捕!

湖报体育
2026-05-30 16:11:54
“加名字”失败,被从肯尼迪中心“除名”,特朗普表示“震惊”

“加名字”失败,被从肯尼迪中心“除名”,特朗普表示“震惊”

每日经济新闻
2026-05-31 21:56:42
刘德华女儿高调亮相,太漂亮了吧,恐怕是娱乐圈颜值最高的星二代

刘德华女儿高调亮相,太漂亮了吧,恐怕是娱乐圈颜值最高的星二代

草莓解说体育
2026-06-01 13:20:03
油价大跌超500元/吨,今年“最大油价下跌”后,6月4日油价再大降

油价大跌超500元/吨,今年“最大油价下跌”后,6月4日油价再大降

油价早知道
2026-05-30 00:57:42
当了酒店前台才知道的秘密!瓜太多了,吃不过来了!

当了酒店前台才知道的秘密!瓜太多了,吃不过来了!

夜深爱杂谈
2026-05-27 07:50:31
为什么水运比陆运成本低那么多?看完网友的分享太涨知识了!

为什么水运比陆运成本低那么多?看完网友的分享太涨知识了!

另子维爱读史
2026-05-31 08:24:27
伊朗把浓缩铀“快递”到中国,特朗普气得拍桌:这招太阴了!

伊朗把浓缩铀“快递”到中国,特朗普气得拍桌:这招太阴了!

浪子的烟火人间
2026-05-30 10:12:09
扎根南京二十载合法企业遭暴力强拆 省劳模蒋岸川七年维权路漫漫

扎根南京二十载合法企业遭暴力强拆 省劳模蒋岸川七年维权路漫漫

CC说话的人
2026-06-01 09:34:06
女航天员在太空中,怎么能保护自己的隐私?航天女英雄牺牲太大了

女航天员在太空中,怎么能保护自己的隐私?航天女英雄牺牲太大了

黑翼天使
2026-05-30 22:08:41
悲哀!孩子都不在了,家长还在念叨他687分的三模成绩,哭诉遗憾

悲哀!孩子都不在了,家长还在念叨他687分的三模成绩,哭诉遗憾

火山詩话
2026-05-23 07:15:35
访华结束,武契奇带着遗憾离京:签了几十份大单,唯独没有歼10CE

访华结束,武契奇带着遗憾离京:签了几十份大单,唯独没有歼10CE

素衣读史
2026-05-30 21:26:52
超级赢家!29岁登贝莱冲击2世界杯2欧冠2金球 历史无人实现

超级赢家!29岁登贝莱冲击2世界杯2欧冠2金球 历史无人实现

叶青足球世界
2026-05-31 16:37:01
今天,鞠萍姐姐退休了

今天,鞠萍姐姐退休了

澎湃新闻
2026-05-31 22:52:29
小学生“老干部风”穿搭火了,家长无奈吐槽:儿子周岁13,虚岁40

小学生“老干部风”穿搭火了,家长无奈吐槽:儿子周岁13,虚岁40

妍妍教育日记
2026-05-15 08:20:14
中国出重拳,11家“内鬼”企业偷卖稀土遭罚,西方急得跳脚?

中国出重拳,11家“内鬼”企业偷卖稀土遭罚,西方急得跳脚?

阿龙聊军事
2026-05-31 20:34:59
41岁王珞丹现状:住河北深山,不结婚不生子,放弃荣华富贵图啥?

41岁王珞丹现状:住河北深山,不结婚不生子,放弃荣华富贵图啥?

白面书誏
2026-04-20 15:26:26
2026-06-01 16:35:00
量子位 incentive-icons
量子位
追踪人工智能动态
12722文章数 176476关注度
往期回顾 全部

科技要闻

关停三年后,天涯社区今起开放访问

头条要闻

天涯社区重启 推出1999元"新天涯创世成员产品服务包"

头条要闻

天涯社区重启 推出1999元"新天涯创世成员产品服务包"

体育要闻

哭过之后,文班亚马想给波波维奇打电话

娱乐要闻

奚梦瑶婚礼现场图!一双儿女当花童

财经要闻

网红驱蚊产品,标注化妆品竟含农药成分

汽车要闻

上市三周交付3603台!华境S跻身旗舰大六座第一梯队

态度原创

艺术
房产
亲子
旅游
军事航空

艺术要闻

吴镇写竹,清清爽爽

房产要闻

红动五月!全国抢入核心资产,广州盯紧凯旋新世界!

亲子要闻

儿童阶段是干预黄金期,血友病患儿关爱活动助力实现零出血目标

旅游要闻

逛故宫的游客注意了,坤宁宫明起检修请绕行

军事要闻

韩国最大军工企业爆炸 已造成5人死亡

无障碍浏览 进入关怀版