网易首页 > 网易号 > 正文 申请入驻

这个访谈回应了所有AI焦点问题!他是AI最重要论文的联合作者

0
分享至

作者:硬AI

来源:硬AI

AI狂飙突进的时代,真的要结束了吗?

随着scaling law撞墙新闻爆出,全球科技圈、资本市场关于大模型发展触及天花板的讨论愈演愈烈。那么,AI发展是否放缓?后续又将如何发展?商业模式如何突破?

针对一系列焦点问题,人工智能领域最具影响力的论文《Attention Is All You Need》的联合作者,Cohere联合创始人兼CEO Aidan Gomez在访谈中分享了自己对AI发展的深度见解。

他认为,LLM发展已进入平台期,而推理能力将成为未来突破口,并将带来新的商业模式和市场机遇。同时,他也提醒投资者警惕模型价格倾销,关注 AGI 发展趋势。

对于scaling law放缓的问题,Gomez认为,简单扩大模型规模带来的边际效益正在递减。以绘画为例,Gomez指出 LLM 的发展初期如同用大笔触快速完成基础构图,但随着模型需要处理更精细的任务,如同绘画需要越来越细的笔触来完善细节,模型改进需要的数据也越来越精细,这导致获取高质量数据的成本越来越高,最终模型的规模化发展将受限于人类知识的边界和专家数据的获取难度。

推理能力方面,Gomez表示,推理能力可以让 LLM 不仅简单地记忆输入输出对,还可以像人类一样进行多步骤的思考和推理,解决更复杂的问题。而这,这带来了一个革命性的变化——企业不必再为提升AI能力投入巨额固定成本,而是可以通过增加推理时间来实现。用通俗的话说,就是从"买更大的算力"变成了"多给AI一点思考时间"。

Gomez还认为,推理时间计算量的增加还将对芯片层和数据中心建设产生影响,未来需要开发更适合处理推理任务的芯片,以及建设更适合分布式计算的数据中心。


以下是访谈内容精编:

1.LLM发展进入平台期,推理能力将成未来突破口

问:LLM 发展是否已经进入平台期?未来的突破口在哪里?

Gomez:

  • LLM 性能提升已进入平台期,边际效益递减。简单地扩大模型规模带来的性能提升有限,就像油画创作从大笔触的构图阶段进入到需要用越来越细的笔触来完善细节的阶段。
  • 模型改进需要越来越精细的数据。LLM 在处理简单、常见的任务时可以快速提升,但在处理更专业、敏感的领域(如科学、数学)时,性能提升的难度越来越大,因为需要更精细、专业的数据来训练模型。
  • 推理能力将成为 LLM 未来发展的新突破口。推理能力可以让 LLM 不仅简单地记忆输入输出对,还可以像人类一样进行多步骤的思考和推理,解决更复杂的问题,例如多项式求解。

问:影响模型规模化发展的因素有哪些?

Gomez:

  • 合成数据可以帮助模型在某些领域(如代码、数学)提升性能。因为这些领域的答案易于验证,可以通过合成大量数据来训练模型。
  • 但在其他需要真实世界知识的领域(如生物学、化学),数据的获取难度更大,需要依赖专家知识。
  • 最终,模型的规模化发展将受限于人类知识的边界和专家数据的获取难度。
2. 推理能力将带来新的商业模式和市场机遇

问:推理能力将如何改变行业格局?

答:

  • 推理能力的出现将带来新的商业模式。
  • 客户可以通过增加推理时间计算量来获得更智能的模型,而无需等待数月进行新的模型训练。这意味着客户可以根据需求灵活地调整模型性能,获得更好的产品体验。
  • 这种从资本支出(CAPEX)模式到消费模式的转变将吸引更多客户投资于解决问题,而无需承担高昂的训练成本和时间成本。
  • 推理时间计算量的增加还将对芯片层和数据中心建设产生影响,未来需要开发更适合处理推理任务的芯片,以及建设更适合分布式计算的数据中心。

问:如何理解推理能力?

答:

  • 目前的 LLM 缺乏像人类一样的“内心独白”,无法进行多步骤的推理思考。它们只能根据输入直接给出输出,而不能像人类一样在解决问题时进行思考、尝试、纠错,最终找到解决方案。
  • 推理能力的加入将使 LLM 可以像人类一样进行多步骤的思考和推理。这种能力将通过使用人类数据和合成数据,明确地收集人们的内心想法并进行训练来实现。

问:什么类型的问题更适合使用推理能力解决?

答:

  • 任何需要多步骤解决的问题都更适合使用推理能力来解决。例如,多项式求解,人类在解决这类问题时,需要将其分解成多个步骤,逐步解决,最终得到答案。 而目前的 LLM 只能通过记忆的方式来解决这类问题。

问:市场普遍低估了推理时间计算的哪些方面?

答:

  • 推理时间计算在提供智能方面的作用尚未被市场充分认识。
  • 推理能力的加入为客户提供了一种新的选择:客户可以通过增加推理时间计算量来获得更智能的模型。
3. Cohere: 自主研发模型,打造差异化竞争优势

问:Cohere 为什么选择自主研发模型?

答:

  • 虽然开源模型提供了基础模型,但微调效果不如自主研发。
  • 自主研发能够控制数据和训练过程,为客户提供更多定制化选项。

问:LLM 是否适用于所有领域?

答:

  • 虽然 Transformer 模型可以处理很多问题,但在某些领域可能效率较低,例如图结构数据。
  • 在这些领域,可能需要更专业的模型才能实现更高的效率。
4. 警惕模型价格倾销,关注 AGI 发展趋势

问:市场上 LLM 价格下降是否意味着模型商品化?

答:

  • 市场上出现的模型价格下降并非商品化的标志,而是价格倾销的结果。
  • 模型构建需要高度的技术能力,只有少数公司掌握核心技术。
  • 未来市场将受到增长压力和投资回报率的影响,目前以亏损或免费提供昂贵技术的做法是不可持续的。

问:如何看待 AGI 的发展?

答:

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
特朗普签字了!美国传出风声,中美关系大变,中方表态出人意料

特朗普签字了!美国传出风声,中美关系大变,中方表态出人意料

锦然苍穹
2025-03-13 14:40:13
韩娱地震!金秀贤金赛纶关系实锤,家属晒出女方16岁医院堕胎记录

韩娱地震!金秀贤金赛纶关系实锤,家属晒出女方16岁医院堕胎记录

白面书誏
2025-03-13 18:12:45
单场造4球!“圆神”安东尼全场表现:长途奔袭破门+助攻+两策动

单场造4球!“圆神”安东尼全场表现:长途奔袭破门+助攻+两策动

直播吧
2025-03-14 06:07:14
为什么劝中年男人“衣不塞裤腰、裤不紧身”?看55岁雷军就知道了

为什么劝中年男人“衣不塞裤腰、裤不紧身”?看55岁雷军就知道了

校长侃财
2025-03-10 10:03:36
中超接到通知!奥斯卡身份问题被查,归化失败非退籍、金钱问题

中超接到通知!奥斯卡身份问题被查,归化失败非退籍、金钱问题

小金体坛大视野
2025-03-14 09:30:03
实锤致敬小米!iPhone 17 Pro Max模具曝光

实锤致敬小米!iPhone 17 Pro Max模具曝光

泡泡网
2025-03-13 11:07:16
CBA最新消息!曝弗格常规赛报销,迪亚洛被罚,北控或换掉萨林杰

CBA最新消息!曝弗格常规赛报销,迪亚洛被罚,北控或换掉萨林杰

体坛瞎白话
2025-03-14 08:38:43
小杨阿姨感慨湾湾物价贵,一斤草莓850元,难怪大S当初要记账!

小杨阿姨感慨湾湾物价贵,一斤草莓850元,难怪大S当初要记账!

古希腊掌管月桂的神
2025-03-13 21:10:32
心理学有个词叫"蔡格尼克效应":让人对你念念不忘的底层逻辑

心理学有个词叫"蔡格尼克效应":让人对你念念不忘的底层逻辑

化作人间一帘梦
2025-03-11 13:00:46
罢免34:0,赖清德下台倒计时?蓝营主席也要换人,赵少康态度明确

罢免34:0,赖清德下台倒计时?蓝营主席也要换人,赵少康态度明确

史行途
2025-03-13 11:38:13
格陵兰议会选举结果出炉,独立派遥遥领先,美国这回要吃定丹麦了

格陵兰议会选举结果出炉,独立派遥遥领先,美国这回要吃定丹麦了

碳基生物关怀组织
2025-03-13 19:52:18
女老师穿“孕妇装”上课被举报,家长:薄如蝉翼,孩子上课都分心

女老师穿“孕妇装”上课被举报,家长:薄如蝉翼,孩子上课都分心

星辰生肖馆
2025-03-06 00:41:05
赵本山徒弟程野奶奶去世,葬礼豪华连办三天,杨树林吹唢呐太热闹

赵本山徒弟程野奶奶去世,葬礼豪华连办三天,杨树林吹唢呐太热闹

二月侃事
2025-03-13 14:39:02
毛主席晚年:如果蒋介石主动回来,我愿意亲自去机场接他

毛主席晚年:如果蒋介石主动回来,我愿意亲自去机场接他

历史小书生
2025-03-13 09:44:50
郑爽发长文回应生子传闻,和母亲游泳池玩水,美国网友爆她快生了

郑爽发长文回应生子传闻,和母亲游泳池玩水,美国网友爆她快生了

南城无双
2025-03-12 13:22:34
广东明确:不得强制购买!

广东明确:不得强制购买!

潮TV
2025-03-13 16:58:33
特朗普威胁普京:不签,我将搞垮俄经济!乌总司令:库尔斯克苏贾市被空袭,几乎全毁!波兰要求美国在波部署核武

特朗普威胁普京:不签,我将搞垮俄经济!乌总司令:库尔斯克苏贾市被空袭,几乎全毁!波兰要求美国在波部署核武

每日经济新闻
2025-03-13 16:59:11
新一代奥迪A6实车惊艳:连车标更新了!25款A6L最低28.4万抄底吗

新一代奥迪A6实车惊艳:连车标更新了!25款A6L最低28.4万抄底吗

蜗牛车志V
2025-03-13 14:41:10
果然是闷声发大财,都是“野”路子

果然是闷声发大财,都是“野”路子

东洲清
2025-03-13 16:39:30
看过马少骅扮演的邓小平后,叶帅之子打去电话:你认识老爷子?

看过马少骅扮演的邓小平后,叶帅之子打去电话:你认识老爷子?

红色先驱
2025-03-13 09:33:33
2025-03-14 10:59:00
华尔街见闻官方 incentive-icons
华尔街见闻官方
中国领先的金融商业信息提供商
127399文章数 2648378关注度
往期回顾 全部

科技要闻

OpenAI游说白宫放宽监管 同时打压DeepSeek

头条要闻

俄军1天连下3城后普京就停火表态 泽连斯基:他在拖延

头条要闻

俄军1天连下3城后普京就停火表态 泽连斯基:他在拖延

体育要闻

被NBA淘汰的黄毛,要成58亿豪门赘婿了……

娱乐要闻

记者说还有金秀贤更劲爆的视频!

财经要闻

315调查|起底万元冲锋衣的售假产业链

汽车要闻

14.78-17.78万元 2025款新哈弗H5正式上市

态度原创

艺术
时尚
游戏
旅游
亲子

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

开衫,是春天最好穿的衣服

《绝地潜兵2》桌游开发中 《怪猎世界》工作室操刀

旅游要闻

“小伙泰山陪爬年入30万”引热议 当事人回应:已考虑退出

亲子要闻

让娃自觉写作业,我有一个大逆不道的建议

无障碍浏览 进入关怀版