(关注公众号并设为标,获取最新人工智能资讯和产品)
全文5,000 字,阅读约需14分钟
正如历史反复证明的那样,真正的技术革命往往始于对现状的深刻反思
当整个科技界都在为大语言模型的惊人表现欢呼时,Meta首席AI科学家、图灵奖得主Yann LeCun却依旧坚持他的观点 —— 最先进的AI系统在真实世界的理解和交互方面,依然处于初级阶段。
在这场深度对话中,这位AI领域的开创者没有沉醉于当前AI的成就,而是直指其根本局限。他不仅挑战了市场对AI能力的普遍认知,更通过JEPA架构等前沿探索,详细阐述了一条不同于主流LLM的技术路径,这可能才是通向真正人工智能的关键突破口。
一、猫的智慧
在访谈开端, Yann LeCun没有直接陷入晦涩的技术讨论,而是选择了一个出人意料却又妙趣横生的切入点——猫的日常行为。这个看似简单的观察,却蕴含着对AI本质的深刻洞察。
'你可以看到猫在试图跳上家具时,会先坐下来,摆动头部,规划自己的轨迹。 'LeCun以科学家的严谨态度描述了这个日常场景。 在他看来,一只猫在跳跃前的每个细微动作都体现着智能的精髓: 环境评估、轨迹规划、物理推理,以及实时决策的完美统一。 当猫最终'蹦、蹦、蹦'地一跃而上时,展现的是对物理世界的深刻理解和精准预测。
更令人惊叹的是,这种智能并非某些特定猫类的特权,而是几乎每只家猫都具备的能力。 这种普遍性恰恰说明了某种更深层的智能本质。 正如LeCun所说: '猫能够规划、推理,理解物理世界,它们对自己的动态有非常精准的认知,还有关于许多事物的直观物理学。 这些都是我们目前无法用计算机再现的能力。 '
LeCun进一步举例说明,猫的智能不仅体现在物理动作上,还表现在其行为的主动性和探索性上。 它们会故意打翻水杯,将水洒在笔记本上; 会玩弄死老鼠,这些看似顽皮的行为背后,其实展现了好奇心、探索欲和对环境的主动互动能力。 这种自发的探索和学习能力,恰恰是当前AI系统所欠缺的。 这个鲜明的对比揭示了当前AI发展的根本性问题:我们不仅在技术路径上可能存在偏差,更重要的是,我们对智能的本质理解可能产生了某种认知盲点。
二、大型语言模型的迷思
在深刻剖析了当前AI的认知局限性之后,Yann LeCun认为最好的大语言模型确实能够以令人惊叹的方式操纵语言,但它们对物理世界几乎没有理解。'在剖析当前AI发展状况时,他一针见血地指出了大型语言模型(LLM)的根本局限。这种局限不仅体现在技术层面,更反映了我们对人工智能本质的理解偏差。
随后他继续指出,LLM的认知完全基于文本训练,它们对世界的理解仅仅来自于人类的文字描述。这种二手知识是高度符号化、近似化和简化的,与真实世界的复杂性相去甚远。他用一个引人深思的对比来说明这一点:我们现在拥有能够通过律师资格考试的AI,却没有能够完成普通家务任务的机器人。这种反差揭示了一个深刻的悖论:在某些专业领域表现出色的AI系统,却可能缺乏最基本的常识理解。
更令人深思的是,Yann LeCun认为这种局限不仅仅是数据量的问题。即便将训练数据扩大十倍,当前的LLM架构也无法实现真正的创新性突破。在与Lex Friedman的对话中,他提到一个令人震撼的数据:LLM的训练数据大约有20万亿个token,而一个4岁小孩处理的输入量可能是这个的十倍以上。然而,即使如此庞大的数据量,也不足以让AI达到"人工爱因斯坦"的水平。
问题的核心在于LLM的工作方式。这些模型本质上是在进行复杂的文本模式匹配,而非真正的理解和推理。他举例说明,当系统试图预测视频的下一帧时,最好的策略往往是预测所有可能未来的平均值,这导致输出变得模糊不清。这个例子生动地说明了当前AI系统在处理真实世界预测时的根本困境。
特别值得注意的是,Yann LeCun指出目前最适合科学发现的AI系统其实是一些专门化的模型,而非通用型的LLM。例如,在预测蛋白质结构、研究分子相互作用或者探索新材料特性时,专门设计的模型往往能取得更实质性的突破。这些专门化模型虽然不像LLM那样引人注目,却能在特定领域产生真正的创新性发现。他的观点还揭示了一个更深层的问题:我们是否过于沉迷于语言这个人类特有的高级认知功能,而忽视了更基础的智能形式?他指出,语言能力在人类进化史上是相对晚近的发展,从基因组的差异来看,语言相关的基因可能只占很小的比例。这提醒我们,在追求AI发展时,可能需要重新审视什么才是真正的智能基石。
正如Yann LeCun所说,真正的突破可能不在于简单地扩大模型规模或增加训练数据,而在于开发能够真正理解和推理物理世界的新型架构。这需要我们跳出当前的思维定式,重新思考AI发展的方向。
三、AI时代的商业布局
在评估当前AI发展态势时,Yann LeCun提出了一个引人深思的类比:现今的AI领域正在重演'修昔底德陷阱',即当一个新兴势力崛起时,现有的主导力量会将所有注意力集中在它上面。在AI领域,这种现象表现为市场对大语言模型(LLM)的过度关注,以至于挤压了其他创新方向的发展空间,特别是在物理科学领域。
这种现象背后,Yann LeCun看到了一个更深层的问题:企业正在陷入"沉没成本谬误"。由于已经在LLM技术上投入巨大资源,许多企业不愿承认其局限性,反而试图用这一技术解决所有问题。这种固守既有投资的心态,可能导致企业错失更具突破性的技术机会。
在科学应用领域,他特别强调了专门化AI模型的价值。他指出,当前最适合科学发现的并非通用型的语言模型,而是那些针对特定任务优化的专门系统。例如,在预测蛋白质结构、研究分子相互作用或探索新材料特性等领域,专门设计的模型往往能够取得更实质性的突破。对管理者而言,Yann LeCun的观点提供了一个重要的决策框架:在AI技术选择上,不应被短期市场热点所主导,而是要从企业的实际需求和长期发展出发。这意味着企业需要建立更加多元化的AI技术组合,而不是将所有资源都押注在当前最热门的技术方向上。
所以。企业与其幻想通过某个单一突破实现质的飞跃,不如踏实地在多个技术方向上稳步推进。这需要企业具备足够的战略耐心,并建立起有效的风险管理机制,以应对技术发展过程中的不确定性。
四、企业转型的关键
他认为,企业不应盲目追随大语言模型的热潮,而是要着眼于能真正理解和推理物理世界的AI技术。在他看来,未来AI的突破口在于两个关键技术方向:自监督学习和JEPA(联合嵌入预测架构)。他将自监督学习比作"AI的暗物质"——虽然不那么引人注目,却是AI进步的根本动力。这个比喻源自他对人类和动物学习方式的观察:我们大部分知识并不是通过明确的教导获得的,而是通过感知和互动自然习得的。比如,许多动物在没有父母教导的情况下就能掌握复杂的生存技能。自监督学习正是模仿这种自然的学习方式,让AI系统能够从海量未标注的数据中自主学习。
而JEPA则代表了一种更具突破性的技术路径。这个架构的核心目标是构建世界的"心理模型",使AI能够理解和预测物理世界的运作方式。Yann LeCun用木星轨道预测的例子来阐释这一理念:要预测木星未来几个世纪的轨道,实际上只需要六个关键数值——三个位置和三个速度。密度、成分、自转速度等众多参数都不是必需的。这个例子生动地说明了JEPA想要实现的目标:找到现象背后最本质的表达,去除冗余信息,实现真正的理解和预测。
在实际应用中,JEPA展现出独特的优势。不同于传统的监督学习需要大量标注数据,或者当前语言模型仅关注文本层面的关联,JEPA试图理解和预测数据背后的本质关系。这种方法在处理视频、图像等连续性数据时特别有价值,因为它能够捕捉到数据中的不变特征,而不是简单地进行表面模式的匹配。
对决策者而言,这些见解具有重要的战略意义。首先,企业需要重新评估其AI投资方向。与其一味追逐看似显著但实则局限的语言处理能力,不如将目光投向那些虽然需要更长期投入,但可能带来根本性突破的技术方向。其次,企业需要建立起对AI本质的深入理解。正如Yann LeCun所说,真正的AI不在于简单地扩大模型规模,而在于赋予系统理解和推理世界的能力。此外,企业组织还需要注意建立长期的技术积累。自监督学习和JEPA这样的技术路线,虽然现在可能还不如大语言模型那样炙手可热,但它们可能是通向真正人工智能的必经之路。企业如果能在这些方向上及早布局,就可能在未来的AI竞争中占据先机。
五、AI安全问题
在讨论AI安全问题时,Yann LeCun首先指出了当前AI系统,特别是大语言模型(LLM)在安全机制上的根本性缺陷。虽然这些系统表现出惊人的语言处理能力,但其安全限制往往可以通过巧妙的提示而被绕过。这种情况凸显了现有AI安全设计的不足,也暗示了我们需要从系统的核心架构层面来重新思考AI安全问题。为了解决这个问题,LeCun提出了"目标驱动"架构的概念。这种架构的核心在于构建一个拥有完整世界模型的AI系统,使其能够在"大脑"中模拟行动的后果,并在决策过程中自动整合保护性约束。这些约束不是简单的外部规则,而是系统决策过程中不可分割的组成部分,类似于人类社会中的法律体系。
在解释这种方法的重要性时,Yann LeCun用"纸夹问题"做了一个生动的说明。这个著名的思想实验描述了一个仅有单一目标(制造纸夹)的AI系统可能带来的灾难性后果。他指出,如果系统缺乏内置的保护机制,它确实可能会不计代价地追求目标实现。但通过目标驱动架构,系统在追求目标的同时,会将安全约束作为决策过程中的必要考量,从而避免出现极端行为。
在实现路径上,Yann LeCun提出了一个极具启发性的工程类比。他指出,就像我们无法证明涡轮喷气机是绝对安全的,但可以通过持续的工程改进使其变得极其可靠一样,AI的安全性也应该通过不断的工程实践来提升,而不是寄希望于找到一个完美的理论证明。这种观点与一些研究者追求"可证明安全的AI"的路径形成了鲜明对比,展现了他作为科学家和工程师的双重思维。
更进一步,Yann LeCun强调了系统设计中"保护性目标"的重要性。他提出可以通过硬件层面的设计,比如让GPU的某个电路在系统违背安全约束时烧毁,来模拟"痛苦"的感知,从而在物理层面确保系统的安全行为。这种方法虽然看似激进,但实际上反映了一种深刻的洞察:真正的安全必须建立在系统的根本架构之上,而不是依赖于可能被绕过的表层限制。
他这种务实方案引发了学界的广泛讨论。尽管一些研究者,如Max Tegmark等人,仍在追求更理论化的安全保证,但Yann LeCun的工程导向方法提供了一个可能更切实可行的解决方案。这种方法不仅考虑了AI系统的技术实现,还充分考虑了现实世界的复杂性,为构建真正安全的AI系统提供了一个可行的路径。
六、AI的未来之路
Yann LeCun的观点不仅是对当前AI技术现状的分析,更是对未来AI发展方向的展望。他认为,AI是社会最需要的资源之一,它能够有效扩展人类的智能,推动社会进步。他将AI的影响力比作15世纪印刷机的发明,认为AI能够像印刷机一样推动启蒙运动、科学、民主的发展,帮助人类摆脱宗教教条,变得更加理性。他坚信,AI能够为人类带来巨大的福祉,但前提是我们能够正确引导AI的发展。他指出,AI的最终目标是帮助人类更好地理解世界,解决人类面临的各种难题,促进人类社会的进步和发展,这才是AI发展的根本意义所在,也是我们追求的最终目标。
AI的发展可能带来一些暂时的负面影响,但他相信,从长远来看,AI将彻底改变社会,使人类更加强大。他强调,我们应该将AI融入其长期战略,建立灵活适应变化的组织结构,积极拥抱AI,充分利用AI带来的机遇,未来,AI 会像虚拟团队的一部分一样支持每个人。这种支持不仅限于商业领袖或教授,而是包括每个人。学生也会被 AI 系统增强,他们的学习过程会因为这些系统而变得更强大。我觉得这是一个很美好的事情,而不是威胁。我们现在处于 AI 发展的初期,这是 AI 最差的状态,只会越来越好。AI 能做的事情越来越快、越来越高效,比如智能眼镜帮助理解物理世界,以及像 Llama 模型这样的新技术为教育提供更多可能性。
此外,Yann LeCun还对“通用人工智能”(AGI)这个概念进行了重新审视。他认为,“AGI”这个词存在问题,因为它没有反映出人类智能的特殊性。他认为,人类智能具有非常高的特化程度,而“AGI”这个词过于笼统。他更喜欢用“人类水平的AI”或者“AMI”(Advanced Machine Intelligence,高级机器智能)来描述未来AI的目标,在 Meta,他们把它简称为 “Abbie”,因为这个词在法语中也有“朋友”的意思。他认为,实现“AMI”是一个渐进的过程,而非一夜之间突然发生的事情,我们所有人正在尝试的一些想法成功落地,要构建一个至少在人类看来具有人类水平智能的系统,他觉得这至少需要五到六年的时间。但这是否真的会在五到六年内实现呢?他给出答案是很不确定的,这个分布有一个非常长的尾巴。AI 的历史告诉我们人类,人们总是低估它的难度。
七、结语
从对当前AI'不如一只猫'的清醒判断,到JEPA架构这条另辟蹊径的技术路线,Yann LeCun为我们展现了一位顶尖科学家对AI本质的思考:真正的智能不在于处理更多的文本数据,而在于理解和互动于真实世界的能力。
在当前AI赛道上,大多数玩家仍在语言模型的跑道上竞速。但正如Yann LeCun所警示,这条路径终会遇到天花板。对我们而言,这场对话的价值不仅在于提供了一个审视AI现状的新视角,更在于为我们指明了一个可能的突破方向:在押注主流赛道的同时,也要关注和布局那些试图突破AI根本局限的新技术路线。
看到很多读者在问"如何开始AI转型",我们建了个实战派AI团队(成员来自复旦、浙大、华为、阿里等),专注帮企业做"轻量级"AI落地:
公司该从哪个环节开始用AI?
️ 具体怎么落地才不会踩坑?
投入产出比怎么才最大?
我们团队专注企业AI解决方案
业务流程AI优化 提升运营效率 降低人力成本 定制AI应用开发 场景化解决方案 快速交付落地 AI转型咨询规划 专业评估诊断 精准转型方案
联系负责人:Milo-1101(仅限企业客户)
原视频链接:https://www.youtube.com/watch?v=u7e0YUcZYbE&t=243s
素材来源官方媒体/网络新闻
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.