|中国科学院物理研究所 李佩璇 秦晓宇 成蒙 供稿
本文选自《物理》2025年第3期
物有本末,事有终始。知所先后,则近道矣。
——曾子
在当今科技飞速发展的时代,人工智能已经从科幻小说走进了现实生活的方方面面。从智能语音助手到自动驾驶汽车,从医疗诊断到金融预测,大模型作为人工智能的核心技术之一,正以前所未有的速度改变着人类社会的运行方式。
2025年2月25日晚,由中国科学院学部工作局支持,中国科学院物理研究所承办的第82期科学咖啡馆活动成功举行。本次活动主持人为中国科学院学部工作局科普处业务主管陈蕊,主讲嘉宾为清华大学国家信息研究中心副研究员王东。在这期沙龙活动中,王东以“大模型的内在逻辑”为主题,旨在深入探讨大模型背后的技术原理、发展现状以及对未来社会的深远影响。
图1 王东主题报告现场
大模型的崛起:从深度学习到智能涌现
大模型的崛起并非偶然现象,而是深度学习技术在大数据和强大计算能力共同推动下的必然成果。从亚里士多德的逻辑学到图灵的计算理论,再到人工神经网络的提出与深度学习的突破性进展,大模型的发展之路凝聚了长久的技术积淀。
王东在沙龙上向与会者展示了大模型在语言生成、图像识别、视频生成等多个领域的实际应用,突显了其卓越的学习与泛化能力。大模型在达到一定规模后所展现出的复杂推理和创新能力——“涌现”现象,是其与传统人工智能相比的显著区别。这种涌现能力使得大模型不仅能应对简单任务,还能处理复杂多变、涉及多种模式的问题,甚至在某些领域超越了人类的表现。
王东深入剖析了大模型的核心架构Transformer,该结构擅长处理长序列数据并通过自注意力机制捕捉复杂关联,为大模型发展奠定基础。随着模型规模、数据量及计算资源的增加,大模型性能不断提升,此现象称为“尺度定律”。当达到一定量级时,大模型能力大幅跃升,尤其在复杂推理与融合创新方面,涌现出新能力。大模型的推理能力也很重要,其通过模拟人类思考模式执行复杂逻辑推理。推理能力的提升不仅与模型规模的扩大有关,还与推理步骤的增加紧密相连。这种“推理尺度定律”表明,随着推理步骤的增多,模型的性能将显著提升,为解决更为复杂的科学和社会问题提供了有力支持。
大模型开源运动对人工智能的发展有着积极的影响。随着大模型技术的日益成熟,一些研究机构和企业开始将模型开源,这一举措极大地推动了人工智能技术的普及与发展。开源模型降低了技术门槛,激发了全球开发者社区的创新热情。DeepSeek的R1系统便是一个例子,其开源策略吸引了全球开发者基于该模型进行二次开发与创新,加速了人工智能技术的飞速发展。开源运动不仅促进了技术的发展,还加强了全球范围内的合作与交流。通过开源,开发者可以共享代码、数据和经验,从而加速技术的迭代与优化。此外,开源还有助于降低人工智能技术的使用成本,使更多企业和个人能够受益于这一前沿技术。王东呼吁更多研究机构和企业加入开源运动,携手推动人工智能技术的不断前行。
大模型的边界与未来展望
尽管大模型已经展现出惊人的能力,但王东也坦诚地指出了其发展过程中面临的诸多挑战。大模型的训练不仅需要海量的数据支撑,还依赖巨大的计算资源,这无疑限制了其进一步拓展的步伐。此外,大模型的可解释性依然是一个亟待攻克的关键难题。尽管大模型的性能在持续提升,但其内部的逻辑和决策机制仍然像是一个黑箱,难以被完全理解和解读。为此,人工智能领域的研究者和从业者应该携手并进,共同探索更加高效且可解释的模型架构。
在展望大模型的未来发展趋势时,王东提到了通用人工智能(AGI)的实现和学科交叉融合的重要性。当前的大模型虽然在特定领域内表现出色,但仍需进一步提升通用性,使其能够像人类一样灵活地应对各种复杂任务。此外,大模型在教育、商业和社会领域也具有广泛应用前景。在教育领域,人工智能的快速发展提出了新的挑战和要求。未来的教育应注重培养学生的创新思维和跨学科能力,而人工智能教育的普及则是实现这一目标的关键。从小学阶段开始,就应该通过讲述科学家的故事等方式,激发学生的学习兴趣,引导他们初步了解人工智能的基本概念和历史发展。随着学生年级的提升,教育内容也应逐渐深入,从介绍技术框架和应用场景,到结合实际项目进行开发实践,最终在大学阶段注重跨学科教育,努力培养学生的综合能力和创新能力。在商业领域,大模型被广泛应用于风险预测和投资决策等任务,为金融机构提供了更为精准和高效的服务。在医疗领域,大模型能够辅助医生进行疾病诊断和治疗方案的制定,提高了医疗服务的质量和效率。在交通领域,大模型则能够优化交通流量,提高出行效率,为城市交通管理提供了有力的支持。总之,大模型的未来发展将充满无限可能。
然而,大模型的广泛应用也带来了一些社会问题。随着人工智能技术的迅猛发展,一些传统职业可能会面临被自动化取代的风险,如客服、数据输入等工作。因此,社会需要加强对劳动力的再培训,帮助他们适应新的技术环境。此外,大模型的决策过程缺乏透明度,可能会引发一些不公平或不合理的结果。王东呼吁,人工智能的发展应当在技术进步和社会伦理之间找到恰当的平衡点,确保技术的发展能够真正造福人类社会。
探索人工智能的无限可能
活动的最后是互动交流环节,与会嘉宾纷纷提问,现场气氛热烈。
来自电子城高科创E+的副总经理郭晓乐抛出了他的疑问:“人工智能或硅基智能的边界是什么?它是否会被碳基智能所限制?”王东答道:“我们讨论的是计算的边界,而不是智能本身。如果承认丘奇—图灵论题,理论上计算是没有边界的。当前硅基智能受限于物理条件,但未来可通过量子计算等方式突破。碳基智能受限于生物寿命,而硅基智能可能突破这些限制。哥德尔不完全定理也表明,任何系统都有无法解决的问题。所以,硅基智能的边界在于物理实现的局限性,而非碳基智能。”
来自商务印书馆福州分馆的总编辑雒华又问道:“在大数据和AI时代,如何在推广学术成果的同时,有效保护知识产权和防止盗版?”王东回答道:“这是一个非常关键的问题。目前,全球都在探索如何平衡数据利用与知识产权保护。对于AI模型,目前的做法是筛选优质数据,剔除错误或垃圾信息,并通过与人类价值观对齐的方式优化模型。比如,让模型生成多个答案,由人类选择最准确的,以此提升模型的准确性和可靠性。”他还提到,未来需要从技术、法律和伦理等多方面入手,确保知识产权得到充分保护,同时推动学术成果的广泛传播。
图2 科普活 动与会嘉宾合影
第82期科学咖啡馆活动在热烈的讨论中落下帷幕,与会嘉宾就大模型的内在逻辑、发展现状及未来展望提出了诸多问题,现场气氛极为活跃。活动的结束并不意味着探索的终止,人工智能的发展之路仍然漫长且充满挑战。我们期待未来有更多如王东般的专家学者加入,共同推动人工智能技术的持续创新与发展,携手探索其无限可能,共创更加美好的未来。
《物理》50年精选文章
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.