2024年诺贝尔三大科学奖项中,两大奖项与人工智能研究相关,物理学奖颁给了曾获图灵奖的机器学习先驱,化学奖也将一半颁给了“程序员”。10月29日下午,“2024诺奖与人工智能”——北京高校科协联盟跨学科学术交流活动在北京大学图书馆南配楼(艺术鉴赏厅)成功举办。北京市科协常务副主席李昕,中国科学院院士、北京大学科协主席、北京高校科协联盟理事长朱彤等出席活动。本次活动由北京大学创新创业学院院长、北京高校科协联盟秘书长、北京大学科协秘书长刘德英主持。
报告会上,北京大学物理学院的博雅特聘教授李新征首先在“学术报告引言”环节进行了分享。随后,三位专家分别从AI for Science以及人工智能在物理学、化学中的应用与前景进行了深入探讨,即兼顾了专业性也注重了科普性。
AI助力描述复杂系统
“人工智能为描述复杂系统提供了全新工具,为物理学研究开辟了新道路。”
——李新征
北京大学物理学院博雅特聘教授
在“学术报告引言”环节,李新征分享了人工智能在物理学领域中的潜在应用。在备课本科生通识核心课“今日物理”的过程中,他意识到凝聚态物理与统计物理之间存在着密切的联系,人工智能与两者之间,也存在密切联系。尽管他的研究重心并非人工智能,但近年来他在凝聚态物理、统计物理方面均做了一些研究,使他不得不认真考虑人工智能在这些研究中可能发挥的作用。
李新征坦言,在他的科学研究中,他面临的一个最大问题就是物理学在面对复杂系统时的无力。这并不是由目前他们的研究中使用的基本理论比如统计物理、量子力学的不完备引起的,而是由模拟中所面临的由诸多电子与原子核所构成的实体在一个超高维的空间中的相互作用引起的。如何在理论层面描述这些相互作用带来的不同,是物理学面临的一个极大挑战。这个挑战与揭示宇宙结构、解密基本粒子等挑战可以相提并论。
“人工智能为描述复杂系统提供了一个全新的工具。”李新征认为,这为物理学的研究开辟了新的道路。
AI解锁科研新范式
“基础设施的建设,将为AI for Science的发展打开新局面,为其未来奠定基础。”
——张林峰
深势科技创始人兼首席科学家
北京科学智能研究院院长
张林峰以《AI for Science 基础设施建设的探索与实践》为题,分享了AI在推动底层科研方面的见解与进展。
“研究通常有两种范式,归纳和演绎”,归纳是从数据中总结规律,而演绎是从基本原理出发推导。张林峰介绍了这两种范式下的困难,归纳的瓶颈在于数据收集效率低下、缺乏有效的数据分析方法。至于演绎,英国理论物理学家、诺贝尔物理学奖获得者保罗·狄拉克曾在《电子的量子理论》一文中指出,“大部分的物理问题和所有的化学问题在原理上已经解决,剩下的问题就是求解薛定谔方程。困难只在于运用这些定律的方程太复杂、无法求解。”
张林峰进一步阐述,这就造成“简单”的问题可以得到解决,如结构力学、机械工程、航空航天、电子工程等已经孕育了新一代的工业软件,构成了现代工业的基础。然而,对于复杂问题,如材料性质与设计、药物、催化剂等领域,尽管有一定的数据积累和底层规律,但实际应用中仍只能通过经验和试错来解决,导致理论与应用的脱离。
那么,简单和复杂问题的分界线是什么?张林峰认为,“是维数,也就是说,随着维数的增加,复杂度指数增加。”而AI为解决“维数灾难”提供了有效手段。在过去几年里,AlphaFold和DeePMD分别是AI for Science在归纳与演绎,或者是数据驱动和基本原理驱动的两方面的代表性成果。
张林峰进一步表示,面向未来,AI for Science发展的关键,在于基础设施建设。他介绍了中国科学院院士鄂维南所提出的“四梁N柱”体系。其中,“四梁”代表着针对各个科研领域中普遍存在的共性问题,需要共同建设的基础设施;“N 柱”则是在这些基础设施的支撑下,能够赋能并推动众多工业应用场景的力量。
“这些基础设施的建设,将为AI for Science的发展打开新局面,为其未来奠定基础。”张林峰说。
物理学和AI相互推动
“物理的加持,AI将变得更强大,发展更迅速。AI的辅助,人类将更高效、更强大、更具有创造性地工作。”
——马滟青
北京大学物理学院博雅特聘教授
国家杰出青年科学基金获得者
马滟青以《物理与人工智能新时代——解析2024年诺贝尔物理学奖》为题,从“人工神经网络”“物理推动AI”“AI推动物理”三个方面进行了深入的分享。
2024年诺贝尔物理学奖授予了约翰·J·霍普菲尔德(John J. Hopfield)和杰弗里·E·辛顿(Geoffrey E. Hinton),以表彰他们在使用人工神经网络进行机器学习的基础性发现和发明。这一奖项公布后,社交媒体上出现了不少调侃的声音,称“物理学不存在了”。一些学者对此表示担忧,认为物理学可能受到挑战。对此,马滟青认为,我们需要从物理学和AI的发展过程中去理解它们之间的关系。
马滟青介绍,人工神经网络的发展并非一帆风顺。它的经历从初步提出,到经历寒冬期,再到现在快速发展的曲折过程。人工神经网络通过模拟人类神经元的工作方式,实现了对复杂问题的学习和解决。人工神经网络现在已成为人工智能领域的核心工具。
同时,物理在人工神经网络中的应用也日益凸显。例如,扩散模型和平均场论等物理概念在理解深度网络和优化网络方面发挥了重要作用。此外,量子机器学习也因其独特的叠加态而展现出了更好的效果。
自上世纪八十年代开始,人工智能就已经被应用在物理学的前沿问题研究中。例如,在粒子轨迹确立、模拟实验、磁场控制以及薛定谔方程的求解等方面,人工智能都展现出潜力和价值。
展望未来,马滟青表示,在物理的加持下,AI将变得更加强大,发展也将更加迅速。同时,在AI的辅助下,人类将能够更高效、更强大、更具有创造性地进行工作。他也表示,随着AI的迅猛发展,中国在算力方面的劣势可能会被进一步放大。因此,国人在算力、方法等方面都需要付出更大的努力,以应对未来的挑战。
AI革新蛋白质设计
“AI助力我们做更多的事情,实现更多的想法。在计算蛋白质设计领域,AI为科学研究注入新的活力。”
——王初
北京大学化学与分子工程学院博雅特聘教授
前沿交叉学科研究院院长
国家杰出青年科学基金获得者
王初以《计算蛋白质设计——解析2024年诺贝尔化学奖》为题,分享了关于本年度诺贝尔化学奖的相关内容。
2024年诺贝尔化学奖颁给了3位科学家。其中,英国科学家德米斯·哈萨比斯(Demis Hassabis)和美国科学家约翰·江珀(John M. Jumper)因开发AlphaFold在蛋白质结构预测方面取得巨大成功而获奖;而王初的博士生导师——美国华盛顿大学生物化学家戴维·贝克(David Baker),因在计算蛋白质设计方面的贡献而荣获此殊荣。
王初于2001年来到美国华盛顿大学生物化学系攻读博士学位,机缘巧合下,他通过实验室轮转来到了戴维·贝克实验室,并一直在此工作至2008年博士后项目结束。在与戴维的接触中,王初感受到他是一位天生的纯粹科学家,他将全部精力都倾注于科学研究,不断产生原创的想法,并能将这些想法付诸实践。
蛋白质作为生命体的基本组成单元,其结构决定了其功能。因此,对蛋白质结构的解析一直是科学研究的热点。随着高质量测序技术的发展,很多物种的新序列被揭示出来,这促使科学家们思考是否可以通过计算方法,从蛋白质的序列出发,来预测其折叠后的三维结构。反之,计算蛋白质设计则是针对特定蛋白质结构找到一种最适合的序列。而在这两个过程中,AI技术都发挥了关键作用。
王初提到,戴维·贝克的一项成名工作就是开发了一款名为Rosetta的软件。这款软件能让研究人员更快地预测蛋白质的结构,同时也能针对特定结构进行序列设计。基于Rosetta,戴维·贝克团队设计出第一个自然界中不存在的蛋白质——Top7。此后又在此基础上全新设计了具有催化功能的酶、小分子结合蛋白和蛋白相互作用。
戴维·贝克曾表示,“我的理想是全球各地的人们都可以同心协力,为科学和全球健康做出重要的贡献。”2004年,他的实验室开发出的名为Rosetta@home的软件,使得任何人都可以在自己家里的计算机上下载这款软件。在启动不到4年的时间里,接近20万志愿者在自己的计算机上装载了这款软件,为蛋白质结构预测做出贡献。
此外,戴维·贝克还设计了一款特别有趣的在线游戏,名为“Foldit”,就是关于蛋白质折叠与设计的。王初回忆道:“当时我问他为什么要做这款游戏,他的回答是,研究不应该只由科研人员来做,也可以让普通大众参与其中,还可能收获更多有趣的想法和发现。”
得益于AI技术的助力,AlphaFold软件在蛋白质结构预测方面取得了巨大成功。 在此背景下,戴维·贝克团队迅速转变研究范式,不仅把Rosetta升级为AI版的“RosettaFold”媲美AlphaFold,而且还把前沿的AI算法应用于蛋白质设计领域,发展了ProteinMPNN、RFDiffusion等新方法,显著提升了设计的精准度和成功率。王初表示,有了AI的助力,能帮我们去做更多的事情,实现更多的想法。在计算蛋白质设计领域,AI为科学研究注入新的活力。
制作:北京市科协融媒体中心
记者:吴洣麓
供图:北京大学科协
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.