网易首页 > 网易号 > 正文 申请入驻

三位数学家改写经典牛顿法!300年前算法一夜更新

0
分享至

300年经典牛顿法,迎来重磅升级!

三位普林斯顿数学家找到更快更强的解法,其中还有一位是华人。

牛顿法是啥?学过高数的同学想必并不陌生,它通过不断求导来寻找复杂函数f(x)接近零点的最优解。

就是这么一个非常简单的「近似求解」算法,因为收敛速度非常快,时至今日它仍被广泛应用在计算机视觉、物流、金融甚至纯数学问题等各个领域,比如开发能够区分交通信号灯和停车标志的自动驾驶汽车。

但即便这么强大,牛顿法也存在一个缺点,那就是不适用于所有函数。

于是乎,过去几个世纪诸多数学家前赴后继企图在此基础之上进行优化。现在这三位数学家成功将可适用的函数范围一扩再扩

比如像这个复杂的二元函数。

与传统牛顿法相比,新方法展现出来的更连贯,覆盖也很大。

一合著者表示,牛顿法在优化中有1000种不同的应用,而他们的算法有可能取代它。

来看看究竟是咋回事儿。

三位数学家改写经典牛顿法

牛顿法(Newton’s Method)诞生于17世纪,由大名鼎鼎的英国数学家牛顿首次提出。

其核心思想是,通过不断逼近函数的根或极小值点,以寻找函数的最优解。

通俗来说,这有点像在陌生环境里蒙眼寻找最低点。在行走过程中,我们唯一需要的信息在于两点:1)自己是否在上坡或者下坡,即斜率(函数的一阶导数);2)以及坡度是增加还是减少,即斜率本身的变化率(函数的二阶导数)。

利用上述信息,我们可以相对快速地得到一个近似值。

若将这一过程用数学方法来表示,则具体如下:

  • Make a guess(做一个猜测):选择一个接近你认为可能是最小值的起始点,作为寻找函数最小值的起点;
  • Model the curve(模拟曲线):在该点附近构造一个抛物线,以近似原函数的形状;
  • Find the next point(找到下一个点):计算抛物线的最低点,以此作为新的迭代点;
  • Repeat(重复):使用新的迭代点重复上述步骤,逐步逼近函数的最小值;
  • Keep going(继续进行):持续迭代,直至找到函数的最小值。

牛顿证明了,只要不断重复上述过程,最终就会逼近原始复杂函数的最小值。

而且和类似迭代方法(如梯度下降)相比,牛顿法虽然每次迭代的计算成本高于梯度下降,但在效率方面优势明显。

简单来说,牛顿法收敛速度相比梯度下降法更快,即在更少的迭代次数内找到最小值,因此也适用于多种情况。

不过牛顿当时也提醒:

  • 虽然这一方法在大多数情况下有效,但如果一开始从一个距离真实最小值太远的点开始,则可能越跑越偏。

而且更麻烦的是,牛顿法还存在一个显著缺点——不适用于所有函数

其核心策略是将一个复杂函数转化为一个更简单的函数,而一旦函数过于复杂,它也同样没辙了。

因此后来数学家们努力的方向在于,在不牺牲效率的前提下扩大算法使用范围。

直到去年夏天,三位研究人员发表了对牛顿法的最新改进。

  • 将牛顿法扩展到迄今为止最广泛的函数类别

具体而言,他们发现牛顿法在处理某些复杂函数(如高次幂函数)时效果不好,这是因为它依赖于函数的泰勒展开(一种使用求导和多项式逼近原函数的手段),而这个展开并不总是能很好地描述原函数,特别是当函数有很多“山谷”(局部最小值)时。

于是他们提出,如果一个函数满足两个条件,那么它就更容易找到最小值

  • 凸形(Convex):函数的形状像一个碗,只有一个“山谷”
  • 平方和(Sum of Squares):函数可以表示为一些平方项的和

前者意味着如果从任何位置开始寻找,都不会陷入局部最小值的问题,因为只有一个最小值,而且无论从哪个方向开始,都会滑向这个唯一的最低点。

后者意味着可以很容易地识别和计算函数的最小值,因为平方和形式的函数特别容易处理,其平方数总是非负的,而且它们的最小值是0。

接下来,为了满足上述条件,他们使用了一种叫做半定规划(Semidefinite Programming)的技术来调整泰勒展开,具体步骤如下:

1、微调泰勒展开。不直接使用函数的泰勒展开,而是对其进行微调,使其既凸形又可以表示为平方和。

2、增加调整因子。在泰勒展开中加入一个调整因子,这个因子可以帮助他们控制展开的形状,使其更接近原函数,同时满足凸形和平方和的条件。

3、多导数收敛。他们的方法可以使用任意多个导数来进行泰勒展开,这意味着他们可以更快地找到函数的最小值。使用更多的导数可以让算法以更高的速度(比如立方速度)收敛到最小值。

最终他们创造了这种更强版本的牛顿法,能够以更少的迭代次数找到最小值

他们的算法如下:

在下面这个函数中,与传统牛顿法相比,其改进版本(第三阶牛顿法)在理论上提供了更快的收敛速度,并且在实践中可能比经典牛顿法更有效,尤其是在初始点离最小值点较远的情况下。

一位华人参与

这项工作是三位数学家在普林斯顿大学期间合作完成的。

其中华人Jeffrey Zhang,目前是耶鲁大学生物医学信息学与数据科学博士后研究员,研究方向包括大型语言模型、数据科学和统计学、计算复杂性、多项式优化、博弈论和机制设计。

此前在普林斯顿大学获得运筹学和金融工程博士学位,导师正是同为该论文作者的Amir Ali Ahmadi教授。

更早之前,他在2014年获得耶鲁大学计算机科学和经济学与数学学士学位。

另一位作者Abraar Chaudhry也是Amir Ali Ahmadi教授的学生,现乔治亚理工学院博士后研究员。在普林斯顿攻读博士之前,他在布朗大学读本科。

事实上,在这三位数学家出现之前,有很多数学家都进行了尝试。

最早19世纪,被称为「俄罗斯数学之父」的Pafnuty Chebyshev提出了一种牛顿法,用三次方程(指数为3)近似函数。

不过当原始函数涉及多个变量时,他的算法就会不起作用。

更近的一次,2021年俄罗斯数学家Yurii Nesterov展示了如何使用三次方程有效地逼近任何数量的变量的函数。

但他的方法无法扩展到使用四次方程、五次方程等近似函数,否则会降低其效率。

现在,3位数学家将内斯特罗夫的结果又推进了一步。

与牛顿法的原始版本一样,这种新算法的每次迭代在计算上仍然比梯度下降等方法成本更高。

因此,目前这项新工作不会改变自动驾驶汽车、机器学习算法或空中交通管制系统的运作方式。在这些情况下,最好的选择仍然是梯度下降。

宾夕法尼亚大学Jason Altschuler表示:许多优化理念需要花费数年时间才能完全付诸实践。不过这似乎是个全新的视角。

如果随着时间的推移,运行牛顿法所需的底层计算技术变得更加高效,使得每次迭代的计算成本更低,那么Ahmadi、Chaudhry和Zhang开发的算法最终可以在包括机器学习在内的各种应用中超越梯度下降。

合著者表示,从理论上讲,他们目前的算法确实更快。

论文:
https://arxiv.org/pdf/2311.06374

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
刘震云:如果你一听到伴侣说话就烦躁,有股无名火,真正的原因不是你讨厌他,也不是你脾气不好,而是条件反射

刘震云:如果你一听到伴侣说话就烦躁,有股无名火,真正的原因不是你讨厌他,也不是你脾气不好,而是条件反射

脆皮先生
2026-05-13 19:42:42
阿森纳夺冠就翻脸!29 岁巨星仅 500 万甩卖,昔日王牌彻底边缘化

阿森纳夺冠就翻脸!29 岁巨星仅 500 万甩卖,昔日王牌彻底边缘化

澜归序
2026-05-24 05:47:42
输给广厦出局后!周鹏去向曝光,深圳寻求交易广东,租借黄明依?

输给广厦出局后!周鹏去向曝光,深圳寻求交易广东,租借黄明依?

绯雨儿
2026-05-24 12:14:05
俄罗斯让中国心凉?真正恐怖的并非西方围堵,而是我们低估了自己

俄罗斯让中国心凉?真正恐怖的并非西方围堵,而是我们低估了自己

混沌录
2026-04-09 16:27:09
14岁女孩“满是槽点”的生日照,拆穿家长真面目:不偏心也不负责

14岁女孩“满是槽点”的生日照,拆穿家长真面目:不偏心也不负责

妍妍教育日记
2026-05-24 09:30:16
14岁开演唱会,23岁一首歌狂赚2亿,29岁成教授,他如今怎样了?

14岁开演唱会,23岁一首歌狂赚2亿,29岁成教授,他如今怎样了?

飘飘然的娱乐汇
2026-05-18 19:45:05
砸锅卖铁也要拿下!美记:火箭可用申京+小贾交易字母哥

砸锅卖铁也要拿下!美记:火箭可用申京+小贾交易字母哥

爱体育
2026-05-24 23:45:37
No!宣布了!再见徐杰!中国男篮更新大名单

No!宣布了!再见徐杰!中国男篮更新大名单

篮球实战宝典
2026-05-24 22:35:40
开市客入驻京东:官方旗舰店上线

开市客入驻京东:官方旗舰店上线

互联网圈子那点事
2026-05-23 17:49:09
特尔施特根赛季奇遇:随巴萨夺冠却随赫罗纳降级,仅出场两次

特尔施特根赛季奇遇:随巴萨夺冠却随赫罗纳降级,仅出场两次

星耀国际足坛
2026-05-24 21:12:06
俄上万亿高铁项目,不用中国高铁技术,采用锡纳拉集团,如今咋样

俄上万亿高铁项目,不用中国高铁技术,采用锡纳拉集团,如今咋样

梁濆爱玩车
2026-05-24 10:25:43
央视科普的“高钾晚餐”火了!连吃7天,腰围直接缩7cm

央视科普的“高钾晚餐”火了!连吃7天,腰围直接缩7cm

健身狂人
2026-05-22 00:01:54
巴基斯坦总理:我们会取得成功,成为“小中国”

巴基斯坦总理:我们会取得成功,成为“小中国”

观察者网
2026-05-24 21:30:08
越南准备成为下一个乌克兰?一旦中越开战,中国还会手下留情吗?

越南准备成为下一个乌克兰?一旦中越开战,中国还会手下留情吗?

趣味八卦
2026-05-24 21:11:36
韩媒曾警告:一旦东亚开战,韩导弹将降落北京,同时摧毁中国海军

韩媒曾警告:一旦东亚开战,韩导弹将降落北京,同时摧毁中国海军

致敬明天的太阳
2026-05-24 21:34:40
央媒发文,高调官宣张艺谋新身份,全家移民美国改国籍真相大白

央媒发文,高调官宣张艺谋新身份,全家移民美国改国籍真相大白

一盅情怀
2026-05-24 15:46:55
何九华官宣当爸仅1周,王鸥出手“反击”,这下里子面子全丢了

何九华官宣当爸仅1周,王鸥出手“反击”,这下里子面子全丢了

星星没有你亮
2026-05-22 06:54:17
樊振东没想到,惨败遭群嘲后,国乒球员站出来挺他的,竟是林诗栋

樊振东没想到,惨败遭群嘲后,国乒球员站出来挺他的,竟是林诗栋

精彩背后
2026-05-24 23:17:34
访华时间“撞”了?天安门广场挂起中巴中塞国旗!

访华时间“撞”了?天安门广场挂起中巴中塞国旗!

看看新闻Knews
2026-05-24 17:54:07
快讯!乌克兰突然宣布了!

快讯!乌克兰突然宣布了!

故事终将光明磊落
2026-05-24 14:38:45
2026-05-25 00:20:49
量子位 incentive-icons
量子位
追踪人工智能动态
12680文章数 176470关注度
往期回顾 全部

科技要闻

我戴着摄像头上班,正在帮AI抢走我饭碗

头条要闻

山西矿难遇难者家属:父亲年过半百 我们一直劝他别干了

头条要闻

山西矿难遇难者家属:父亲年过半百 我们一直劝他别干了

体育要闻

唐斯发牌,大头逆袭:骑士跌向残忍夏季

娱乐要闻

王鹤棣掉粉超20万!代言和作品遭抵制

财经要闻

什么情况下,本轮AI大行情会结束?

汽车要闻

国民家轿再上新 帝豪向上系列限时5.59万起

态度原创

旅游
家居
艺术
手机
军事航空

旅游要闻

漫步黄山脚下 邂逅茶香与绿野风光(组图)

家居要闻

低调传承 温润沉静

艺术要闻

砸十几亿,烂十几年!福建福清富创世纪城,还有救吗?

手机要闻

为什么建议大家赶紧换新机?五点原因,望周知!

军事要闻

深夜美伊谈判传来大消息 特朗普最新表态

无障碍浏览 进入关怀版