网易首页 > 网易号 > 正文 申请入驻

千万IP创科普丨40年图灵机难题被业余玩家攻破,陶哲轩:软件辅助证明改变数学研究规则

0
分享至

转自 量子位

一水 发自 凹非寺
量子位 | 公众号 QbitAI

40多年的计算机难题——忙碌海狸难题,被一群业余爱好者攻破了!

数学大佬陶哲轩转发了这一消息,并欣慰表示:

这再一次体现了证明助手对于数学研究的协作是多么有用。


计算机科学家Scott Aaronson为此还写了一篇博文,并大肆赞赏:

这个发现是自1983年以来,忙碌海狸函数研究中最重要的进展。


具体而言,人们历经数十年努力,终于找到了第五个“忙碌海狸”图灵机:

BB(5) =47,176,870(5状态图灵机,能在停下来之前写下47,176,870个“1”)

图灵机是一种抽象的计算模型,通过读取和写入0和1在无限磁带上进行计算。


早在40多年前,一群计算机科学家在德国多特蒙德举行竞赛,寻找“忙碌海狸”图灵机。

找出一个特定的图灵机,在它停止之前能够写下最多的1(我们称之为忙碌海狸数)。

通过找出特定状态下能在停止前写下最多1的图灵机,我们能更好地理解计算理论的边界

自从1974年确定了第四个忙碌海狸数后,寻找第五个成了悬而未决的问题。

而现在,来自世界各地的20多名贡献者(其中大多数人没有传统的学术资格) ,使用一款名为Coq证明助手的软件获得了结果——47,176,870,该软件证实数学证明没有错误。

这一成就瞬间令社区沸腾,其中爱尔兰梅努斯大学计算机科学家Damien Woods惊叹:

就像博尔特一样,我很惊讶他们的速度如此之快!


嗯,快半个世纪过去了还算快?只能说这个问题雀食有亿点难。

别着急,且看这群人如何长江后浪推前浪抓住“第5只海狸”~


为什么提出“忙碌海狸”?

要回答这个问题,首先需要简单了解一下二进制图灵机

1936年,计算机科学之父艾伦·图灵提出了图灵机——

一个无限长的纸带一个读写头(可以读取和写入纸带上的信息),以及一组内部状态等基本部分组成。

图灵机的行为由一组规则定义,这些规则可以想象成一张表。表中的每行代表一个规则,每列对应读写头读取到的符号(0或1)。


每条规则指定了在特定状态下,读写头遇到0或1时应该执行的操作。操作通常包括:

  • 写入符号:决定在当前单元格写入什么符号(例如,将0替换为1)。

  • 移动方向:决定读写头是向左移动、向右移动还是保持不动。

  • 状态转换:决定图灵机的下一个状态是什么。

除了处理0和1的规则外,还有一条特殊规则告诉图灵机何时停止运行。当图灵机进入这个状态时,它就不再执行任何操作,相当于“比赛结束”(这种状态一般不计算在状态集合里)。

而就在停机问题上,已经有研究观察到:

一些图灵机会相对较快地停止(比如这台three-rule图灵机在11步后停止)


其他的则陷入了很容易发现的无限循环

这也启发图灵提出了著名的“停机问题”

图灵机是否会在有限的步骤后停止运行,或者它是否会无限期地运行下去?

他还进一步提到,停机问题没有通用的解决方案,因为人们永远无法确定适用于一台机器的方法是否也适用于另一台机器。

对于这个结论,数学家Tibor Radó(以下简称拉多)不太满意,并由此发明了“忙碌的海狸游戏”。


为了将停机问题的本质提炼成更简单的形式,拉多提出了一种方法——

将图灵机根据它们拥有的规则数量进行分组

例如,一组代表所有只有一条规则的图灵机,另一组代表所有有两条规则的图灵机,依此类推。

1962年,拉多利用这些有限的图灵机组定义了“忙碌海狸游戏”。游戏的玩法是

1.选择一个组,即确定你的图灵机将拥有的规则数量。

2.为组中的每台机器提供一个初始状态全是0的磁带。

3.观察这些机器的运行。一些机器可能会无限期地运行下去,而其他的则会在某个时刻停止。

4.在那些最终停止的机器中,有的会很快停止,有的则需要更多步骤。每个组中会有一个运行时间最长的机器,这台机器被称为“忙碌海狸”

5.在有n条规则的组中,这台“忙碌海狸”在停止之前所执行的步数就是所谓的“忙碌海狸数”BB(n)。

6.游戏的目标是确定这些BB(n)的确切值。


拉多给这样“极度低效”的图灵机取了一个有趣且形象的名字:忙碌海狸(Busy Beaver,取自英语中的谚语 as busy as a beaver)。

而这个游戏也最终引来一众程序员和数学爱好者的疯狂试玩。

早期吃螃蟹的人

Allen Brady(以下简称布雷迪),当时的俄勒冈州立大学数学研究生,成了早期挑战者之一。

在游戏推出前,人们已经确定了BB(1) = 1,BB(2) = 6,当时人们正尝试攻克BB(3)

布雷迪也投身BB(3),他编写了计算机程序来模拟图灵机的行为,这个程序构建了一种“家谱”,根据图灵机初始行为的相似性,对具有相同规则数量的机器进行分类。

程序只在机器之间行为差异变得重要时才将家谱树分成多个分支。如果模拟显示某条分支上的机器会停止或进入无限循环,程序就会剪掉这个分支,排除那些不会无限运行下去的图灵机


编写程序只是第一步,布雷迪需要找到足够强大的计算机来运行它。

在1964年,这不是一件容易的事。最终,他在90英里外的灵长类动物研究实验室找到了一台SDS 920计算机


只可惜BB(3)进行到一半,拉多的研究生Shen Lin已宣布证明BB(3) = 21,不过布雷迪还是继续证实了Lin的结果。

毕业后,布雷迪发现了新的非停止图灵机种类,并给它们起了形象的名字。

1966年,他发现了一个在停止前运行了107步的四规则图灵机,并推测这可能是第四个忙碌海狸,并最终于1974年证明了没有其他停止的机器能运行更久。

这是四十多年来人类所知的最后一个忙碌的海狸号码


1982年,第一次大规模寻找BB(5))的Dortmund竞赛正式举办,其中运行时间最长的一台在超过10万步后停止。

1984年,《科学美国人》对这项比赛的报道激发了新一代研究者的兴趣,有一位研究者打破了旧纪录,他发现的一台机器在超过200万步后停止。

这一新纪录也引来当时的研究生Heiner Marxen和 Jürgen Buntrock,他们在业余时间合作研究这个问题,开发了加速图灵机模拟的数学技术。

尽管未能打破200万步的纪录,但后来在1989年,Marxen在一家公司工作时,使用一台功能强大的新计算机重新启动了他的搜索程序,并意外地发现了一个在4700万步后停止的图灵机

2000年代初,一位名叫Georgi Ivanov Georgiev(化名Skelet)的保加利亚计算机科学家非常接近这一目标


经过两年的不懈努力,他开发了一个能够识别非停止机器新种类的计算机程序。尽管他的程序运行了一周并留下了约100个未解决的图灵机,但他手工分析后将名单减少到43个

此后人们一直陷入不断尝试中。

最终确定BB(5)

2022年,研究生Tristan Stérin发起了“忙碌海狸挑战”,这是一项在线合作,旨在最终确定BB(5)


在这之前,Stérin决定在传统方法的基础上进行调整,使用布雷迪的家谱方法,并计划用独立程序处理永远运行的机器。

到2021年底,Stérin编写了第一步的计算机程序,生成了大约1.2亿台可能的图灵机列表。

为了帮助分析这些机器,Stérin构建了一个在线界面,使用“时空图”来可视化图灵机的行为。


完成这些后,鉴于个人精力有限,他在偶然的情况下拉来了Shawn Ligocki

Ligocki向团队介绍了封闭磁带语言方法,这是一种30年前的技术,他将其应用于当前的忙碌海狸问题。


他写了一篇博客文章介绍这项技术,但最初并不知道如何编写一个能涵盖所有情况的程序

然后,又一位Justin Blanchard加入了项目,他想出了如何做到这一点,但他的程序相对缓慢。


于是另外两个贡献者找到了让它运行得更快的方法,这一技术甚至可以处理前文提到的43个未解决图灵机中的10个

取得阶段性成果后,BB(5)终于迎来两个关键突破

第一个是Skelet #1,它在可预测行为和混乱行为之间不断交替,这种特性使得它非常难以分析和理解。

2023年3月,Ligocki和斯洛伐克贡献者Pavel Kropitz(不会说英语,使用谷歌翻译与团队其他成员交流),使用Marxen和Buntrock(之前挑战200万步记录的两位学生)30年前的加速模拟技术的一个增强版,最终破解了Skelet #1。

他们发现Skelet #1在超过一万亿步之后才进入一个异常长的重复周期,远超过一般无限循环在1,000步内开始重复的常规。


由于Skelet #1的行为极其奇怪,Ligocki在将近五个月的时间里都不确定他们的证明结果是否正确

后来,一位21岁自学成才的程序员(以“mei”为名)加入了团队,她通过学习Coq证明助手,将团队的一些证明翻译成Coq语言,提高了证明的严格性和可靠性。

第二个突破是Skelet #17,研究者必须像破译四层加密的秘密消息一样,逐层解析其行为模式,才能证明该机器永远不会停止。

尽管研究生Chris Xu和其他社区贡献者做了大量工作,但大多数证明尚未翻译成Coq

直到2023年4月,一位名为mxdys的神秘新贡献者加入,并在短短几周内完成了一个40,000行的Coq证明,证实了BB(5) 的值。

mxdys证明第五台忙碌海狸在4700万步后停止,确认了Marxen和Buntrock的发现。

Coq专家Yannick Forster审查了证明,他激动表示:

我仍然感到非常震惊。


故事仍未结束

BB(5)终于确认了,目前相关研究者正在起草一份学术论文,这将是一个补充mxdys的Coq证明的人类可读版本。

但是,BB(5)已确认,BB(6)还会远吗?

mxdys和另一位贡献者Racheline发现了一个六规则的图灵机,其停机问题与著名的数学难题“科拉茨猜想”相似。

为了避免让大家头疼,此处不再展开这个猜想,各位看官只需要知道它非常难就行。

以至于著名理论计算机科学家Scott Aaronson发出感慨:

BB(5)也许是我们所知道的最后一个忙碌的海狸号码

嗯?这话有点耳熟,BB(4)好像也是这样说的。

参考链接:
[1]https://www.quantamagazine.org/amateur-mathematicians-find-fifth-busy-beaver-turing-machine-20240702/
[2]https://news.ycombinator.com/item?id=40857041
[3]https://scottaaronson.blog/?p=8088

【免责声明】本公众号发布的内容仅供学习交流使用,内容版权归原作者所有。如有侵犯您的权益,请及时与我们联系,我们将于第一时间删除内容。内容为作者个人观点,不代表本公众号立场和对其真实性负责。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
山西沁源女教师出轨男学生后续,高清照被扒

山西沁源女教师出轨男学生后续,高清照被扒

说真话的小陈
2024-11-23 16:08:18
《柳叶刀》表明:长寿运动第一名,并非游泳和跑步

《柳叶刀》表明:长寿运动第一名,并非游泳和跑步

尚曦读史
2024-11-19 20:50:14
10年婚姻结束?伊卡尔迪和旺达的生活充满了欺骗和出轨丑闻

10年婚姻结束?伊卡尔迪和旺达的生活充满了欺骗和出轨丑闻

足球推文C
2024-11-23 10:56:24
梁朝伟获颁荣誉博士罕晒全家福,貌美外甥女首亮相,犹如女版伟仔

梁朝伟获颁荣誉博士罕晒全家福,貌美外甥女首亮相,犹如女版伟仔

八卦宝宝
2024-11-23 16:50:46
洲际导弹的回应来了

洲际导弹的回应来了

那山星火
2024-11-22 07:51:45
再见杜兰特,再见申京,史诗级三方交易,这让其他队还怎么打

再见杜兰特,再见申京,史诗级三方交易,这让其他队还怎么打

青山隐隐啊
2024-11-23 20:25:03
CCTV5+直播,中国男篮冲击两连胜,球员14选12,郭士强对阵容微调

CCTV5+直播,中国男篮冲击两连胜,球员14选12,郭士强对阵容微调

中国篮坛快讯
2024-11-23 15:49:21
大藤沙月和横井咲樱组合夺冠,击败佐藤瞳香组合,目标是世乒赛

大藤沙月和横井咲樱组合夺冠,击败佐藤瞳香组合,目标是世乒赛

二郎神侃球
2024-11-23 19:04:24
两性:当女人羞羞时,“咪咪”会发生什么变化?全看男人怎么操作

两性:当女人羞羞时,“咪咪”会发生什么变化?全看男人怎么操作

喜马拉雅主播暮霭
2024-06-18 00:05:58
这款SUV“跌冒烟了”!从13万降到9.39万,1公里只要3毛

这款SUV“跌冒烟了”!从13万降到9.39万,1公里只要3毛

爱论历史
2024-11-22 11:00:02
U16国少队被分在第三档?上村健一或率国少踢进世少赛

U16国少队被分在第三档?上村健一或率国少踢进世少赛

环球体坛啄木鸟
2024-11-23 11:26:41
全球钻石价格再跌40%!美钻商巨头负债3亿,美媒:中国坏规矩!

全球钻石价格再跌40%!美钻商巨头负债3亿,美媒:中国坏规矩!

沧海阅铭
2024-11-21 16:06:40
“会打扮”VS“不会打扮”,终于发现:衣服再多、都不如会搭配!

“会打扮”VS“不会打扮”,终于发现:衣服再多、都不如会搭配!

疯说时尚
2024-11-15 08:00:32
罗翔:小时候不理解老人晒太阳,一坐就是半天,长大了才明白

罗翔:小时候不理解老人晒太阳,一坐就是半天,长大了才明白

清风拂心
2024-10-16 17:11:19
58岁泰森一战赚2000万,举牌女郎一夜爆红,她是什么来头?

58岁泰森一战赚2000万,举牌女郎一夜爆红,她是什么来头?

大西体育
2024-11-18 10:32:44
深夜!一起狂飙!

深夜!一起狂飙!

中国基金报
2024-11-23 00:13:57
紧急寻人!陕西16岁中学生走失多天

紧急寻人!陕西16岁中学生走失多天

91.6陕西交通广播
2024-11-21 23:13:18
战备状态!朝鲜半岛,突发!

战备状态!朝鲜半岛,突发!

数据宝
2024-11-23 13:28:01
车长5米5!尊界S800再曝渲染图,真是国产“劳斯莱斯”?

车长5米5!尊界S800再曝渲染图,真是国产“劳斯莱斯”?

优视汽车
2024-11-23 16:50:15
马斯克向特朗普提出建议,台湾是中国的特别行政区

马斯克向特朗普提出建议,台湾是中国的特别行政区

智凌纵横
2024-11-10 20:30:02
2024-11-24 01:03:00
中国人工智能学会
中国人工智能学会
中国人工智能学会网易官方账号
2991文章数 1462关注度
往期回顾 全部

科技要闻

华为徐直军首谈鸿蒙生态是什么

头条要闻

拜登政府常务副国务卿放话:我们在努力"拆散"中俄

头条要闻

拜登政府常务副国务卿放话:我们在努力"拆散"中俄

体育要闻

那个"最惨背景帝" 41岁还是五大联赛主力

娱乐要闻

德云社人事大变动!烧饼担任副总

财经要闻

钟睒睒的“愤怒”,谁能消解?

汽车要闻

对话张纯伟:80万!捷途立了一个新Flag

态度原创

房产
教育
手机
健康
公开课

房产要闻

丁村迎来大动作!首宗、百亩城更宅地挂出!楼面价2367元/㎡!

教育要闻

121名海淀教师“启航杯”获奖!看看有你认识的吗?

手机要闻

华为Mate70系列再次被确认:散热革新、影像突破,鸿蒙也有好消息

花18万治疗阿尔茨海默病,值不值?

公开课

一块玻璃,如何改变人类世界?

无障碍浏览 进入关怀版