网易首页 > 网易号 > 正文 申请入驻

登Nature的AI芯片设计屡遭质疑,谷歌发文:质疑者连预训练都没做

0
分享至

机器之心报道

机器之心编辑部

终于,面对近年来对自家自动 AI 芯片设计研究的质疑,谷歌坐不住了,发文回应!论文作者中包括了谷歌首席科学家 Jeff Dean。

  • 论文地址:https://arxiv.org/pdf/2411.10053
  • 论文标题:That Chip Has Sailed: A Critique of Unfounded Skepticism Around AI for Chip Design

我们先来回顾一下事情的来龙去脉:

2020 年,谷歌发表了预印本论文《Chip Placement with Deep Reinforcement Learning》,介绍了其设计芯片布局的新型强化学习方法 AlphaChip。在 2021 年,这项研究发表在 Nature 上并开源了出来。

此后,AlphaChip 激发了 AI 芯片设计方面的大量工作,并在谷歌母公司 Alphabet 三代 TPU、数据中心 CPU 和其他芯片中部署,并由外部芯片制造商扩展。

然而,ISPD 2023 上的一篇论文对谷歌 AlphaChip 的性能提出了质疑(Cheng 等人),论文指出,尽管谷歌承诺会提供数据和代码,但实际上这些资源并不完全可用。

论文地址:https://arxiv.org/pdf/2302.11014

Cheng 等人还认为基于谷歌的 Circuit Training(CT)框架的 AlphaChip 和《Nature》论文存在几项不一致:如输入网表的预放置信息、代理成本函数的权重设置、宏观和标准单元群集的放置规则等。

根据他们的评估,相比模拟退火算法(SA),在大多数情况下,AlphaChip 的代理成本更高、HPWL 也不如 SA 方法。

但谷歌方称:「他们并没有按照我们 Nature 论文中描述的方法运行。」

例如 Cheng 等人的论文中没有预训练 RL 方法(消除了从先验中学习的能力)、使用的计算资源少得多(RL 经验收集器减少 20 倍,GPU 数量减少一半)、没有训练到收敛(机器学习标准做法),并且用于评估的测试用例也是过时的。

在最近一期 CACM 上,Synopsys 的杰出架构师 Igor Markov 也发表了对三篇论文的元分析,包括登上《Nature》的 AlphaChip 原论文、Cheng 等人投稿到 ISPD 的论文以及 Markov 未发表的论文,总结了人们对 AlphaChip 的各种质疑。

文章地址:https://cacm.acm.org/research/reevaluating-googles-reinforcement-learning-for-ic-macro-placement/

谷歌还拉了一张时间线:

因此,面对以上质疑,谷歌通过本文进行了回应,确保没有人因为错误的原因而放弃在这个有影响力的领域继续创新。

Jeff Dean 发推表示,Cheng 等人的论文很大程度上并没有遵循谷歌的方法,尤其是没有进行预训练,在算力、训练收敛方面也都存在缺陷。

Jeff Dean 还认为,Igor Markov 的文章提出了含蓄的指控,完全没有根据。他很惊讶 Synopsys 竟然想与此事扯上关系,也很惊讶 CACMmag 竟然认为发表这些指控是恰当的。除了两篇有缺陷、未经同行评议的文章之外,没有任何证据或技术数据。

Cheng 等人在复现谷歌方法时的错误

Cheng 等人并未按照谷歌在《Nature》中的描述复刻论文中方法,因此他们的结果不好,并不意外。

以下是谷歌指出的主要错误:

未对强化学习方法进行预训练

AlphaChip 的核心优势在于能够从先验中学习,即在正式测试前通过「练习」模块中进行预训练。去除这一点,相当于评估一个完全不同且效果变差的方法。

下图 2 中展示了:训练数据集越大,AlphaChip 在新模块上的布局效果越好。

AlphaChip 的原论文中也通过下表展示了对 20 个模块进行预训练,模型可以掌握更有效的布局策略的效果。

此外,AlphaChip 的原论文中多次强调预训练的重要性。例如下图所示,在开源的 Ariane RISC-V CPU 上,未预训练的强化学习策略需要 48 小时才能接近预训练模型 6 小时的效果。

AlphaChip 在主数据表中的实验结果正是基于 48 小时的预训练,但 Cheng 等人没有进行任何预训练。这意味着强化学习模型从未接触过芯片,需要从零开始在每个测试案例上学习布局。

这就像对未见过围棋对局的 AlphaGo,却得出了 AlphaGo 不擅长下围棋的结论。

为此,Cheng 等人在论文中指出,谷歌开源的内容不支持复现预训练。但预训练仅需运行多个案例的训练过程,开源的数据一直支持预训练。

在 Cheng 等人的论文中称,截至目前,对 AlphaChip《Nature》论文和 CT 框架的数据和代码都未完全公开,因此,评估遇到了阻碍。

用的计算资源少了一个数量级

强化学习经验收集器比 Nature 论文中少 20 倍 (26 个 VS 512 个),GPU 数量也少一半 (8 个 VS 16 个)。计算资源变少往往需要更长的训练时间才能达到相同的效果。

根据另一篇复现 AlphaChip 的论文《Scalability and Generalization of Circuit Training for Chip Floorplanning》,使用更多 GPU 进行训练可以加速收敛。

如果 Cheng 等人能够按照 AlphaChip 原论文中的描述配置实验,其结果可能会有所改善。

没有训练到收敛

众所周知,没训练到收敛会显著影响模型性能。

从 Cheng 等人的项目网站,可以找到四个模块的收敛曲线(Ariane-GF12、MemPool-NG45、BlackParrot-GF12 和 MemPool-GF12),但在这些模块的训练中均未达到收敛状态(他们还没提供 BlackParrot-NG45 或 Ariane-NG45 的曲线)。

对于这四个模块,训练均在相对较少的步数下被中断。

在不具代表性且无法复现的基准上进行评估

Cheng 等人使用的基准 (45nm 和 12nm 的节点)与 AlphaChip(7nm 以下的节点)所用的相比,更老更旧,在物理设计上差异显著。

对于 10nm 的技术节点,多重图形化技术容易引发布线拥塞问题。

因此,对于没那么先进的技术节点,可能需要调整 AlphaChip 的奖励函数中的相关组件。

AlphaChip 的研究团队称:「我们主要为 7nm、5nm 以及更先进的工艺节点设计,对于前几代节点,尚未深入研究。但我们欢迎社区在这方面的贡献!」

此外,Cheng 等人未能或不愿提供用于复现其主要数据表中结果的综合网表。

对此,AlphaChip 的研究团队称:「Cheng 等人虽说对我们的方法进行了大规模重现,但是不是复现错了?我们建议直接使用我们的开源代码。」

除了在复现谷歌方法时存在错误,Cheng 等人还存在一些其他问题,包括如下:

  • 将 AlphaChip 与闭源商业自动布局器做对比;
  • 在调整标准单元设计时,对初始布局进行了人为「消融」;
  • 有缺陷的相关性研究;
  • 对谷歌工程师验证的错误声明。

Cheng 等人声称,谷歌的代理成本与最终指标没有很好的相关性,但他们自己的相关性研究实际上表明,总体代理成本与除标准单元面积之外的所有最终指标之间存在微弱但正相关的相关性。具体如下图 6 所示。

最后,谷歌表示 AlphaChip 完全开源,他们开源了一个软件存储库,以完全复现《Nature》论文中描述的方法。RL 方法的每一行都可以免费检查、执行或修改,并且提供源代码或二进制文件来执行所有预处理和后处理步骤。

GitHub 地址:https://github.com/google-research/circuit_training

更多回应细节请参阅原论文。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
职业生涯法网首胜!吴易昺三盘横扫过关,下轮将战10号种子

职业生涯法网首胜!吴易昺三盘横扫过关,下轮将战10号种子

全景体育V
2026-05-26 05:16:53
刚刚 | 盒马道歉:全部下架!

刚刚 | 盒马道歉:全部下架!

天津广播
2026-05-25 22:54:46
王晶拆解《给阿嬷的情书》,内行人一针见血:跟风拍摄不可以

王晶拆解《给阿嬷的情书》,内行人一针见血:跟风拍摄不可以

光影新天地
2026-05-26 11:26:16
工龄41年6个月,2026.5江苏养老金还不错!

工龄41年6个月,2026.5江苏养老金还不错!

乐天果果
2026-05-26 14:40:43
61岁的王姬驾驭一身黑色礼服,这身材让年轻人都望尘莫及

61岁的王姬驾驭一身黑色礼服,这身材让年轻人都望尘莫及

大江
2026-05-24 12:20:25
底越掀越深!体育生当医生、院长儿子吃空饷,不敢再挖了

底越掀越深!体育生当医生、院长儿子吃空饷,不敢再挖了

奇思妙想草叶君
2026-05-03 22:56:14
辛芷蕾哭了!陕西知名演员孙浩发文告别

辛芷蕾哭了!陕西知名演员孙浩发文告别

石辰搞笑日常
2026-05-26 13:56:34
哇塞!八块腹肌的杨瀚森!

哇塞!八块腹肌的杨瀚森!

柚子说球
2026-05-25 23:00:33
演员袁立辟谣 "抗癌成功" ,称颈部纱布实为眼罩,怒斥平台封其账号却放任谣言传播,同时回应被陈建斌、朱媛媛与辛柏青“欺负”之说

演员袁立辟谣 "抗癌成功" ,称颈部纱布实为眼罩,怒斥平台封其账号却放任谣言传播,同时回应被陈建斌、朱媛媛与辛柏青“欺负”之说

鲁中晨报
2026-05-25 16:23:16
女选手隐私部位被直播,难道不是拿人血馒头赚流量?

女选手隐私部位被直播,难道不是拿人血馒头赚流量?

廖保平
2026-05-26 08:41:36
他是黎家盈丈夫,放弃事业迁居北京照顾3孩子,难怪妻子能上太空

他是黎家盈丈夫,放弃事业迁居北京照顾3孩子,难怪妻子能上太空

娱妮啵啵啊
2026-05-25 00:03:18
亨特拉尔:我逐渐找回了生活的热情,心理状态已恢复很多

亨特拉尔:我逐渐找回了生活的热情,心理状态已恢复很多

懂球帝
2026-05-26 16:26:45
王楚钦母亲首次谈儿媳标准!3个要求曝光后,网友集体沉默了

王楚钦母亲首次谈儿媳标准!3个要求曝光后,网友集体沉默了

橙星文娱
2026-05-26 10:53:35
这跟不穿有啥区别?戛纳闭幕式,女星下垂、副乳突出,露的好辣眼

这跟不穿有啥区别?戛纳闭幕式,女星下垂、副乳突出,露的好辣眼

嫹笔牂牂
2026-05-26 07:30:48
利物浦的争议功勋,先后让阿森纳与曼联痛失冠军,却被伊布嘲讽

利物浦的争议功勋,先后让阿森纳与曼联痛失冠军,却被伊布嘲讽

足篮大世界
2026-05-26 18:06:06
橘玛丽引退作终登场,好友大槻响与波多野结衣温情送别

橘玛丽引退作终登场,好友大槻响与波多野结衣温情送别

吃瓜党二号头目
2026-05-26 09:23:35
不管有钱没钱,尽快扔掉家里的这7样东西!不是瞎说,有科学依据

不管有钱没钱,尽快扔掉家里的这7样东西!不是瞎说,有科学依据

家居设计师宅哥
2026-05-04 12:45:59
两年减少1.2亿张,中国信用卡数量跌回2018年水平,发生了什么?

两年减少1.2亿张,中国信用卡数量跌回2018年水平,发生了什么?

风向观察
2026-05-25 19:35:10
布莱顿官方:日本前锋三笘薰已成功接受了腿筋手术

布莱顿官方:日本前锋三笘薰已成功接受了腿筋手术

懂球帝
2026-05-26 06:42:24
太难了!成都选调生拟录用名单出炉:总人数跌破100!

太难了!成都选调生拟录用名单出炉:总人数跌破100!

音乐时光的娱乐
2026-05-26 13:58:34
2026-05-26 18:47:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
13087文章数 142653关注度
往期回顾 全部

科技要闻

中国AI要向外卷,而不只是做第二个OpenAI

头条要闻

25岁海归男恋上32岁离异女 因88.8万彩礼闹掰追讨12万

头条要闻

25岁海归男恋上32岁离异女 因88.8万彩礼闹掰追讨12万

体育要闻

上赛季差点降入英甲,下赛季要踢英超了

娱乐要闻

台媒贴脸!S妈被问大S嗑药当场沉默

财经要闻

中国铝行业爆单 下一个“煤炭”大周期?

汽车要闻

涉水加强 福特烈马亚马逊限量版上市 售价39.98万

态度原创

房产
家居
亲子
数码
军事航空

房产要闻

招商地产接盘碧桂园!海口这个烂尾豪宅,要彻底改命?

家居要闻

生与命相依 旧公寓改造

亲子要闻

宝蓝爸爸把宝蓝的钓鱼玩具弄坏了,赶紧让宝蓝叔叔来修理。

数码要闻

618消费观察:当“情价比”取代性价比,怎样的电视正在被买走?

军事要闻

美伊在阿巴斯港附近短暂交火 交战过程披露

无障碍浏览 进入关怀版