网易首页 > 网易号 > 正文 申请入驻

DeepMind 的 AlphaFold2 揭示:卷积OUT了,注意力机制上位!

0
分享至

我们对AlphaFold 2的工作原理已有了深入了解,但蛋白质为何以其特有的方式折叠仍然是个谜。

谷歌的AI部门DeepMind几年前发明了战胜国际象棋冠军的神经网络AlphaZero,去年11月再次震惊了全世界,其程序破解了困扰几十年的蛋白质折叠问题。该程序轻松击败了所有竞争对手,一位研究人员称之为“分水岭时刻”,有望彻底改变生物界。

AlphaFold 2当时在DeepMind的一篇博文和DeepMind 为提交这款程序以参加的大赛提供的论文摘要中只进行了简短的描述。大赛名为“蛋白质结构预测关键技术评估大赛”(CASP),两年一度。

上周,DeepMind终于披露了详情,不仅发表了一篇博文,还提供了DeepMind的John Jumper及其同事在《自然》杂志上撰写的16页长的总结论文、62 页的补充材料以及GitHub上的代码库。《自然》杂志的Ewan Calloway撰文介绍了新的细节,称DeepMind披露的数据意味着“蛋白质结构走向大众化”。

那么,我们了解了什么?好些方面。顾名思义,这个神经网络是第一代AlphaFold的后续版,第一代AlphaFold在2018年的上一场大赛中也击败了竞争对手。AlphaFold 2给人最直接的启示是,AI方面取得进步可能需要所谓的架构变化。

软件程序的架构是所使用的特定操作集及其组合方式。第一代AlphaFold由卷积神经网络(即CNN)组成,这是一种经典神经网络,在过去十年为许多AI突破立下了汗马功劳,比如在ImageNet计算机视觉大赛中取得胜利。

但是卷积过时了,现在流行图(graph)。或者更具体地说,现在流行图网络与所谓的注意力(attention)的结合体。

图网络是指可以从事物的相关性以及它们如何通过友谊(比如社交网络中的人)相关联这方面评估事物的集合。在这种情况下,AlphaFold使用有关蛋白质的信息来构建一个图,表明不同的氨基酸彼此相距有多近。

这些图由在AI的许多领域越来越受欢迎的注意力机制来操纵。广义上讲,注意力是为某些输入数据添加额外计算能力的做法。利用注意力的程序已在众多领域带来了突破,尤其是在自然语言处理领域,谷歌的Transformer就是佐证。

第一代AlphaFold中使用卷积的部分在Alpha Fold 2中已被摈弃,取而代之的是一大堆注意力机制。

使用注意力机制在AlphaFold2中很普遍。AlphaFold的第一个部分是所谓的EvoFormer,它使用注意力来集中处理计算每个氨基酸与另一个氨基酸的关系图。由于图中创建的几何形态,Jumper及其同事将这种评估图的操作称为“三角自注意力”(triangle self-attention)。

与自然语言程序相呼应,EvoFormer让三角注意力可以将信息发回到氨基酸序列组(名为“多重序列比对”,即MSA),生物信息学中的这个常见术语是指逐一比较相关的氨基酸序列。

论文作者认为MSA和图因注意力而处于某种对话中——他们称之为“联合嵌入”(joint embedding)。因此,注意力促成了程序各部分之间的联系。

继EvoFormer之后,AlphaFold 2的第二个部分是所谓的结构模块(Structure Module),它负责将EvoFormer构建的图转换成蛋白质3-D结构的规格,其结果赢得了CASP大赛。

在这里,作者们引入了一种可以单独计算蛋白质各部分的注意力机制,名为“不变点注意力”机制。他们称之为“可感知几何形状的注意力操作”。

结构模块在空间中的某个原点启动粒子,你可以将其视为3-D参考场(名为“残余气体”),随后进而旋转和移动粒子,以形成最终的3-D结构。同样,重要的是使用注意力机制,彼此独立地转换粒子。

为什么图和注意力取代卷积很重要?在去年为研究提供的原始摘要中,Jumper及同事指出,需要将目光转移到所谓的“局部”结构之外的领域。

回到AlphaFold 1,卷积神经网络的工作原理是测量氨基酸之间的距离,然后将所有氨基酸对的测量结果汇总为二维图,名为距离直方图(即distogram)。然后,CNN以其方式来仔细研究该图,从而找到局部模体(motif),而局部模拟构成跨越远距离的越来越广泛的模体。

但是,从局部模体依次铺开的这种做法会忽略远程依赖,而远程依赖是注意力应捕获的重要元素之一。比如说,EvoFormer中的注意力机制可以将三角注意力机制中学到的内容与 搜索MSA中学到的内容联系起来——不仅仅是MSA的一个部分,而是相关氨基酸序列的整个集合。

因此,注意力带来了本质上更具“全局性”的突破。

我们在AlphaFold中看到的另一点是端到端目标。在第一代AlphaFold中,物理结构的最终装配完全取决于卷积以及它们得出的结果。

而在AlphaFold 2中,Jumper及其同事强调了“端到端”训练神经网络。正如他们所说:

“在结构模块和整个网络中,我们通过反复将最终损耗运用于输出,然后将输出反复馈送给相同的模块,从而强化迭代优化这一概念。使用整个网络的迭代优化(我们称之为“回收”,与计算机视觉中的方法有关)仅用少许的额外训练时间,就可以显著提高准确性。”

因此,AlphaFold 2的另一大启示是这个概念:神经网络确实需要不断改进其预测。对回收操作如此,其他方面也是如此。比如说,制作氨基酸图的EvoFormer可在EvoFormer的多个阶段(即所谓的“block”)中的每个阶段修正这些图。Jumper及其团队将这种持续更新称为整个网络的“持续沟通”。

论文作者特别指出,通过不断修正,程序的结构部分似乎“顺畅地”优化蛋白质模型。他们写道:“AlphaFold对结构不断地进行逐步改进,直到再也无法改进为止。”有时,这个过程“很贪婪”,这意味着结构模块在处理层的早期就找到了一个好的解决方案;有时,需要花较长的时间。

无论如何,在这种情况下,训练神经网络或网络组合的好处似乎肯定成为许多研究人员强调的重点。

除了这一大启示外,AlphaFold 2的核心仍有一大谜团:为什么?

即为什么蛋白质以其特有的方式折叠?AlphaFold 2展示了宇宙中的每一个蛋白质揭示其结构的前景,这又是一项努力了数十年的成就。但是AlphaFold 2并没有解释为什么蛋白质会呈现出其形状。

蛋白质是氨基酸,使它们卷曲成特定形状的力相当简单——比如某些氨基酸被正电荷或负电荷吸引或排斥,而某些氨基酸“恐水”,这意味着它们远离水分子。

但论文作者仍未解释为什么某些氨基酸呈现出如此难以预测的形状。

AlphaFold 2在构建将序列数据转换成蛋白质模型的机器方面取得了非凡的成就,但我们可能需要等待对该程序本身的进一步研究,才能了解它在蛋白质行为方面告诉我们的全局信息。

参考链接:https://www.zdnet.com/article/deepminds-alphafold-2-reveal-what-we-learned-and-didnt-learn/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
再次反悔!大众突然宣布不跟中国合作,因工会阻挠,中国建厂无望

再次反悔!大众突然宣布不跟中国合作,因工会阻挠,中国建厂无望

天天热点见闻
2026-05-23 08:22:52
既然给脸不要脸,那就彻底撕破脸!王毅外长已经把话挑明了

既然给脸不要脸,那就彻底撕破脸!王毅外长已经把话挑明了

安安说
2026-02-01 14:01:51
脸没恢复就别出来拍剧了,顶着膨胀脸、说话嘴歪全是痘坑,太出戏

脸没恢复就别出来拍剧了,顶着膨胀脸、说话嘴歪全是痘坑,太出戏

林轻吟
2026-05-25 19:36:15
郑钦文哭红双眼!0-2惨遭一轮游,原因曝光,失误32-5,跌出前100

郑钦文哭红双眼!0-2惨遭一轮游,原因曝光,失误32-5,跌出前100

体育就你秀
2026-05-26 02:05:03
山西矿难,越扒越惊心

山西矿难,越扒越惊心

亮见
2026-05-25 13:45:17
沉默45年,中国终于迎来第二轮“严打”!目标改变总体战正式打响

沉默45年,中国终于迎来第二轮“严打”!目标改变总体战正式打响

闻识
2026-05-04 08:59:03
郑钦文法网首轮出局!扣420分世界排名跌至第117 已成中国四姐

郑钦文法网首轮出局!扣420分世界排名跌至第117 已成中国四姐

念洲
2026-05-25 18:45:55
美国新规:百万华人离境十年不得入境

美国新规:百万华人离境十年不得入境

深度解析热点
2026-05-25 22:43:01
【2026.5.25】王鹤棣不去《hi6》了?韩东君女朋友?卢昱晓《何不同舟渡》?什么作者编剧总要给主角的人生中安排一个悲惨的遭遇?

【2026.5.25】王鹤棣不去《hi6》了?韩东君女朋友?卢昱晓《何不同舟渡》?什么作者编剧总要给主角的人生中安排一个悲惨的遭遇?

娱乐真爆姐
2026-05-26 00:01:00
活久见!因女生投诉男子光膀健身不雅,浙江一健身房禁止女性入店

活久见!因女生投诉男子光膀健身不雅,浙江一健身房禁止女性入店

火山詩话
2026-05-24 12:20:45
深圳男子买彩票中2亿,6天后去兑奖,却被工作人员赶了出去

深圳男子买彩票中2亿,6天后去兑奖,却被工作人员赶了出去

今天说故事
2025-05-28 14:49:59
李连杰辟谣换心脏、换血、打干细胞:说我死无所谓,说一个无辜的20多岁年轻武僧,这种二次伤害对其家人非常严重

李连杰辟谣换心脏、换血、打干细胞:说我死无所谓,说一个无辜的20多岁年轻武僧,这种二次伤害对其家人非常严重

现代快报
2026-05-25 09:18:38
穷果然不养人!家里破产后,王文也面相都变了,公主开始吃路边摊

穷果然不养人!家里破产后,王文也面相都变了,公主开始吃路边摊

残梦重生来
2026-05-25 04:29:17
江苏女子打砸奶茶店:正脸曝光,身份被扒不简单,或再迎2大噩耗

江苏女子打砸奶茶店:正脸曝光,身份被扒不简单,或再迎2大噩耗

以茶带书
2026-05-25 16:12:42
库里:NBA真正影响全世界的只有4个人,我还不够资格!

库里:NBA真正影响全世界的只有4个人,我还不够资格!

钱说体育
2026-05-25 13:00:31
杭州坠亡女童米粒母亲官宣怀三胎,网友多表示理解与祝福

杭州坠亡女童米粒母亲官宣怀三胎,网友多表示理解与祝福

天空空啊
2026-05-25 15:16:18
警惕新型诈骗!广东一女子花110余万元买黄金投资,期待高额回报,提现时却傻眼了,警方紧急追回黄金;被骗女子:人赚不到认知外的钱

警惕新型诈骗!广东一女子花110余万元买黄金投资,期待高额回报,提现时却傻眼了,警方紧急追回黄金;被骗女子:人赚不到认知外的钱

大风新闻
2026-05-25 23:19:03
山西沁源矿难造成人间惨剧,老板或面临百亿身家归零,暂无监管干部被立案追责

山西沁源矿难造成人间惨剧,老板或面临百亿身家归零,暂无监管干部被立案追责

普通人ThePeople
2026-05-25 17:04:45
拒不谢罪,高市派人想见中方,中方不接招,没想到更惨的还在后面

拒不谢罪,高市派人想见中方,中方不接招,没想到更惨的还在后面

明天后天大后天
2026-05-26 00:55:06
40岁还在逼自己!亨利坦言:C罗最可怕的不是进球,而是永不满足

40岁还在逼自己!亨利坦言:C罗最可怕的不是进球,而是永不满足

体育闲话说
2026-05-13 08:48:32
2026-05-26 02:48:49
云头条 incentive-icons
云头条
引领科技变革,连接技术与商业。
20224文章数 27322关注度
往期回顾 全部

科技要闻

华为:没有先进光刻机也能造出高端芯片

头条要闻

伊朗媒体披露最高领袖就医情况

头条要闻

伊朗媒体披露最高领袖就医情况

体育要闻

如果不好好守门,他可能早就继承家业了

娱乐要闻

李晨郑恺跑男停宣:12年元老被边缘化

财经要闻

起底煤矿“暗面”:假整改、假数据

汽车要闻

启境GT7定档5月29日预售 提供三电机版本

态度原创

健康
家居
教育
亲子
艺术

几百块一瓶的外泌体精华,涂脸上是“智商税”吗?

家居要闻

生与命相依 旧公寓改造

教育要闻

罚抄10遍被投诉,一个电话让全班没了作业,孩子就毁这类家长手里

亲子要闻

还有多少“儿童牙膏”在玩概念游戏? | 新京报快评

艺术要闻

于东来计划建小区,建筑设计用材都公开,地产界震动?

无障碍浏览 进入关怀版