网易首页 > 网易号 > 正文 申请入驻

Science评论:深度学习助力高通量结构生物信息学

0
分享至

导语

以AlphaFold 2和RoseTTAfold等方法为代表的深度学习技术,不仅实现了蛋白质结构预测领域的突破性进展,也正在开启深度学习时代的相互作用组学研究。最近一篇发表在Science的工作,基于深度学习技术,创建了能够同时预测蛋白质-蛋白质相互作用的三维结构的新方法,并为作用过程建模。借助该技术,研究者甚至发现了许多此前从未观测到的相互作用。深度学习正在将以相互作用组学为代表的结构生物信息学推向新高度。

研究领域:深度学习,蛋白质结构,蛋白质互作,结构生物信息学

J. Pereira & T. Schwede| 作者

刘培源| 译者

赵雨亭| 审校

邓一雪| 编辑

原文题目: Interactomes in the era of deep learning 原文链接: https://www.science.org/doi/10.1126/science.abm8295

1. 传统蛋白互作与计算建模的加入

表征大分子相互作用可以更好地理解细胞内部运作。但是,如今所有可用的方法都有其局限性:一些方法告诉我们两个大分子是否相互作用,另一些方法提供关于相互作用对象的原子细节,或者仅仅是没有细胞背景的孤立组件的结构。Humphreys等人最近发表于Science论文[1]描述了一种新的计算方法,它建立在结构生物信息学中正在进行的深度学习革命[2,3]的基础上,同时预测蛋白质-蛋白质相互作用的三维结构的组成与建模。他们将其方法应用于真核系统——面包酵母菌,并预测和准确模拟了1500多种蛋白质-蛋白质相互作用,其中有106种是第一次实现。这为整个细胞的高通量、高精度建模铺平了道路。

测定大分子在3D结构层面上的相互作用提供了有关大分子机制的重要信息,这些信息可以用于药物开发或生物技术开发等。高分子结晶(MX)和高分辨率低温电子显微镜(cryo-EM)等实验结构生物学方法,提供了大分子结构及其组装的原子级的细节[4]。这样的实验操作复杂:需要从细胞环境中提纯大分子。虽然诸如酵母双杂交(Y2H)和交联质谱(XL-MS)等技术允许大规模检测相互作用对象,但定点诱变或Förster能量共振转移(FRET)实验等方法能够表征单个相互作用与界面。这些信息可以用来指导装配体建模,例如通过分子对接的综合(或混合)方法,将来自低分辨率实验的各种数据类型与计算建模相结合,以生成大分子装配体的3D表示[5]。

近年来,结构生物学的视野因为结构预测计算技术而急剧扩大(如下图所示),这得益于机器学习算法的发展[6]以及开放数据库中实验信息的快速增长。例如蛋白质数据库(今年庆祝成立50周年)。自1994年以来,结构预测的临界评估(CASP)实验为检测蛋白质结构预测方法提供了一个平台,并且在其发展中经历了(也激发了)数次革命[7]。例如,用于检测远程同源关系的灵敏方法促进了基于同源性的建模,并且协同进化信息的使用进一步改进了没有已知结构同源物的蛋白质的模型。后一种方法是基于进化耦合的思想,从多序列比对中提取的耦合信号可以用来预测三维空间中的密切接触。这不仅被证明对蛋白质3D结构预测很有用,而且很容易扩展到分子间相互作用的领域:例如一种快速和准确的方法来筛选和预测蛋白质相互作用对(protein-interacting pairs,如大肠杆菌的蛋白质组)[8,9]。

2. 深度学习助力预测蛋白质互作

今年,结构生物信息学有了新突破,崭新时代开启[2,3]:DeepMind的AlphaFold2算法[6]成为第一个在CASP竞赛[10]中能够对单个蛋白质结构达到接近实验原子精读的计算方法[10]。其成功基础是综合使用了最先进的深度学习方法、大规模计算能力以及过去50年积累的海量结构和序列数据。这促进了科学社区中快速而激烈的活动——RoseTTAfold作为AlphaFold2的学术竞争对手迅速崛起[11]。这两种方法都使用了最先进的深度学习方法,但是它们的核心架构不同。尽管如此,两者重要的共同点是使用了多序列比对的进化耦合(evolutionary couplings from multiple sequence alignments)——在其底层往网络中得到有效处理,从而预测原子间接触,并根据氨基酸序列准确计算目标蛋白质中原子的3D坐标。鉴于此类信号在识别蛋白质间相互作用方面已取得成功[8,9],因此探索此类方法对于在原子水平上改进蛋白质间相互作用及其组装的预测和建模是有意义的。

研究大分子机器的方法示意图。基于深度学习方法补充了实验技术,允许对蛋白质组装进行全蛋白质组的预测和建模

虽然大多数的努力集中在改造AlphaFold2和RoseTTAFold工作流程以模拟已知组成和化学计量的蛋白质复合物[12],但Humphreys等人将RoseTTAFold的接触预测算法的速度与AlphaFold2折叠引擎的高精度相结合,并提出了一种新方法来同时准确预测和建模面包酵母菌蛋白质组中的蛋白质相互作用对——这是第一个被以如此高通量方式对其相互作用进行建模的真核生物。Humphreys等人扫描了大约800万对蛋白质,根据强烈的协同进化信号预测了哪些蛋白质之间更可能发过相互作用,并且通过连接对(joint pair)的蛋白质结构预测取代大分子连接(macromolecular docking),以模拟组装的3D结构。该方法能够准确预测1500多个相互作用对的组成并对其结构建模。这些相互作用对几乎涵盖了所有关键的真核细胞过程,包括106种未被描述的组合(可能会突显出此前未知的生物过程),以及600多个此前已知的相互作用对(根据低分辨率生物物理数据)。

Humphreys等人的工作向高分辨率的整个细胞模型迈进了一步,并且已经启发了对人类线粒体相互作用的进一步研究[13]。目前,如高分子结晶和电子显微镜(EM)方法可以提供单个大分子机器的高分辨率原子表示。细胞低温电子断层成像有可能提供大分子相互作用网络的详细快照,但迄今为止只能获得亚纳米分辨率[14]。基于人工智能的高精度蛋白质组相互作用模型,可能能够及时弥补分辨率差距——尤其是对于更复杂的生物体。尽管如此,AlphaFold2和RoseTTAFold等方法提供了静态模型,未来还需要解决大分子组装的瞬态和动态特性。

这项工作还突出了开放科学和基于社区的方法开发的成功。由一家商业公司开发的AlphaFold2,向这个科学社区公开模型及其源代码。这促进了不同目标基于AI的生物信息学方法的快速发展,例如Humphreys等人的研究。基于人工智能方法显然正在促进未来生命科学研究方式的转变,其中3D计算模型将经常激发新的可实验验证的假说。

参考文献

1. I. R. Humphreys et al., Science 374, eabm4805 (2021).

2. A. N. Lupas et al., Biochem. J. 478, 1885 (2021).

3. S. M. Kandathil, J. G. Greener, D. T. Jones, Proteins 87, 1179 (2019).

4. T. Nakane et al., Nature 587, 152 (2020).

5. A. Sali, J. Biol. Chem. 296, 100743 (2021).

6. J. Jumper et al., Nature 596, 583 (2021).

7. A. Kryshtafovych et al., Proteins 89, 1607 (2021).

8. Q. Cong et al., Science 365, 185 (2019).

9. A. G. Green et al., Nat. Commun. 12, 1396 (2021).

10. J. Pereira et al., Proteins 89, 1687 (2021).

11. M. Baek et al., Science 373, 871 (2021).

12. R. Evans et al., bioRxiv 10.1101/2021.10.04.463034 (2021).

13. J. Pei et al., bioRxiv 10.1101/2021.09.14.460228 (2021).

14. M. Turk, W. Baumeister, FEBS Lett. 594, 3243 (2020).

复杂科学最新论文

集智斑图顶刊论文速递栏目上线以来,持续收录来自Nature、Science等顶刊的最新论文,追踪复杂系统、网络科学、计算社会科学等领域的前沿进展。现在正式推出订阅功能,每周通过微信服务号「集智斑图」推送论文信息。扫描下方二维码即可一键订阅:





特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
江苏3家银行或将被收购

江苏3家银行或将被收购

环球网资讯
2025-08-01 20:07:31
意媒:比塞克告知国米希望加盟水晶宫,后者提供500万欧税后年薪

意媒:比塞克告知国米希望加盟水晶宫,后者提供500万欧税后年薪

直播吧
2025-08-01 23:46:13
5年2.7亿顶薪,我必须留下,但你也不许走!湖人这次或许要失算了

5年2.7亿顶薪,我必须留下,但你也不许走!湖人这次或许要失算了

老梁体育漫谈
2025-08-01 23:27:42
在健身房,被恶心到了。

在健身房,被恶心到了。

健身迷
2025-07-02 00:21:44
清洁工捡到50万主动上交,失主却说少了,清洁工一句话让他傻眼

清洁工捡到50万主动上交,失主却说少了,清洁工一句话让他傻眼

今天说故事
2025-07-17 18:36:43
九三阅兵在即,国务院罕见发声,不谈装备方队却邀国民党抗战老兵

九三阅兵在即,国务院罕见发声,不谈装备方队却邀国民党抗战老兵

小笛科技
2025-07-31 11:30:13
菲尔普斯:我们应该来一点手段,将于子迪禁赛,这是在保护她

菲尔普斯:我们应该来一点手段,将于子迪禁赛,这是在保护她

深析古今
2025-08-01 17:33:15
辽宁官方回应篮协重磅罚单引热议 大量球迷狂刷评论区 舆论两边倒

辽宁官方回应篮协重磅罚单引热议 大量球迷狂刷评论区 舆论两边倒

狼叔评论
2025-08-01 14:18:13
故事:远华集团老总赖昌星,被捕后谈及董文华,内容让人不堪入耳

故事:远华集团老总赖昌星,被捕后谈及董文华,内容让人不堪入耳

凯裕说故事
2025-01-20 16:07:07
40岁保姆色诱70岁教授,“性猝死”背后竟是谋杀 如何露馅的?

40岁保姆色诱70岁教授,“性猝死”背后竟是谋杀 如何露馅的?

米米大肉
2024-06-22 12:46:15
最伤害 “阴道” 的 4 个行为,还在经常做的,看完要注意了

最伤害 “阴道” 的 4 个行为,还在经常做的,看完要注意了

伊人河畔
2025-07-12 10:13:49
罪恶的柬埔寨,让中国人闻风丧胆?为什么是东南亚最可怕的国家?

罪恶的柬埔寨,让中国人闻风丧胆?为什么是东南亚最可怕的国家?

新车知多少
2025-08-01 03:00:07
日本民间的反华浪潮

日本民间的反华浪潮

求实处
2025-07-31 23:40:57
尹锡悦拒捕细节曝光!仅身着内衣躺地,与特检组对峙超两小时

尹锡悦拒捕细节曝光!仅身着内衣躺地,与特检组对峙超两小时

南方都市报
2025-08-01 18:23:52
巴黎圣日耳曼即将引爆7000万欧元重磅转会

巴黎圣日耳曼即将引爆7000万欧元重磅转会

星耀国际足坛
2025-08-01 13:54:27
跟泼天富贵擦肩而过是啥体验?网友:前前男友公司上市了……

跟泼天富贵擦肩而过是啥体验?网友:前前男友公司上市了……

解读热点事件
2025-07-14 00:20:02
明明是男主,却接连被配角抢风头,张凌赫的男主运真惨

明明是男主,却接连被配角抢风头,张凌赫的男主运真惨

南浔杨柳
2025-07-30 23:02:31
李诞社交软件评论区被网友骂到关闭,曾在节目中称柳岩是看剪影就知道是谁的女人

李诞社交软件评论区被网友骂到关闭,曾在节目中称柳岩是看剪影就知道是谁的女人

极目新闻
2025-08-01 15:38:05
保研名单里的"民办奇迹",真不是童话是笑话?

保研名单里的"民办奇迹",真不是童话是笑话?

魔都姐姐杂谈
2025-08-01 22:36:09
一觉醒来,韩国“跪”了!GDP前9中,除中国,只剩2国未向美妥协

一觉醒来,韩国“跪”了!GDP前9中,除中国,只剩2国未向美妥协

小蜜情感说
2025-08-01 14:29:29
2025-08-02 06:52:49
集智俱乐部 incentive-icons
集智俱乐部
科普人工智能相关知识技能
5257文章数 4647关注度
往期回顾 全部

科技要闻

“抵制恶性竞争”,三家外卖平台同日发文

头条要闻

男孩因多付900块车费要不回轻生 司机:他是找我"套现"

体育要闻

主教练化身超级英雄,他从海里救出2名女孩

娱乐要闻

张馨予结婚七年,晒出与丈夫亲密合影

财经要闻

清流|宗馥莉是如何“输”掉香港官司的?

汽车要闻

77°视角下的未来出行美学:ARCFOX设计哲学解读

态度原创

房产
本地
教育
艺术
公开课

房产要闻

劲爆!海南又又又抢地了!

本地新闻

换个城市过夏天|躲进雅安过几天大熊猫式慢生活

教育要闻

三垂直辅助线,怎样去构造?

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

公开课

李玫瑾:为什么性格比能力更重要?