网易首页 > 网易号 > 正文 申请入驻

Nat Method | 张数一团队提出蛋白质序列-功能空间压缩的概念

0
分享至


蛋白质作为最重要的生命构建单元之一,其序列和功能之间的映射 (适应性景观,Fitness landscape) 的针对性研究对于蛋白质理性设计以及工程应用都有极大的意义。目前人们只能对于蛋白质序列-功能关系进行少量低纬度的点采样,例如深度突变搜索 (DMS) ,单位点饱和突变【1-4】等,或是利用随机建库等方式以极低概率捕获序列与功能耦连的关键信息【5,6】。一些更高效的定向进化工具如PACE【7,8】,OrthoRep【9】等会使得蛋白质空间的搜索深度加深,但由于其专注于产生高适应性突变体的特征使得其对于蛋白功能的全局认知不足。一些计算方法成功构建起序列-结构之间的精确关联,例如2024年诺贝尔化学奖获奖者开发的AlphaFold, RoseTTAFold等结构预测或设计算法,并进一步试图利用深度学习构建序列和功能的映射关系,但由于缺乏高质量大规模的序列-功能映射数据,计算方法的可延展性始终有所限制。总之,受限于蛋白质序列空间的高维度与复杂性 (例如,100个氨基酸的蛋白质设计空间达到10130,远超宇宙中的原子数目~1080) ,我们对这个空间及其映射规律的理解尚浅,亟待丰富与完善。

2024年11月11日,来自清华大学的张数一团队在Nature Methods上发表了名为EvoAI enables extreme compression and reconstruction of the protein sequence space的文章。提出了对蛋白质序列-功能空间进行压缩的概念,开发了进化扫描系统,可以高效获取空间压缩后的锚点(Anchor),并开发了相应的EvoAI系统,实现了对蛋白质序列-功能空间的进化压缩和AI重构,压缩比可以达到1048,对于理解蛋白质序列-功能空间映射关系引入了新的视角。


研究人员首先构建了进化搜索系统 (Evolutionary Scanning, EvoScan) 用以对蛋白进行分区域定向进化,如图一所示。该系统改造了噬菌体辅助的连续定向进化系统 (PACE) 。其中,突变体系来源EvolvR系统中enCas9-PolIM5复合蛋白【10】,通过构建其诱导表达体系来创建靶向分区域突变质粒 (TP) 。为了测试系统的可行性,研究人员先后利用了绿色荧光蛋白EGFP的纳米抗体突变体的回复突变实验测试蛋白-蛋白相互作用的靶向进化,以及利用SARS-CoV-2主蛋白酶Mpro蛋白对其抑制剂的逃逸效应的进化测试蛋白-配体相互作用的靶向进化,证明该系统可以对gRNA覆盖的上下游约30bp的区域进行靶向进化并得到功能提升的突变体。随后,研究人员利用EvoScan进化了转录因子AmeR对于特定DNA序列的抑制能力,设计了13条gRNA对于蛋白进行区域分割,最终在8个区域中找到氨基酸突变。研究人员对这些区域进行随机排序,构建了8个不同的进化路径,使进化过程可以遍历以上8个区域,最终产生了82个功能提升,维度各不相同的锚点,并对上述锚点进行基于流式荧光的功能测试,系统生物学分析以及上位效应 (Epistasis) 的分析与计算等。其结果显示,尽管绝大多数突变对于蛋白功能都有不同程度的提升,但不同的单点突变对于不同的突变组合而言,产生的功能效应并非都是提升,一些突变位点能够提升蛋白功能,但会干扰其他的突变位点的效应,这反映了蛋白质序列空间的高复杂度。



图一. EvoScan系统构成和蛋白质序列-功能空间压缩

为了理解和重构这个高纬度复杂空间,研究人员设计了与EvoScan配套的深度学习算法,并命名为EvoAI,如图二所示。该方法结合了预训练的GeoFitness模型和蛋白质语言模型 (ESM-2) ,加上多层感知器 (MLP) ,以提高预测蛋白质突变效应的准确性。在本研究中EvoAI利用AmeR蛋白82个突变体的序列-功能映射信息对模型加以训练,并生成了不同于上述突变体的共1093个新蛋白,通过对于预测强度的排序,研究人员测试了预测强度最高的10个突变体,并将其与仅利用传统DMS方法预测得到的10个具备相同突变数量的,强度最高的10个突变体进行强度对比,结果显示,通过EvoAI预测得到的突变体均有显著的功能提升,而DMS方法得到的突变体多数均无显著功能提升,甚至某些突变体不再具备明显的抑制功能。这表明EvoAI系统识别到了通过信息压缩得到的高维度蛋白信息,并有效地生成了具备功能的突变体。


图二. EvoAI原理示意图和蛋白质序列-功能空间重构

与现有方法相比,该方法有几个重要优势。首先,它实现了序列空间的广泛,均匀且精确的采样,这可以快速探索高维并生成更多样化和功能性的突变体,并提供有关序列-功能映射的更丰富信息。其次,该方法整合了基于经验的进化扫描和深度学习模型,充分利用了这两种不同方法的优势。研究人员可以使用深度学习得到的关键特征来动态地指导扫描过程。可解释性深度学习在未来的进一步发展可能会揭示潜在的进化规则,并为蛋白质如何适应和克服进化限制提供见解。第三,该方法可以进化和研究缺乏结构信息或涉及具有挑战性的相互作用的蛋白质。EvoScan可以针对不同的蛋白质相互作用捕获蛋白质锚点,如蛋白质-蛋白质、蛋白质-配体和蛋白质-核酸相互作用。文章中提出的蛋白质序列-功能空间压缩的概念也有望应用于不同种类的蛋白质,并对自然界如何在有限时间内完成蛋白质空间的搜索和物种的高效进化产生一定的启发作用。

清华大学药学院博士生马梓源,李文杰,沈运浩及清华大学生命学院博士生徐运昕为论文共同第一作者,清华大学药学院张数一老师为论文通讯作者。

https://www.nature.com/articles/s41592-024-02504-2

招聘信息:博士后招聘广告

张数一,清华大学药学院副教授,博士生导师,清华大学合成与系统生物学研究中心PI,分子肿瘤学全国重点实验室PI,入选国家高层次人才计划青年项目。本科毕业于清华大学生物科学与技术系;博士毕业于宾夕法尼亚州立大学;之后在美国麻省理工学院进行博士后研究;2019年加入清华大学药学院。主持国家自然科学基金联合基金重点项目,国家自然科学基金面上项目,国家科技重大专项“重大新药创制”课题,国家重点研发计划课题等。担任中国生物工程学会合成生物学分会青年工作组委员,中国医药生物技术协会合成生物技术分会委员,中国生物信息学会(筹)计算合成生物学专业委员会委员等。长期致力于合成生物学和关键生命过程的研究,相关论文发表在Science,Nature Methods,Nature Biotechnology等。基于“还原论”的研究思路,聚焦在代谢通路、能量摄取、调控网络等领域,研究生物结构的多样性潜力和进化可能性,有些研究成果已经改写并被收录世界经典教科书。目前有机结合“重构论”的思路进行生物学研究,从而突破“还原论”研究思路的局限。侧重在优良蛋白质元件的计算机辅助从头理性设计、自动化平台赋能的高通量表征、连续定向进化系统辅助的快速精准优化等,实现蛋白质序列-结构-功能映射的建立;以及将这些设计和改造后的元件有机耦合基因线路和调控网络,从头搭建能自我复制的生命系统,从而实现对生命的重构理解和认知,并有效地应用于疾病诊断和治疗等领域。课题组长期招聘相关方向博士后,有意者请投递简历。

制版人:十一

参考文献

1 Fowler, D. M. & Fields, S. Deep mutational scanning: a new style of protein science.Nat. Methods11, 801-807 (2014).

2 Stiffler, M. A., Hekstra, D. R. & Ranganathan, R. Evolvability as a function of purifying selection in TEM-1 β-lactamase.Cell160, 882-892 (2015).

3 Zheng, L., Baumann, U. & Reymond, J.-L. An efficient one-step site-directed and site-saturation mutagenesis protocol.Nucleic Acids Res.32, e115 (2004).

4 McLaughlin Jr, R. N., Poelwijk, F. J., Raman, A., Gosal, W. S. & Ranganathan, R. The spatial architecture of protein function and adaptation.Nature491, 138-142 (2012).

5 Cadwell, R. C. & Joyce, G. F. Randomization of genes by PCR mutagenesis.Genome Res.2, 28-33 (1992).

6 Vanhercke, T., Ampe, C., Tirry, L. & Denolf, P. Reducing mutational bias in random protein libraries.Anal. Biochem.339, 9-14 (2005).

7 Esvelt, K. M., Carlson, J. C. & Liu, D. R. A system for the continuous directed evolution of biomolecules.Nature472, 499-503 (2011).

8 Miller, S. M., Wang, T. & Liu, D. R. Phage-assisted continuous and non-continuous evolution.Nat. Protoc.15, 4101-4127 (2020).

9 Ravikumar, A., Arzumanyan, G. A., Obadi, M. K. A., Javanpour, A. A. & Liu, C. C. Scalable, Continuous Evolution of Genes at Mutation Rates above Genomic Error Thresholds.Cell175, 1946-1957.e1913 (2018).

10 Halperin, S. O. et al. CRISPR-guided DNA polymerases enable diversification of all nucleotides in a tunable window.Nature560, 248-252 (2018).

(可上下滑动阅览)

BioART战略合作伙伴

(*排名不分先后)

BioART友情合作伙伴

(*排名不分先后)

转载须知


【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。

BioArt

Med

Plants

人才招聘

会议资讯

近期直播推荐

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中方大批舰机押送加拿大舰,这一幕令人解气:给五眼联盟一个教训

中方大批舰机押送加拿大舰,这一幕令人解气:给五眼联盟一个教训

凯撒谈兵
2025-02-17 21:10:32
癌症的源头终于找到了,癌症最爱这9种食物,别再喂养癌细胞了!

癌症的源头终于找到了,癌症最爱这9种食物,别再喂养癌细胞了!

肿瘤科王红军
2024-10-01 09:38:31
想在航空领域超越四川,超越成都?省点力气吧,这早已不可能

想在航空领域超越四川,超越成都?省点力气吧,这早已不可能

据说说娱乐
2025-02-18 10:45:40
知情网友曝陈晓离婚时间,过年前办理了手续,离婚前已分居快两年

知情网友曝陈晓离婚时间,过年前办理了手续,离婚前已分居快两年

萌神木木
2025-02-18 15:08:27
利物浦25轮领先7分,历史数据暗示铁定夺冠?主要对手有心无力

利物浦25轮领先7分,历史数据暗示铁定夺冠?主要对手有心无力

体坛老球迷
2025-02-18 16:45:58
巴西中场+非洲前锋两大归化就位 伊万的442阵型该如何排兵布阵

巴西中场+非洲前锋两大归化就位 伊万的442阵型该如何排兵布阵

智道足球
2025-02-18 16:10:46
案例:一校花被16名老汉接济长大,细节曝光后,禽兽真的存在

案例:一校花被16名老汉接济长大,细节曝光后,禽兽真的存在

清茶浅谈
2025-01-15 10:53:22
新媒发现:这次企业家座谈会,细节里藏着的门道比剧情片还精彩!

新媒发现:这次企业家座谈会,细节里藏着的门道比剧情片还精彩!

阿珂谈汽车
2025-02-18 13:54:40
又对账了!美国网友对账车厘子价格:大吃一惊,老胡终于说对一次

又对账了!美国网友对账车厘子价格:大吃一惊,老胡终于说对一次

阿凫爱吐槽
2025-01-17 09:43:14
朝鲜公开毛岸英牺牲真相:内容简短却很炸裂,真正凶手不是美国人

朝鲜公开毛岸英牺牲真相:内容简短却很炸裂,真正凶手不是美国人

南书房
2024-07-29 18:53:04
米体:在尤文1-0国米的国家德比,主裁判马里亚尼漏给尤文4张黄牌

米体:在尤文1-0国米的国家德比,主裁判马里亚尼漏给尤文4张黄牌

直播吧
2025-02-18 08:33:15
中央5台直播乒乓球时间表,孙颖莎冲击首个亚洲杯冠军

中央5台直播乒乓球时间表,孙颖莎冲击首个亚洲杯冠军

生活新鲜市
2025-02-18 13:02:01
林志颖终于有了老人味,岁月真没优待谁

林志颖终于有了老人味,岁月真没优待谁

最炫时尚
2025-02-15 17:08:53
网友们看出了英国能强盛400年的根本原因

网友们看出了英国能强盛400年的根本原因

清晖有墨
2024-09-02 19:50:33
国安压哨签下第5外援!赛超豪门队长加盟,吴少聪主力位置恐不保

国安压哨签下第5外援!赛超豪门队长加盟,吴少聪主力位置恐不保

体坛鉴春秋
2025-02-18 17:00:34
这才是用DeepSeek做PPT的正确姿势,效率高到让你怀疑人生!

这才是用DeepSeek做PPT的正确姿势,效率高到让你怀疑人生!

秋叶PPT
2025-02-08 08:19:50
加拿大多伦多机场发生飞机坠毁事件 伤亡暂不明

加拿大多伦多机场发生飞机坠毁事件 伤亡暂不明

财联社
2025-02-18 04:08:09
见世面了!加拿大军舰“渥太华号”过台湾海峡,头顶24架中国战机

见世面了!加拿大军舰“渥太华号”过台湾海峡,头顶24架中国战机

影孖看世界
2025-02-17 18:21:32
林彪十八怪

林彪十八怪

不正确
2025-02-16 21:24:09
王祖蓝高调宣布:“10年婚姻要结束了,因为我骗了我老婆”

王祖蓝高调宣布:“10年婚姻要结束了,因为我骗了我老婆”

星光历史
2025-02-17 14:01:45
2025-02-18 17:48:49
BioArt incentive-icons
BioArt
探索生物艺术之奥秘
6125文章数 18405关注度
往期回顾 全部

科技要闻

马斯克发布"最聪明AI":号称碾压DeepSeekV3

头条要闻

杭州一处"楼王"2年拍卖7次 所有人系特大"套路贷"主犯

头条要闻

杭州一处"楼王"2年拍卖7次 所有人系特大"套路贷"主犯

体育要闻

曾遭遇两年欠薪,国足最新归化球员是他?

娱乐要闻

陈晓与陈妍希宣布离婚:今后各自安好

财经要闻

最高层级座谈会,谁晋级,谁缺席了

汽车要闻

和同级9字辈对比如何? 到店体验腾势N9

态度原创

时尚
教育
亲子
手机
公开课

从被嘲五音不全到舞台女王,张韶涵缘何此时落幕?

教育要闻

经常“出去浪”和“宅在家”的孩子,长大后谁更有出息?

亲子要闻

婆婆给的爱也不比妈妈少,忙碌的生意也要抱着孙子。

手机要闻

realme 真我 Neo7 SE 手机外观公布:三配色、机甲元素设计

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版