撰文 | 咸姐
1961年底的一个深夜,Jacques Monod(20世纪中期杰出的分子生物学家,1910-1976)疲惫而满脸忧虑地走进Agnes Ullmann(1927-2019)的实验室,静伫良久后说道:“我想我发现了生命的第二个秘密。”在两三杯威士忌的冷静之后,Monod解释道,这个发现,名叫“变构”【1】。
变构是生物大分子(主要是蛋白质)将一个位点的结合效应传递到另一个(通常是远端)功能位点,从而调节活性的过程。变构调节几乎是所有生物学调控的核心,包括信号转导、转录调节和代谢调控。研究发现,许多致病突变(包括许多癌症驱动突变)都是因为变构效应而具有病理性的。许多最具疗效的治疗药物也往往是通过与变构位点结合来改变其活性,而非直接抑制蛋白质的活性位点,而且变构药物通常比结合蛋白质家族中保守的活性位点的药物具有更高的特异性【2】。
这一“生命的第二个秘密”的重要性不言而喻,蛋白质之间的物理相互作用是大多数生物过程的关键,并且代表了一个潜在的巨大的治疗靶点空间。然而,目前大多数蛋白质-蛋白质相互作用(PPI) 的变构位点未知,尚未获得任何蛋白质相互作用域的变构位点的综合图谱,也没有可识别调节PPI的变构位点的通用方法,对于变构位点的预测仍然非常困难的,即使是那些已知了活性和非活性状态的被高度研究了的蛋白质也是如此。
近日,来自西班牙巴塞罗那科学技术学院的Ben Lehner团队在Nature上在线发表题为Mapping the energetic and allosteric landscapes of protein binding domains,利用深度突变扫描的大规模并行特性来量化数千种扰动的表型效应,并通过神经网络拟合热力学模型来推断突变的因果生物物理效应,提出了一种能够全面绘制蛋白质相互作用域的能量和变构图谱的方法。
针对现有研究方法的缺陷,本文研究人员使用突变作为扰动,在蛋白质的所有位点引入化学变化来探索变构调节的潜力,开发了一种策略,使用基于蛋白质片段互补 (PCA) 的两种独立选择试验,其一是“BindingPCA”,通过将两种蛋白质与报告酶二氢叶酸还原酶 (DHFR) 的不同片段融合来量化两种蛋白质之间的结合。蛋白质之间的相互作用使DHFR片段非常接近,使它们形成一种功能性酶,其活性在选择性条件下通过细胞生长测量,与蛋白质复合物的细胞内浓度成正比。其二是“AbundancePCA”,只有一种蛋白质被表达并融合到一个DHFR片段上,而另一个DHFR片段被高度表达。这两种试验的结合后即为一种高通量的可量化突变对蛋白质丰度及其与一个或多个相互作用蛋白的结合的影响的方法——“doubledeepPCA”(ddPCA)(图1)。
图1
研究人员将ddPCA应用于人类基因组中编码的两个最常见的蛋白质相互作用结构域的例子——人类生长因子受体结合蛋白2(GRB2)的C末端SH3域,它与GRB2-相关结合蛋白2(GAB2)的富含脯氨酸的线性肽结合;以及来自衔接蛋白PSD95(也称为DLG4)的第三个PDZ结构域,可与蛋白质CRIPT的C端结合。研究人员构建了包含单氨基酸取代和双氨基酸取代的GRB2-SH3和PSD95-PDZ3结构域的诱变文库,并分别使用BindingPCA和AbundancePCA量化了它们对GAB2和CRIPT结合的影响,以及对细胞内游离结构域浓度的影响。结合的突变效应矩阵显示,对结合有较大影响的突变分布在两个结构域中,同样,丰度的突变效应矩阵表明,两个结构域的突变对蛋白质浓度也有很大的影响。事实上,绘制结合的变化与丰度的变化之间的关系图可以发现,大多数改变结合的突变也会改变分离结构域的浓度,这与蛋白质稳定性变化是突变对结合产生影响的主要原因的预期一致。
随后,研究人员使用一种依赖于玻尔兹曼分布的神经网络公式将热力学模型与使用ddPCA获得的实验数据进行拟合,从而从每个单个氨基酸取代对这两种分子表型的影响中推断出潜在的因果自由能变化。结果显示,蛋白质结合可以最简单地模拟为三态平衡,包括展开态、折叠态和结合态。在这个基因型-表型模型中,突变改变了折叠和/或结合的自由能,并且在双氨基酸替换中自由能的变化是叠加结合的。这一三态模型为两种结构域的数据提供了极好的定量拟合,有力地支持了折叠和结合的自由能的大部分变化都是在双氨基酸取代中叠加的这一假设。此外,通过将由此推断出的突变后自由能变化与PDZ结构域的体外测量值进行比较,同时将相同的三态模型拟合到之前发表的体外诱变数据中,均证实该推论的有效性及该方法的普遍灵活性。
本文研究人员指出,与表型效应图相比,突变效应的自由能图具有重要优势,因为它们将突变效应转化为潜在的附加生物物理特征,并允许在成对组合和更大组合的突变时进行准确的遗传预测。此外,自由能图谱更加完整,因为单个突变体的自由能可以通过其在不同背景下的作用(如双氨基酸替换)或其对相关表型的影响(如结合表型的折叠能)来推断,尽管缺失单个突变体表型。与此同时,全面量化突变对折叠和结合的影响,为评估突变影响多种生物物理特性(即生物物理多效性)的程度提供了机会。对GRB2-SH3和PSD95-PDZ3的分析发现超过三分之二的改变结合的突变在生物物理上是多效性的。破坏结合的突变通常表现出协同多效性,降低结合和折叠稳定性;而增加结合的突变往往表现出拮抗多效性,对相反方向的结合和折叠自由能产生影响。此外,结果显示,该方法的数据有助于识别功能重要的稳定性欠佳的表面位点,即使在相互作用蛋白和功能未知的情况下也是如此。而且,量化突变对结合和丰度的影响可以识别结合界面,而这可能有助于在没有任何结构信息的情况下识别大量蛋白质相互作用的界面。
进一步地测试显示,在结合界面外的残基也富含调节结合亲和力的突变。研究人员在GRB2-SH3中发现了2个位点,在PSD95-PDZ3中发现了8个位点,其结合自由能的平均绝对变化大于结合界面突变,这些配体末端残基称为主要变构位点,其中许多突变对结合亲和力有强烈影响。尽管这十个残基是变构效应最丰富的位置,但影响结合亲和力的突变实际上发生在两个蛋白质结构域中。研究人员发现变构突变在蛋白质的核心和溶剂可及区域中也很丰富,此外,表面位点对于在远端界面的结合通常不是最理想的,突变更有可能在更靠近结合界面的甘氨酸残基和连接到PDZ结构域内相对表面的特定残基处发生变构。
最后,由于致病和进化选择的突变以前被认为是通过改变PPI网络的“节点”或“边缘”来扰乱细胞进程,然而,量化突变对网络边缘影响的系统数据仅限于任何单个蛋白质的少量突变。因此,研究人员利用本文的数据进一步研究“边缘”网络改变突变的特性。研究结果显示,变构突变非常丰富,改变 “边缘”网络的遗传变异的突变靶空间比以前认识的要大得多——许多在相互作用界面之外的突变不仅会改变蛋白质的稳定性,还会改变蛋白质对其相互作用蛋白的亲和力。
综上所述,本研究提出了一种通用的方法——多维突变法——来推断突变的体内生物物理效应,并使用ddPCA(多维突变法的一种具体实现)产生了两种蛋白质的变构突变的全局图谱。该通用方法的一个关键优势在于,它可以用于量化数百万个突变对数千种蛋白质生物物理特性的影响,从而利用大规模扰动实验来解决生物学的三个基本编码问题——蛋白质折叠(稳定性序列)、结合(亲和性的序列)和变构。ddPCA 和相关方法的应用无疑可以通过生成治疗靶蛋白(包括那些目前被认为“不可成药的”蛋白)的全局变构图谱而有助于加速变构药物的发现。
参考文献
1. Ullmann, A. In memoriam: Jacques Monod (1910–1976).Genome Biol. Evol.3, 1025–1033 (2011).
2. Guarnera, E. & Berezovsky, I. N. Allosteric drugs and mutations: chances, challenges, and necessity.Curr. Opin. Struct. Biol.62, 149–157 (2020).
https://doi.org/10.1038/s41586-022-04586-4
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.