为了将蛋白质复杂的三维结构简化和可视化,科学家发明了由彩带、线条和箭头组成的丝带图,这是当今最常用的蛋白质三维结构表示方法。那么,它是怎么被发明的,它的出现在科学界又有什么意义呢?
撰文 | 小闸蟹
Don't be afraid to go in new directions. Share, collaborate, and give away ideas and results freely.
不要害怕尝试新的方向。自由地分享、合作、拿出想法和成果。
——Jane Richardson
1958年,英国生物学家John Cowdery Kendrew等人利用X射线衍射的方法,成功确定了抹香鲸肌红蛋白的三级结构,并将研究结果发表在了Nature上。这是人类历史上首个被X射线衍射技术解出高级结构的蛋白质。1962年, Kendrew和Max Perutz因解析血红蛋白结构共享了诺贝尔化学奖,自此,结构生物学作为一门学科开始蓬勃发展。
与此同时,在大西洋彼岸的美国,一个名叫Jane Shelby的17岁少女刚刚因为裸眼观测并计算出了苏联发射的人造卫星(Sputnik)的轨迹而获得了西屋科学人才发现大赛(Westinghouse Science Talent Search)的第三名。该比赛始于1942年并延续至今,现由美国再生元公司冠名(比赛名称是Regeneron Science Talent Search),旨在在高中生中发掘和培养科学人才。
图1 Jane 的成绩至今可查
Jane的父亲是一位电气工程师,或许受到家庭影响,她从小学三年级的一次对美国纽约海登天文馆的参观开始,就对数学和航空航天产生了浓厚的兴趣。她后来考入美国顶尖的文理学院斯沃斯莫尔学院(Swarthmore College),又在哈佛大学完成了硕士学习。毕业后,Jane当过一段时间的中学老师,随后进入了麻省理工学院的一个实验室担任技术员,开始接触结构生物学领域,并在那里遇到了当时正在攻读博士的David Richardson。
Jane和David在工作中感情升温,两人喜结连理,婚后也一直在为了相同的科研目标而努力。在反复对Kendrew等人的例子进行逆向研究之后,两人最终在1969年深入分析和展示了细胞色素C的结构——这也是人类历史上第十个被解出结构的蛋白。(题外话:咱们说“爱情的结晶”是个比喻,人家是真有结晶。比不了,比不了。)
随着越来越多的蛋白质结构被解出,结构生物学家们又面临着一个新的问题,那就是如何精确地表达蛋白质的结构,尤其是在论文这种二维平面上展示蛋白质的三维结构。Kendrew等人发表第一个结构时,选择制作了一个模型然后拍照。显然,这样既不严谨,也不方便。但当时的人们也并没有更好的办法。
时间来到了1980年前后,Jane依然在为这个问题而烦恼。有一次,她手中无意把玩着一根皮带,卷起的皮带就像连接起来的氨基酸骨架,这或许意味着三维蛋白质可以被更好地可视化。她以此为基础,经过一年的修修改改,发明了影响深远的丝带模型(Ribbon diagram,有时也被翻译为“飘带模型”等),并以The Anatomy and Taxonomy of Protein Structure为题撰写论文,发表在1981年的Advances in Protein Chemistry年刊上。该文占据了一百七十余页的篇幅,从此奠定了Jane Richardson在蛋白质“三渲二(通过计算机或人工渲染,三维空间结构渲染在二维的纸张、屏幕等载体上展示,以便读者和观众阅读、观看和理解的技术)”领域的开山鼻祖地位。
Jane的工作一经推出,便在同行圈子内广受好评。原因无他——实在是太好用了。丝带模型清晰有效地将组成蛋白质的氨基酸骨架排列并展示出来。由于氨基酸骨架会自发地形成能量较低的α-螺旋、β-折叠等结构,所以Jane创造性地用类似于装饰彩带的结构表示α-螺旋,用扁平的箭头表示β-折叠,以及用细线来表示连接上述两种结构之间的回路。
图2 左图为JC Kendrew的“模型拍照”;右图为Jane Richardson的“丝带模型”手稿。丨图片来源:参考文献[1]/Jane Richardson
这一模型的发明惊艳了整个圈子,但是很快同行们就发现,并不是每一个人都能画出这么优美而准确的图。于是Jane又成了圈子内炙手可热的“画师太太”。大量同行写信给她,问:“您能帮忙画画我的这个结构吗?”
显然,Jane一个人画不完这么多的结构,科学的发展也不可能寄托于科学家的美术天赋。于是Jane和David夫妇想到了用计算机生成。八九十年代正是计算机技术蓬勃发展的年代,然而大约十年后,他们才终于做出了能够生成丝带模型的算法。在这个计算机程序完成后,Jane高兴地说:“我终于不用再用手画图啦!”很难想象这十年来她经历了什么。
Jane的工作并没有随着放下画笔而终止,她始终在结构生物学领域深耕,并不断为这一模型添加新的特性,其中很多沿用至今,例如氢键和结合水的表示等。
不可否认的是,丝带模型存在一定的局限性,例如其为了精简结构而只描述了氨基酸的骨架,而没有体现出侧链,因此无法显示出蛋白质表面的通道、凹凸等和分子间相互作用有重要关系的结合位点。因此后人又在这一模型的基础上发展出了球棍模型(Ball&Stick Diagram)、空间占用模型(Space Filling Diagram)等经典模型,以供读者理解。
图3 三种常用模型的比较,左侧为Jane Richardson发明的丝带模型,重点体现蛋白质的氨基酸骨架和结构域等特征;中间为球棍模型,较为准确地标明了每个原子的位置;右侧为空间占用模型,通过显示每个原子的体积,能够更直观地呈现蛋白质分子中原子或原子团簇的实际空间分布,展现了蛋白质分子表面的形态、通道和孔隙等结构特征,有助于在药物研发等领域寻找潜在的结合位点。丨图片来源:Protein Data Bank
有人将图3中的左图称为“Cartoon”图,实际上,不同的模型系统的命名存在差异。如蛋白质结构数据库(RCSB PDB)中,Cartoon和Ribbon均使用丝带表示α-螺旋和β-折叠,区别在于Cartoon的无定形区采用柱状细线,同时使用箭头标明了β-折叠的方向;而Ribbon的无定形区采用和α-螺旋、β-折叠相似的扁形丝带,同时β-折叠也没有箭头——这都是在Jane的最初版本之上做的改动。
图4 左图为PDB中的“Cartoon”;右图为“Ribbon”(PDB:1FPU)。
其他地方的命名方式也存在不同。例如在PyMol软件中,“Cartoon”图类似于本文中提到的“Ribbon”和PDB的“Cartoon”,而“Ribbon”则是一种只展示主干的展示方法,见图5。
图5 左图为PyMol中的“Ribbon”,右图为“Cartoon”(PDB:1FPU)。
无论如何,时至今日,丝带模型仍然是最成功的蛋白质模型,也是最常在科研论文和科普读物中看到的模型。以至于很多的老师都得反复告诫学生:“这玩意儿就是个大概,你体内不是一群箭头和螺旋。”笔者本人往期的作品中也多有此模型的应用,在此一并向Jane奶奶致谢。
图6 Jane 的早期作图,已经具备了当代“Ribbon”或者“Cartoon”的典型特征。丨图片来源:doi.org/10.1038/77912
Jane Richardson和爱人David一起,一直在为结构生物学的发展而努力,在蛋白质结构解析和结构可视化方法方面做出了巨大贡献。蛋白质数据库(Protein Data Bank)的创立有他们一份功劳;2019年,他们庆祝了一起在杜克大学度过的50周年纪念日,杜克大学官方称Jane为丝带模型之母(Mother of Ribbon Diagrams);新冠疫情期间,他们还对新冠病毒蛋白的结构解析有所贡献。时至今日,他们依然在杜克大学有自己的课题组。
图7 Jane Richardson丨图片来源:duke.edu
Jane Richardson一生没有获得正式的博士学位,却有三个学校授予的荣誉博士学位。她十分鼓励年轻人的探索,并在一次采访中表示:“有的时候想想,现在的年轻人看蛋白质的方式和我80年代的时候是一样的。或许我发明了一个好方法,但肯定不是唯一的方法。一个蛋白质长什么样子取决于你想如何展示它。”
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.