网易首页 > 网易号 > 正文 申请入驻

又一个卡脖子技术:中国的AlphaFold在哪儿?

0
分享至

·7月底,DeepMind公司称,AlphaFold预测出了2亿多个蛋白质结构。
·“有人在说AlphaFold开源了,我们国家不用搞了,这是大错特错。第一,他们所谓的开源,只是表层结构开源了,底层技术没有开源……”复旦大学复杂体系多尺度研究院院长马建鹏在受访中表示。
在马建鹏看来,AlphaFold是又一个卡脖子的核心技术。
几乎预测了整个蛋白质宇宙
2022年7月28日,英国DeepMind公司表示,AlphaFold已经预测了全球几乎所有的蛋白质结构,短短一年时间,他们的蛋白质结构数据库中的数据从200万个扩增到超2亿个。
AlphaFold也是继AlphaGo(阿尔法狗)之后,DeepMind重磅打造的一款智能人工系统,主要被用来预测蛋白质结构。那么,AlphaFold运行基本原理是怎样的?
它运用了机器学习算法,配置了深度学习神经网络,并且接受了蛋白质三维结构数据库(PDB)以及其他数据库中数十万个实验确定的蛋白质结构和序列的训练。
经过训练后,AlphaFold在面对一个新的基因序列时,首先在数据库中寻找相关基因序列,然后经过大量的计算和比对,对新基因序列对应的蛋白质3D结构进行预测,它的预测结果具有非常可观的精确度。
回溯到一年前,2021年7月,也就是AlphaFold发布蛋白质数据库和开源代码初期,DeepMind就已经用AlphaFold预测了98.5%的人类蛋白质结构,相关结果发表在《自然》杂志上。
在很多专家看来,AlphaFold还只是对未来的“惊鸿一瞥”,它将生物学带入了一个数字时代,并且它将改变全球生物医学研究现状。
目前,DeepMind与被忽视疾病药物倡议(DNDI)合作,来推进他们的研究成果。同时,DeepMind还对被世界卫生组织(WHO)确定为高度优先研究的生物体进行了结构预测,帮助科学家进一步研究麻风病和血吸虫病等顽疾。

DeepMind创始人Demis Hassabis。 视觉中国 资料图


对此,DeepMind创始人兼首席执行官戴密斯·哈萨比斯(Demis Hassabis)发出感慨,“AlphaFold已经对我们一些最大的全球挑战产生了令人难以置信的影响。我们希望这个扩展的数据库将帮助无数科学家完成他们的重要工作,并为科学发现开辟全新的途径。”
AlphaFold给全球生命科学领域学者的科研工作提供了便利,我国学者正在致力于探索“属于中国的AlphaFold”。但做得怎么样,有无自己的原创技术?
如何打造一款中国的AlphaFold?
国内对AlphaFold的关注,是最近两年的事。
2020年底,冰洲石生物科技(AccutarBio)宣布完成了近亿美元融资,致力于运用通过深度学习和物理建模的方式在海量数据上进行训练得到的计算模型来替代生物学和化学实验,以此来加速创新药的研发。
AccutarBio创始人范捷博士表示,他们的愿景是用AI全面提升创新药物研发的速度和效率,推出拥有全球专利的药物产品,致力于利用颠覆性技术的力量不断去改变药物发现行业。
致力于AI跨界融合的团队并非个例。2021年12月,北京深势科技推出一款蛋白质结构预测工具Uni-Fold,并同时开源训练代码和推理代码,供各界科学家和企业家测试使用。
由于AlphaFold只是开源了模型推理代码,并没有开源训练代码,因此科研人员只能按照AlphaFold设计好的流程进行使用,而不能对其训练过程做出调整,来迁移至更多的应用场景。
中科院院士、北京大学教授鄂维南表示,“尽管DeepMind开源了推理代码,但模型的训练技术才是核心的竞争力”。

复旦大学教授马剑鹏。


同样,2021年12月,复旦大学复杂体系多尺度研究院马剑鹏教授的团队和上海人工智能实验室合作,在《生物信息学简报》(Briefings in Bioinformatics)上发表了一篇名为“OPUS-Rota4: agradient-based protein side-chain modeling framework assisted by deeplearning-based predictors”的论文,简述了他们开发的算法成果。
研究团队研发出的具有自主知识产权的OPUS系列算法,这个算法可以用于预测蛋白质主链和侧链的三维结构,值得一提的是,其中的蛋白质侧链预测算法即OPUS-Rota4算法,精度比AlphaFold更胜一筹。
具体而言,研究人员使用AlphaFold得到了15个蛋白的预测结构,并利用不同方法根据预测出的主链结构对其侧链进行重新建模。其结果显示,OPUS-Rota4的结果显著优于其它侧链建模方法,而且比AlphaFold2预测的侧链更接近天然构象。

不同侧链建模方法对CASP14-AF2(15)的性能。


就在前不久,又有一家国内AI制药企业华深智药宣布,在AI和生命科学结合领域实现了一个重要进展,在蛋白质结构预测方面开发出新的技术——OmegaFold。
总的来说,利用AI推动生命科学发展的研究正在国内遍地开花。各大企业和高校团队在不断推进AI和生物制药的跨界融合,他们正在努力赶超DeepMind公司的AlphaFold。很显然,这一领域的源头创新并不在我们手上,怎样做才能保持优势呢?
“我们必须从底层技术做起”
蛋白质结构预测早已不是一个新的领域,科学家已经做了五十多年,但是直到AlphaFold的出现,这一领域的研究才出现突破性成果。
在很多业内专家看来,它的出现某种程度上是靠科学家个人去发挥他们的创造性。但我国在这一领域发展也有一定优势,这就是计算机系统工程。科学问题的工程化,AlphaFold也是非常典型的例子之一。
目前,我国还没有能够完全超越AlphaFold的核心技术,要实现真正“从0到1”的突破,或许还需要一些时间。
马建鹏在受访中表示,“有人在说AlphaFold开源了,我们国家不用搞了,这是大错特错。第一,他们所谓的开源只是表层结构开源了,底层技术没有开源。第二,你把它拿来你只能做他们的东西,你没有办法提高,就像航空发动机你买来可以,你能往前再进一步吗?”
马建鹏认为,我们必须从底层技术做起,掌握核心算法。
参考资料
1. 对标AlphaFold2!深势科技发布Uni-Fold蛋白结构预测工具,并开源训练代码.深势科技.
https://mp.weixin.qq.com/s/Zhn3HJpLnznLM1bpu6D1ew
2. OPUS-Rota4: a gradient-based protein side-chain modeling framework assisted by deep learning-based predictors.Briefings in Bioinformatics.
https://academic.oup.com/bib/article/23/1/bbab529/6461160
3. 超越谷歌“AlphaFold2”,为新药研发提供利器:复旦复杂体系多尺度研究院团队发表全新蛋白质侧链预测成果.复旦大学.
https://mp.weixin.qq.com/s/idWh_IO66Nhry4LfeITmIA
https://www.sohu.com/a/510336879_629135
4. 全球首个! 华深智药完成单条序列蛋白质结构预测最后一块拼图.华深智药.
https://mp.weixin.qq.com/s/DY3I13k_9QsIpCmyvQBlPg
5. AlphaFold reveals the structure of the protein universe.DeepMind.
https://www.deepmind.com/blog/alphafold-reveals-the-structure-of-the-protein-universe
6. 对话复旦复杂体系多尺度研究院院长:蛋白质结构预测为何突破.新浪科技.
https://finance.sina.com.cn/tech/2021-11-01/doc-iktzqtyu4671024.shtml
7. Finally, an answer to the question: AI — what is it good for?.VOX.
https://www.vox.com/future-perfect/2022/8/3/23288843/deepmind-alphafold-artificial-intelligence-biology-drugs-medicine-demis-hassabis

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
金秀贤入伍后金赛纶开始穿胶鞋,当时她才高二!谁懂穿胶鞋是何意

金秀贤入伍后金赛纶开始穿胶鞋,当时她才高二!谁懂穿胶鞋是何意

古今历史记
2025-03-13 10:25:46
被问在澳门赌博输10亿?黄晓明回应4个字

被问在澳门赌博输10亿?黄晓明回应4个字

环球网资讯
2025-03-13 10:14:20
红薯再次成为关注对象!医生发现:吃红薯时,一定要留意这几点!

红薯再次成为关注对象!医生发现:吃红薯时,一定要留意这几点!

39健康网
2025-03-12 16:01:25
“小婉君”金铭44岁现状,个子太矮,事业严重受挫,单身未婚未孕

“小婉君”金铭44岁现状,个子太矮,事业严重受挫,单身未婚未孕

美食阿鳕
2025-03-13 10:18:42
山西绝杀山东赛后!球队传来1个坏消息,这下迪亚洛和潘江麻烦了

山西绝杀山东赛后!球队传来1个坏消息,这下迪亚洛和潘江麻烦了

篮球专区
2025-03-13 23:16:31
38岁知名男演员官宣结婚!网友:恭喜

38岁知名男演员官宣结婚!网友:恭喜

深圳晚报
2025-03-13 12:27:27
十年后NBA前十球星预测:东契奇居第二,布朗尼第十,第一无悬念

十年后NBA前十球星预测:东契奇居第二,布朗尼第十,第一无悬念

鬼魅突破上篮
2025-03-13 01:10:14
欧足联发布通告并附上更清晰视频,确认阿尔瓦雷斯确实两次触球

欧足联发布通告并附上更清晰视频,确认阿尔瓦雷斯确实两次触球

雷速体育
2025-03-13 22:55:10
“17万买来,成了一个摆设……”一大波车主焦虑了

“17万买来,成了一个摆设……”一大波车主焦虑了

都市快报橙柿互动
2025-03-12 13:11:43
75年我们姐弟俩去大伯家借粮食,他给了半斤米,我爹打开后竟吓到了

75年我们姐弟俩去大伯家借粮食,他给了半斤米,我爹打开后竟吓到了

红豆讲堂
2025-03-12 05:00:02
重庆冠军赛第4日赛程!林高远遇内战,王曼昱或大胜,王楚钦冲8强

重庆冠军赛第4日赛程!林高远遇内战,王曼昱或大胜,王楚钦冲8强

小李子爱体育
2025-03-14 03:17:23
穿紧身西裤不雅?前央视主持人张蕾愤怒发声:人心脏看什么都脏。

穿紧身西裤不雅?前央视主持人张蕾愤怒发声:人心脏看什么都脏。

星光看娱乐
2025-03-10 10:26:07
有意思,东契奇交易压垮了达拉斯,NFL牛仔队的西迪·兰姆真实讲述

有意思,东契奇交易压垮了达拉斯,NFL牛仔队的西迪·兰姆真实讲述

好火子
2025-03-14 02:06:22
男单8强出炉2席!林诗栋3:2逆转晋级,世乒赛男单季军被淘汰出局

男单8强出炉2席!林诗栋3:2逆转晋级,世乒赛男单季军被淘汰出局

国乒二三事
2025-03-13 20:33:23
中方对美加码反制,3月14日,深夜爆出的三大重要消息全面来袭!

中方对美加码反制,3月14日,深夜爆出的三大重要消息全面来袭!

风口招财猪
2025-03-14 00:22:43
小鹏G6电池被子弹打中10枪还能开 不冒烟不起火

小鹏G6电池被子弹打中10枪还能开 不冒烟不起火

大象新闻
2025-03-11 16:56:24
沉默12小时,马科斯终于表态,老杜长女离国救父,留下这样三句话

沉默12小时,马科斯终于表态,老杜长女离国救父,留下这样三句话

吴欣纯Deborah
2025-03-13 15:23:09
当年沙俄抢走我国的海参崴,答应1995年归还,为何至今都没有兑现

当年沙俄抢走我国的海参崴,答应1995年归还,为何至今都没有兑现

百态人间
2025-03-12 19:05:55
李湘“终于”确诊糖尿病了!黄安发声,直击要害!

李湘“终于”确诊糖尿病了!黄安发声,直击要害!

魔都姐姐杂谈
2025-03-13 16:03:13
成都女车主泊车离奇被撞身亡后续:博主亲测,多名车主现身说法

成都女车主泊车离奇被撞身亡后续:博主亲测,多名车主现身说法

小人物看尽人间百态
2025-03-13 13:51:20
2025-03-14 04:04:49
澎湃新闻 incentive-icons
澎湃新闻
专注时政与思想的新闻平台。
774068文章数 5060847关注度
往期回顾 全部

科技要闻

传腾讯向英伟达采购数十亿元规模H20芯片

头条要闻

普京:俄同意停火30天建议 或将与特朗普讨论落实问题

头条要闻

普京:俄同意停火30天建议 或将与特朗普讨论落实问题

体育要闻

奇怪的点球大战又增加了 但赢的人始终不变

娱乐要闻

金秀贤公司原本要求金赛纶赔70亿

财经要闻

中国央行:择机降准降息

汽车要闻

宾利限量版Batur Black Rose 3D打印玫瑰金彰显奢华

态度原创

旅游
本地
游戏
公开课
军事航空

旅游要闻

“小伙泰山陪爬年入30万”引热议 当事人回应:已考虑退出

本地新闻

用AI唤醒花花世界|美到“开挂”,来哈尔滨感受春天吧

异象回声:反冲全玩法攻略!官方这是终于在对群上施展洪荒之力了

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

F-35战机陷入“一键关机”疑云

无障碍浏览 进入关怀版