网易首页 > 网易号 > 正文 申请入驻

AI预测百万化合物的生物活性信息,这里有个高效开源工具

0
分享至

用化学描述符(chemical descriptors)来编码小分子的物理、化学和结构特性,是化学信息学的核心。生物活性数据的广泛发布提高了化合物的丰富度。然而,大部分小分子都没有对应的生物活性描述符(bioactivity descriptors);这限制了该方法对众多已经被充分表征的化合物的适用性。

西班牙巴塞罗那科学技术研究所(BIST)的研究人员,使用深度机器学习计算模型预测分析了百万个分子的生物活性信息。该团队还披露了一个工具,该工具可以预测任何分子的生物活性空间;即使是没有实验数据作为参照的情况下,该工具依然可以完成分析。

该研究以「Bioactivity descriptors for uncharacterized chemical compounds」为题于2021年6月24日发布在《Nature Communications》杂志。

新方法是基于Chemical Checker(CC)开发的。Chemical Checker可以从每个分子的 25 种生物活性空间中收集信息。这些分子的生物活性空间与,分子的化学结构,分子相互作用的靶标,以及分子在临床或细胞水平上引起的变化等有着重要关联。然而,对于大多数分子来说,这种关于作用机制的高度详细的信息是不完整的;这意味着对于特定的分子,可能仅存在1-2种生物活性空间的信息。基于这个原因,研究人员将所有可用的实验信息与深度机器学习方法相结合,开发了新工具。该工具可以对分子的所有活动概况(从化学到临床水平)进行预测分析。

C C signaturizers的训练与评估

该团队将主要的化学、基因组学和药物数据库整合到Chemical Checker的单一资源中,这是迄今为止可用的最大的小分子生物活性特征集合。在Chemical Checker中,生物活性特征按数据类型(配体-受体结合、细胞敏感性概况、毒理学等)进行组织,遵循化学到临床的基本原理;有助于在药物发现流程的每个步骤选择相关特征类别。从本质上讲,Chemical Checker是存放在公共领域的小分子数据的替代表示,因此,它也受到实验数据的可应用性以及源数据库覆盖范围的限制。研究人员还介绍了该工具在一个基本无特征的化合物库中识别化合物方面的附加值,并通过实现一系列特征-活性关系(signature–activity relationship,SigAR)模型来预测分子的生物物理学信息和生理特性。

signaturizers进行大规模生物活性预测

推动制药领域的发展

药物发现过程好比一个「漏斗管道」,往往要从从数十万甚至数百万化合物的起始池中选择一种药物。Computational drug discovery (CDD) 方法可以在这个庞大而复杂过程中提供帮助。分子的有效数学表示是所有 CDD 方法的关键,二维结构指纹图谱是许多情况下的默认选择。

由于C C signaturizers是简单的 128D-vectors,与使用多维描述符来表示分子结构的 CDD工具包兼容。基于这种兼容性,可以将C C signaturizers输出的生物信息融入相似性搜索、化学空间的可视化、聚类和属性预测,以及其他使用广泛的 CDD 任务。在这项研究中,研究人员展示了如何使用C C signaturizers以生物相关的方式在化学空间中导航;同时揭示了,在注释信息不明确的天然产品集合中存在某种出乎意料的高阶结构。C C signaturizers推断的生物活性特征可用于注释大部分未表征的化学库,并丰富了化合物集合中针对药物靶标的活性信息。

Signature-based的复合集合分析

评估与测试

为了评估结果的稳健性,研究人员将化学描述符的集合扩展到 ECFP(extended connectivity fifingerprints)之外;特别是,加入了 Daylight-like (RDKit) 指纹、MACCS 密钥和一个名为 CDDD 的数据驱动相关的先进描述符。此外,研究人员使用基于 AutoML TPOT的「模型不可知方法」重复了 SigAR 任务预测。

结果表明,与单独使用化学信息预测模型相比,SigAR模型在一系列生物物理学和生理学活动预测基准数据集中具有优越的性能。

MoleculeNet 基准测试,将 CC Signature的预测能力与基于 MFp 的经典方法进行比较

该团队已经将论文中提到的软件工具公布,随着各类分子的生物活性数据的不断发掘,研究人员会及时更新软件库。随着 Chemical Checker 中实验数据的每次更新,人工神经网络也将被修改和完善。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

/阅读下一篇/

阿里云&海洋三所用蛋白质语言模型探索深海微生物磷循环

返回网易首页 下载网易新闻客户端
相关推荐
热点推荐
卫生间的这种“虫子”,千万不要用手拍!有人因此被迫摘除眼球……

卫生间的这种“虫子”,千万不要用手拍!有人因此被迫摘除眼球……

鲁中晨报
2025-06-04 11:50:19
农村最常见的十大毒蛇,认识它们不吃亏,关键时候能救命

农村最常见的十大毒蛇,认识它们不吃亏,关键时候能救命

农夫也疯狂
2025-06-04 11:03:25
俄副外长:俄方要求美英就乌袭击俄军用机场作出明确回应

俄副外长:俄方要求美英就乌袭击俄军用机场作出明确回应

环球网资讯
2025-06-04 21:46:45
直播调整!21点45:国足vs印尼生死战迎利好消息,首发11人浮现!

直播调整!21点45:国足vs印尼生死战迎利好消息,首发11人浮现!

大秦壁虎白话体育
2025-06-04 11:22:36
当着全球的面,巴基斯坦代表团
承认曾锁定20架印度军机没全打?

当着全球的面,巴基斯坦代表团 承认曾锁定20架印度军机没全打?

大道无形我有型
2025-06-04 18:41:38
中国正考虑最快下月订购数百架空客飞机,可能涉及200至500架,如果最终订单达到500架,将成中国最大订单

中国正考虑最快下月订购数百架空客飞机,可能涉及200至500架,如果最终订单达到500架,将成中国最大订单

和讯网
2025-06-04 16:09:42
张天爱“蝴蝶臀”火了!屁股比胸还大3圈,生图比例简直看傻了

张天爱“蝴蝶臀”火了!屁股比胸还大3圈,生图比例简直看傻了

喜欢历史的阿繁
2025-06-04 08:16:50
广西南宁一税务人员在酒局冲突中身亡,另有一人重伤

广西南宁一税务人员在酒局冲突中身亡,另有一人重伤

扬子晚报
2025-06-04 20:39:44
演员宁静潮牌翻车!网友直呼不理解!白T近2000,外套5000多,连披肩也要1200……

演员宁静潮牌翻车!网友直呼不理解!白T近2000,外套5000多,连披肩也要1200……

鲁中晨报
2025-06-04 13:22:09
“没钱给饭吃”暗访湖南某砖厂涉嫌用智障人员从事重体力劳动

“没钱给饭吃”暗访湖南某砖厂涉嫌用智障人员从事重体力劳动

大象新闻
2025-06-04 19:05:35
萨巴伦卡炮轰组委会:我们应该得到平等的待遇,郑钦文高情商回应

萨巴伦卡炮轰组委会:我们应该得到平等的待遇,郑钦文高情商回应

体育就你秀
2025-06-04 05:55:03
上任首日,韩国总统李在明下达“一号行政令”:组建紧急经济检查小组

上任首日,韩国总统李在明下达“一号行政令”:组建紧急经济检查小组

环球网资讯
2025-06-04 16:39:40
宝鸡一社区书记闹市飞车追撞女子,两路人遭殃送医,警方已介入

宝鸡一社区书记闹市飞车追撞女子,两路人遭殃送医,警方已介入

上游新闻
2025-06-04 19:19:03
愚蠢的蒋小姐!

愚蠢的蒋小姐!

梳子姐
2025-06-04 14:34:41
蒸发159亿!蔚来的账户快见底了

蒸发159亿!蔚来的账户快见底了

品牌头版
2025-06-04 18:47:06
掀衣服变成脱内裤!苏州医院"阴部b超"事件曝光,受害人竟被暗讽

掀衣服变成脱内裤!苏州医院"阴部b超"事件曝光,受害人竟被暗讽

乌娱子酱
2025-06-03 17:43:37
网友:李铁是你的铁哥哥?李金羽回怼:他再怎么样也是曾经的队友

网友:李铁是你的铁哥哥?李金羽回怼:他再怎么样也是曾经的队友

直播吧
2025-06-04 12:45:13
注销必查三年账?税局明确!6月1日起,企业注销必须这样办,否则后果严重!

注销必查三年账?税局明确!6月1日起,企业注销必须这样办,否则后果严重!

祥顺财税俱乐部
2025-06-04 09:15:42
后续!三亚被蛇咬死的27岁女孩,是漂亮幼师,独生女,准备考研

后续!三亚被蛇咬死的27岁女孩,是漂亮幼师,独生女,准备考研

水晶的视界
2025-06-04 05:37:53
痛心!张雅婷已确认离世,年仅22岁

痛心!张雅婷已确认离世,年仅22岁

金湾通
2025-06-04 15:33:45
2025-06-05 00:15:00
ScienceAI incentive-icons
ScienceAI
关注人工智能与其他前沿技术
944文章数 214关注度
往期回顾 全部

科技要闻

小鹏Q1交付暴涨超理想 蔚来亏62亿研发最猛

头条要闻

三亚死亡女子家属:第二家医院用了血清抢救 愿意尸检

体育要闻

从次轮末到乐透边缘 杨瀚森的试训有什么玄机?

娱乐要闻

彭于晏方出面澄清与蔡依林复合恋情!

财经要闻

地铁涨价争议背后,“赚钱”难题有解吗

汽车要闻

车机升级 新款AION Y Plus上市售9.98万起

态度原创

本地
时尚
教育
健康
公开课

本地新闻

《中国匠人——锦绣中国》即日上线:解读千年丝线的东方美学密码

黄色+蓝色,今年夏天最美配色!

教育要闻

考前心态急救包!心理专家给出三个“稳心剂”

唇疱疹和口腔溃疡是"同伙"吗?

公开课

李玫瑾:为什么性格比能力更重要?