网易首页 > 网易号 > 正文 申请入驻

AI预测百万化合物的生物活性信息,这里有个高效开源工具

0
分享至

用化学描述符(chemical descriptors)来编码小分子的物理、化学和结构特性,是化学信息学的核心。生物活性数据的广泛发布提高了化合物的丰富度。然而,大部分小分子都没有对应的生物活性描述符(bioactivity descriptors);这限制了该方法对众多已经被充分表征的化合物的适用性。

西班牙巴塞罗那科学技术研究所(BIST)的研究人员,使用深度机器学习计算模型预测分析了百万个分子的生物活性信息。该团队还披露了一个工具,该工具可以预测任何分子的生物活性空间;即使是没有实验数据作为参照的情况下,该工具依然可以完成分析。

该研究以「Bioactivity descriptors for uncharacterized chemical compounds」为题于2021年6月24日发布在《Nature Communications》杂志。

新方法是基于Chemical Checker(CC)开发的。Chemical Checker可以从每个分子的 25 种生物活性空间中收集信息。这些分子的生物活性空间与,分子的化学结构,分子相互作用的靶标,以及分子在临床或细胞水平上引起的变化等有着重要关联。然而,对于大多数分子来说,这种关于作用机制的高度详细的信息是不完整的;这意味着对于特定的分子,可能仅存在1-2种生物活性空间的信息。基于这个原因,研究人员将所有可用的实验信息与深度机器学习方法相结合,开发了新工具。该工具可以对分子的所有活动概况(从化学到临床水平)进行预测分析。

C C signaturizers的训练与评估

该团队将主要的化学、基因组学和药物数据库整合到Chemical Checker的单一资源中,这是迄今为止可用的最大的小分子生物活性特征集合。在Chemical Checker中,生物活性特征按数据类型(配体-受体结合、细胞敏感性概况、毒理学等)进行组织,遵循化学到临床的基本原理;有助于在药物发现流程的每个步骤选择相关特征类别。从本质上讲,Chemical Checker是存放在公共领域的小分子数据的替代表示,因此,它也受到实验数据的可应用性以及源数据库覆盖范围的限制。研究人员还介绍了该工具在一个基本无特征的化合物库中识别化合物方面的附加值,并通过实现一系列特征-活性关系(signature–activity relationship,SigAR)模型来预测分子的生物物理学信息和生理特性。

signaturizers进行大规模生物活性预测

推动制药领域的发展

药物发现过程好比一个「漏斗管道」,往往要从从数十万甚至数百万化合物的起始池中选择一种药物。Computational drug discovery (CDD) 方法可以在这个庞大而复杂过程中提供帮助。分子的有效数学表示是所有 CDD 方法的关键,二维结构指纹图谱是许多情况下的默认选择。

由于C C signaturizers是简单的 128D-vectors,与使用多维描述符来表示分子结构的 CDD工具包兼容。基于这种兼容性,可以将C C signaturizers输出的生物信息融入相似性搜索、化学空间的可视化、聚类和属性预测,以及其他使用广泛的 CDD 任务。在这项研究中,研究人员展示了如何使用C C signaturizers以生物相关的方式在化学空间中导航;同时揭示了,在注释信息不明确的天然产品集合中存在某种出乎意料的高阶结构。C C signaturizers推断的生物活性特征可用于注释大部分未表征的化学库,并丰富了化合物集合中针对药物靶标的活性信息。

Signature-based的复合集合分析

评估与测试

为了评估结果的稳健性,研究人员将化学描述符的集合扩展到 ECFP(extended connectivity fifingerprints)之外;特别是,加入了 Daylight-like (RDKit) 指纹、MACCS 密钥和一个名为 CDDD 的数据驱动相关的先进描述符。此外,研究人员使用基于 AutoML TPOT的「模型不可知方法」重复了 SigAR 任务预测。

结果表明,与单独使用化学信息预测模型相比,SigAR模型在一系列生物物理学和生理学活动预测基准数据集中具有优越的性能。

MoleculeNet 基准测试,将 CC Signature的预测能力与基于 MFp 的经典方法进行比较

该团队已经将论文中提到的软件工具公布,随着各类分子的生物活性数据的不断发掘,研究人员会及时更新软件库。随着 Chemical Checker 中实验数据的每次更新,人工神经网络也将被修改和完善。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
有哪些以为是小罪,其实是重罪,判刑很重的案例?网友:不敢了

有哪些以为是小罪,其实是重罪,判刑很重的案例?网友:不敢了

另子维爱读史
2026-01-11 19:22:33
“00后”陈某某被押赴刑场 执行死刑

“00后”陈某某被押赴刑场 执行死刑

闪电新闻
2026-02-07 16:53:35
历史上最难造反成功的朝代,从建国到灭亡,434次起义均未成功

历史上最难造反成功的朝代,从建国到灭亡,434次起义均未成功

老达子
2026-02-21 06:35:03
消息称小米17T系列手机研发进度提速,搭载天玑8500/9500芯片

消息称小米17T系列手机研发进度提速,搭载天玑8500/9500芯片

IT之家
2026-02-20 18:41:04
斯诺克最新战报!2-1到2-5,墨菲连续3局1球不进,赵心童夺赛点!

斯诺克最新战报!2-1到2-5,墨菲连续3局1球不进,赵心童夺赛点!

刘姚尧的文字城堡
2026-02-20 23:56:26
最新 | 天津一医院扩建!

最新 | 天津一医院扩建!

天津人
2026-02-20 15:47:16
朱高炽在位不足一年 ,为何能青史留名?他解决了三个天大的难题

朱高炽在位不足一年 ,为何能青史留名?他解决了三个天大的难题

千秋文化
2026-01-21 20:55:53
南方大米产量第一,为啥超市里大部分还是东北米?南方米去哪了?

南方大米产量第一,为啥超市里大部分还是东北米?南方米去哪了?

天下十三洲猎奇
2026-02-18 23:53:55
乱收费!云南一公立医院被罚没近200万

乱收费!云南一公立医院被罚没近200万

富源微生活
2026-02-20 21:06:04
谈判结束,泽连斯基被卖了!9个细节揭开这场“和平大戏”的真相

谈判结束,泽连斯基被卖了!9个细节揭开这场“和平大戏”的真相

牛锅巴小钒
2026-02-20 04:59:53
黄渤青岛宴请岳父母,海鲜大餐摆满桌,结婚多年的妻子气质真好

黄渤青岛宴请岳父母,海鲜大餐摆满桌,结婚多年的妻子气质真好

墨语家
2026-02-19 18:24:53
以一己之力负债2.4万亿,许家印靠山是谁?说出来你可能不信

以一己之力负债2.4万亿,许家印靠山是谁?说出来你可能不信

历史伟人录
2025-11-28 13:58:56
亚洲飞人刘翔现状:43岁环游世界,不工作不缺钱花,二婚坚持丁克

亚洲飞人刘翔现状:43岁环游世界,不工作不缺钱花,二婚坚持丁克

不写散文诗
2026-02-19 23:59:12
1975年毛主席与儿女见面时,江青提议让李讷暂任北京市委书记,最终结果怎样?

1975年毛主席与儿女见面时,江青提议让李讷暂任北京市委书记,最终结果怎样?

寄史言志
2026-01-20 13:57:07
北京高中生张瑞阳:带着冬奥经历迎接未来

北京高中生张瑞阳:带着冬奥经历迎接未来

北青网-北京青年报
2026-02-20 14:09:07
吴石案后,蒋经国以为台湾再无地下党,却不知李克农还留了后手!

吴石案后,蒋经国以为台湾再无地下党,却不知李克农还留了后手!

阿泠你好
2026-02-04 09:46:20
德国名将韩莹老公爆料,北京队教练给王楚钦专门在房间弄个台球桌

德国名将韩莹老公爆料,北京队教练给王楚钦专门在房间弄个台球桌

凤幻洋
2026-02-20 15:01:19
女子购买泰康在线“慢病百万医疗险”,理赔遭拒后保单莫名消失;保险公司存在哪些问题?律师说法

女子购买泰康在线“慢病百万医疗险”,理赔遭拒后保单莫名消失;保险公司存在哪些问题?律师说法

中国能源网
2026-02-20 11:33:16
手气爆棚!河南52岁男子打麻将连续自摸胡牌,兴奋过度,突然栽倒牌桌,送医时血压飙升至201/115mmHg

手气爆棚!河南52岁男子打麻将连续自摸胡牌,兴奋过度,突然栽倒牌桌,送医时血压飙升至201/115mmHg

芒果都市
2026-02-20 16:07:55
OpenAI财务数据曝光:2025年营收超预期 1.4万亿美元算力支出腰斩

OpenAI财务数据曝光:2025年营收超预期 1.4万亿美元算力支出腰斩

凤凰网科技
2026-02-21 07:31:09
2026-02-21 08:15:00
ScienceAI incentive-icons
ScienceAI
关注人工智能与其他前沿技术
1234文章数 224关注度
往期回顾 全部

科技要闻

莫迪举手欢呼 两大AI掌门人却握拳尴尬对峙

头条要闻

7名中国游客贝加尔湖遇难 目击者:车两三分钟就沉了

头条要闻

7名中国游客贝加尔湖遇难 目击者:车两三分钟就沉了

体育要闻

金牌夫妻!王心迪徐梦桃赛后拥抱太甜了

娱乐要闻

《将门独后》开拍,王鹤棣孟子义主演

财经要闻

特朗普全球关税被推翻!有何影响?

汽车要闻

比亚迪的“颜值担当”来了 方程豹首款轿车路跑信息曝光

态度原创

手机
本地
家居
公开课
军事航空

手机要闻

苹果 iOS 26.4 新细节:新增“平均就寝时间”

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

家居要闻

本真栖居 爱暖伴流年

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

消息人士透露:美军赴黄海活动 解放军有效应对处置

无障碍浏览 进入关怀版