网易首页 > 网易号 > 正文 申请入驻

AI预测百万化合物的生物活性信息,这里有个高效开源工具

0
分享至

用化学描述符(chemical descriptors)来编码小分子的物理、化学和结构特性,是化学信息学的核心。生物活性数据的广泛发布提高了化合物的丰富度。然而,大部分小分子都没有对应的生物活性描述符(bioactivity descriptors);这限制了该方法对众多已经被充分表征的化合物的适用性。

西班牙巴塞罗那科学技术研究所(BIST)的研究人员,使用深度机器学习计算模型预测分析了百万个分子的生物活性信息。该团队还披露了一个工具,该工具可以预测任何分子的生物活性空间;即使是没有实验数据作为参照的情况下,该工具依然可以完成分析。

该研究以「Bioactivity descriptors for uncharacterized chemical compounds」为题于2021年6月24日发布在《Nature Communications》杂志。

新方法是基于Chemical Checker(CC)开发的。Chemical Checker可以从每个分子的 25 种生物活性空间中收集信息。这些分子的生物活性空间与,分子的化学结构,分子相互作用的靶标,以及分子在临床或细胞水平上引起的变化等有着重要关联。然而,对于大多数分子来说,这种关于作用机制的高度详细的信息是不完整的;这意味着对于特定的分子,可能仅存在1-2种生物活性空间的信息。基于这个原因,研究人员将所有可用的实验信息与深度机器学习方法相结合,开发了新工具。该工具可以对分子的所有活动概况(从化学到临床水平)进行预测分析。

C C signaturizers的训练与评估

该团队将主要的化学、基因组学和药物数据库整合到Chemical Checker的单一资源中,这是迄今为止可用的最大的小分子生物活性特征集合。在Chemical Checker中,生物活性特征按数据类型(配体-受体结合、细胞敏感性概况、毒理学等)进行组织,遵循化学到临床的基本原理;有助于在药物发现流程的每个步骤选择相关特征类别。从本质上讲,Chemical Checker是存放在公共领域的小分子数据的替代表示,因此,它也受到实验数据的可应用性以及源数据库覆盖范围的限制。研究人员还介绍了该工具在一个基本无特征的化合物库中识别化合物方面的附加值,并通过实现一系列特征-活性关系(signature–activity relationship,SigAR)模型来预测分子的生物物理学信息和生理特性。

signaturizers进行大规模生物活性预测

推动制药领域的发展

药物发现过程好比一个「漏斗管道」,往往要从从数十万甚至数百万化合物的起始池中选择一种药物。Computational drug discovery (CDD) 方法可以在这个庞大而复杂过程中提供帮助。分子的有效数学表示是所有 CDD 方法的关键,二维结构指纹图谱是许多情况下的默认选择。

由于C C signaturizers是简单的 128D-vectors,与使用多维描述符来表示分子结构的 CDD工具包兼容。基于这种兼容性,可以将C C signaturizers输出的生物信息融入相似性搜索、化学空间的可视化、聚类和属性预测,以及其他使用广泛的 CDD 任务。在这项研究中,研究人员展示了如何使用C C signaturizers以生物相关的方式在化学空间中导航;同时揭示了,在注释信息不明确的天然产品集合中存在某种出乎意料的高阶结构。C C signaturizers推断的生物活性特征可用于注释大部分未表征的化学库,并丰富了化合物集合中针对药物靶标的活性信息。

Signature-based的复合集合分析

评估与测试

为了评估结果的稳健性,研究人员将化学描述符的集合扩展到 ECFP(extended connectivity fifingerprints)之外;特别是,加入了 Daylight-like (RDKit) 指纹、MACCS 密钥和一个名为 CDDD 的数据驱动相关的先进描述符。此外,研究人员使用基于 AutoML TPOT的「模型不可知方法」重复了 SigAR 任务预测。

结果表明,与单独使用化学信息预测模型相比,SigAR模型在一系列生物物理学和生理学活动预测基准数据集中具有优越的性能。

MoleculeNet 基准测试,将 CC Signature的预测能力与基于 MFp 的经典方法进行比较

该团队已经将论文中提到的软件工具公布,随着各类分子的生物活性数据的不断发掘,研究人员会及时更新软件库。随着 Chemical Checker 中实验数据的每次更新,人工神经网络也将被修改和完善。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

/阅读下一篇/

AI模型如何解析和控制大脑?「数字孪生」大脑也许不是伪命题

返回网易首页 下载网易新闻客户端
相关推荐
热点推荐
网传某知名公司裁员近万人,真实案例揭露失业后到底有多惨…

网传某知名公司裁员近万人,真实案例揭露失业后到底有多惨…

慧翔百科
2025-06-20 09:15:06
公务员吃空饷大整顿!这6类人员将被重点清退,一个都跑不掉!

公务员吃空饷大整顿!这6类人员将被重点清退,一个都跑不掉!

爱下厨的阿椅
2025-06-22 05:30:42
苏州发布:张韶涵演唱会结束昆山奥体连夜拆舞台,1周后迎接苏超

苏州发布:张韶涵演唱会结束昆山奥体连夜拆舞台,1周后迎接苏超

直播吧
2025-06-22 17:43:15
巴铁急红眼!40架歼35交付突生变数,印度连夜笑醒

巴铁急红眼!40架歼35交付突生变数,印度连夜笑醒

健身狂人
2025-06-22 12:19:40
七宝老街沿街商铺店招店牌发生脱落,无人员受困受伤

七宝老街沿街商铺店招店牌发生脱落,无人员受困受伤

澎湃新闻
2025-06-22 19:50:30
血栓开始形成,耳朵先知?医生:血栓患者,耳朵一般有这5个表现

血栓开始形成,耳朵先知?医生:血栓患者,耳朵一般有这5个表现

华庭讲美食
2025-06-22 16:25:47
伊朗再次迎来新帮手,公开威胁:若美敢出兵,将立即使出3大绝招

伊朗再次迎来新帮手,公开威胁:若美敢出兵,将立即使出3大绝招

通文知史
2025-06-21 15:21:57
无福斯特!总决抢七大战裁判名单:卡珀斯主裁 蒂文赖特副裁

无福斯特!总决抢七大战裁判名单:卡珀斯主裁 蒂文赖特副裁

直播吧
2025-06-22 21:31:16
《花儿与少年7》正式官宣,看完新一季嘉宾阵容,网友们激动不已

《花儿与少年7》正式官宣,看完新一季嘉宾阵容,网友们激动不已

动物奇奇怪怪
2025-06-22 12:01:37
广州一女子醉驾拒检称“人大代表可以喝酒” 次日被责令辞去职务

广州一女子醉驾拒检称“人大代表可以喝酒” 次日被责令辞去职务

五味坛
2025-06-22 10:45:29
这也太惨了吧!这名98年生人的美女,就因15000多欠款,被悬赏500

这也太惨了吧!这名98年生人的美女,就因15000多欠款,被悬赏500

火山诗话
2025-06-22 07:14:29
记者:海港主场落败主要责任在教练组,去年更多还是球队实力太强

记者:海港主场落败主要责任在教练组,去年更多还是球队实力太强

直播吧
2025-06-22 20:13:18
克服麻痹思想和侥幸心理!湖南省委书记沈晓明赴受灾现场检查督导

克服麻痹思想和侥幸心理!湖南省委书记沈晓明赴受灾现场检查督导

政知新媒体
2025-06-22 21:47:23
天塌了!李月汝队友,WNBA状元佩奇官宣恋情,对象也是美女球员

天塌了!李月汝队友,WNBA状元佩奇官宣恋情,对象也是美女球员

老王大话体育
2025-06-22 16:01:14
雷军还是瞒不住了!su7ultra跑纽北赛道圈速,被英国媒体头版刊登

雷军还是瞒不住了!su7ultra跑纽北赛道圈速,被英国媒体头版刊登

火山诗话
2025-06-22 09:37:50
大众打出“降价牌”!9.88万又降3万,6.42万起售,只为卖出去

大众打出“降价牌”!9.88万又降3万,6.42万起售,只为卖出去

爱论历史
2025-06-20 22:10:17
1979年以来首次!美国直接袭击伊朗 专家:很震惊,接下来关键看伊朗如何评估

1979年以来首次!美国直接袭击伊朗 专家:很震惊,接下来关键看伊朗如何评估

红星新闻
2025-06-22 11:56:26
炸完伊朗,以色列下一个目标定了:是一个有核国家,想为伊朗出头

炸完伊朗,以色列下一个目标定了:是一个有核国家,想为伊朗出头

利刃号
2025-06-20 17:38:04
武大毕业典礼后现场遗留垃圾引质疑,教师建议今后遇突发天气到室内举行

武大毕业典礼后现场遗留垃圾引质疑,教师建议今后遇突发天气到室内举行

澎湃新闻
2025-06-22 21:06:50
女子炫耀800万兰博基尼挂墙上,餐桌150万,一年电费40万遭封禁

女子炫耀800万兰博基尼挂墙上,餐桌150万,一年电费40万遭封禁

汉史趣闻
2025-06-21 14:47:35
2025-06-22 22:59:00
ScienceAI incentive-icons
ScienceAI
关注人工智能与其他前沿技术
975文章数 214关注度
往期回顾 全部

科技要闻

"你应该靠嘴吃饭",罗永浩自述被梁文锋劝退

头条要闻

伊议会赞成关闭霍尔木兹海峡 一美军监管的中心发警告

体育要闻

中国女排0-3意大利 香港站3胜1负收官

娱乐要闻

离婚四年!赵丽颖被曝新恋情惹争议

财经要闻

苹果后院起火

汽车要闻

首搭华为双王牌/6月24日预售 岚图FREE+正式下线

态度原创

艺术
家居
健康
教育
公开课

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

家居要闻

山水之间 墨染风雨云间

呼吸科专家破解呼吸道九大谣言!

教育要闻

52所学校上榜!160名学生入选北京“后备人才计划”公示名单

公开课

李玫瑾:为什么性格比能力更重要?