网易首页 > 网易号 > 正文 申请入驻

国家蛋白质科学中心&北工大团队开发了一种深度学习工具

0
分享至

编辑 | 萝卜皮

保留时间(Retention time,RT)比对是基于液相色谱-质谱(LC-MS)的蛋白质组学和代谢组学实验中的关键步骤,特别是对于大型队列研究。最流行的对齐工具是基于扭曲函数方法和直接匹配方法。然而,现有工具很难同时处理单调和非单调 RT 平移。

国家蛋白质科学中心(北京)和北京工业大学的研究团队开发了一种基于深度学习的 RT 对齐工具 DeepRTAlign,用于大型队列 LC-MS 数据分析。

通过在多个真实数据和模拟蛋白质组学和代谢组学数据集上,与当前 SOTA 方法进行基准测试,DeepRTAlign 被证明具有改进的性能。并且,DeepRTAlign 可以在不影响定量准确性的情况下提高识别灵敏度。此外,使用 DeepRTAlign 对齐的 MS 特征,研究人员训练了一个强大的分类器来预测肝细胞癌的早期复发。

该研究以「DeepRTAlign: toward accurate retention time alignment for large cohort mass spectrometry data analysis」为题,于 2023 年 12 月 11 日发布在《Nature Communications》。

在蛋白质组学实验中,液相色谱 (LC) 通常与质谱 (MS) 结合使用,以分离复杂的样品。MS 数据中每种分析物的保留时间 (RT) 通常会因多种原因而发生变化,包括基质效应和仪器性能。因此,在任何涉及多个样品的实验中,在定量、比较或统计分析之前必须绘制相应的分析物。这个过程称为通信。换句话说,这个问题可以定义为在多个样本中找到「相同的化合物」。

一般来说,在蛋白质组学中,可以根据肽鉴定来进行对应。然而,由于数据依赖采集(DDA)模式下的数据依赖离子选择过程,只有15%~25%的前体具有相应的鉴定。即使对于数据独立采集(DIA)数据,仍然存在许多未识别的前体(潜在的肽),由于复杂的MS/MS谱图,在后续分析中无法考虑这些前体。

大多数现有的 DDA 和 DIA 数据分析工具,例如 MaxQuant4、PANDA、MSFragger 和 DIA-NN,使用运行间匹配 (MBR) 功能执行 RT 比对,以在任意两次 LC-MS 运行之间将已识别的序列转移到未识别的前体 。

尽管MBR可以在一定程度上增加鉴定总数,但它被集成到特定的软件工具中并依赖于已鉴定的肽,这限制了其在临床蛋白质组学研究中从未鉴定的前体中探索新的生物标志物的进一步应用。

在代谢组学中,特征对齐是识别和定量的先决条件。理论上,特征对齐的准确性取决于 MS 数据中的 m/z 和 RT 信息。目前,高分辨率质谱仪可以将 m/z 偏移限制在 10 ppm 以下。因此,RT 比对对于准确分析大规模蛋白质组学和代谢组学研究数据尤为重要。

RT 比对有两种类型的计算方法。一种称为翘曲法。但是,由于翘曲函数是单调的,因此这种方法无法校正非单调平移。另一种方法是直接匹配方法,它尝试仅根据运行之间的特定信号之间的相似性来执行对应,而不使用扭曲函数。

据报道,由于 MS 信号的不确定性,现有直接匹配工具的性能不如使用扭曲函数的工具。无论如何,这些工具很难同时处理单调和非单调 RT 移位。因此,应用机器学习或深度学习技术来解决这个问题。目前还没有基于深度学习的 LC-MS 数据分析比对算法。

国家蛋白质科学中心和北京工业大学的研究团队提出了提出了一种基于深度学习的工具 DeepRTAlign,用于大型队列蛋白质组和代谢组数据分析中的 RT 对齐。

DeepRTAlign 结合了粗对齐(伪扭曲函数)和基于深度学习的模型(直接匹配),可以处理单调移位和非单调移位。

图:DeepRTAlign算法图解。(来源:论文)

研究人员证明 DeepRTAlign 可以在不影响量化精度的情况下比对更多相应特征,从而优于其他现有比对工具,并确定了其在多个蛋白质组学和代谢组学数据集上的通用性边界。

与现有的流行工具相比,该工具已经在几个蛋白质组学和代谢组学数据集中证明了其高准确性和敏感性。此外,DeepRTAlign 使科学家能够直接准确地将 MS 特征应用于下游生物分析,例如生物标志物发现或预后预测,这可以补充传统的基于 identification(ID)的方法。

DeepRTAlign 灵活且稳健,具有不同的特征提取工具,可以帮助研究人员获得准确且可重复的研究数据。同时,由于理论上对齐对量化的影响小于特征提取,该团队将在未来的工作中尝试通过同时优化特征提取和特征对齐来提高量化精度。

研究人员将 DeepRTAlign 应用于 HCC 早期复发预测作为真实实验的示例。结果表明,与肽和蛋白质相比,对齐的 MS 特征具有更有效的信息。DeepRTAlign 预计将有助于寻找低丰度的生物标志物(这些生物标志物通常只有低质量的 MS/MS 谱图),并且可能在蛋白质组学驱动的精准医学中发挥关键作用。

论文链接:https://www.nature.com/articles/s41467-023-43909-5

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

/阅读下一篇/

直接指导荧光分子设计,浙大等提出模块化人工智能框架FLAME

返回网易首页 下载网易新闻客户端
相关推荐
热点推荐
微笑的空姐

微笑的空姐

阿废冷眼观察所
2025-04-15 13:52:23
太解气了!苹果iPad彻底被华为击败,年销850万台,同比大涨32%

太解气了!苹果iPad彻底被华为击败,年销850万台,同比大涨32%

码不停蹄
2025-04-22 18:31:23
这事复杂:京东炮轰“二选一”,美团晒出了一张图反击

这事复杂:京东炮轰“二选一”,美团晒出了一张图反击

齐鲁壹点
2025-04-22 10:47:24
合肥一烂尾商业体,有望复活!

合肥一烂尾商业体,有望复活!

新站楼市
2025-04-22 22:46:02
为啥男的出轨原配打骂的是小三?网友:有本领的男人都争着要

为啥男的出轨原配打骂的是小三?网友:有本领的男人都争着要

娱乐圈人物大赏
2025-04-23 00:20:09
贵州退休夫妻跳楼身亡,账户流水400万,留遗言:没有活着的希望

贵州退休夫妻跳楼身亡,账户流水400万,留遗言:没有活着的希望

晓艾故事汇
2025-04-09 20:44:14
茂名这位高考状元犀利!澳门特首跟他是大学同班同学!

茂名这位高考状元犀利!澳门特首跟他是大学同班同学!

粤西生活圈
2025-04-22 19:32:11
被折磨到崩溃!上海一九旬老太每天定时“输出”,邻居被迫“魔法打魔法”

被折磨到崩溃!上海一九旬老太每天定时“输出”,邻居被迫“魔法打魔法”

环球网资讯
2025-04-21 19:06:41
意外!北京理工学院多位学生发声,曝宫琳真实人品!

意外!北京理工学院多位学生发声,曝宫琳真实人品!

古希腊掌管松饼的神
2025-04-20 20:19:01
郭晶晶出席大女儿生日宴被问有没有喊上全红婵蹭饭!回复笑翻全场

郭晶晶出席大女儿生日宴被问有没有喊上全红婵蹭饭!回复笑翻全场

阿纂看事
2025-04-23 00:15:45
季后赛打15分钟被弃用!就这还想取代克莱?巴特勒:看他运球就烦

季后赛打15分钟被弃用!就这还想取代克莱?巴特勒:看他运球就烦

你的篮球频道
2025-04-22 08:52:10
宇树科技陷入舆论质疑,王兴兴知乎发帖再回应

宇树科技陷入舆论质疑,王兴兴知乎发帖再回应

南方都市报
2025-04-21 21:49:08
特朗普对中国4个友国额外加税,最高达3500%, 四国无一愿背刺中国

特朗普对中国4个友国额外加税,最高达3500%, 四国无一愿背刺中国

千里持剑
2025-04-22 10:24:49
美国114页报告得出结论:若跟中国开战,战争将在一个月内结束

美国114页报告得出结论:若跟中国开战,战争将在一个月内结束

boss外传
2025-02-25 19:20:03
广东会所20岁彝族女孩去世,事发前曾从包厢哭着跑出,哥哥曝细节

广东会所20岁彝族女孩去世,事发前曾从包厢哭着跑出,哥哥曝细节

清游说娱
2025-04-22 14:50:15
装栏杆、骂邻居,国内停车困局,被日本一个双线设计轻松瓦解

装栏杆、骂邻居,国内停车困局,被日本一个双线设计轻松瓦解

李子橱
2025-04-20 09:58:45
马龙:我这辈子最正确的决定,就是拒绝石川佳纯,娶18岁校花

马龙:我这辈子最正确的决定,就是拒绝石川佳纯,娶18岁校花

晓岇就是我
2025-04-15 19:57:49
印度部长:当前全球贸易危机的根源,在于让中国入世,不欢迎中资

印度部长:当前全球贸易危机的根源,在于让中国入世,不欢迎中资

猎火照狼山
2025-04-14 13:57:44
狂轰33+12+3!又一个哈登诞生,火箭很遗憾吧,你们错过新基石

狂轰33+12+3!又一个哈登诞生,火箭很遗憾吧,你们错过新基石

巴叔GO聊体育
2025-04-22 12:32:31
纳达尔:我并不怀念网球,我的身体不能再付出了

纳达尔:我并不怀念网球,我的身体不能再付出了

懂球帝
2025-04-22 19:13:14
2025-04-23 01:39:00
ScienceAI incentive-icons
ScienceAI
关注人工智能与其他前沿技术
880文章数 213关注度
往期回顾 全部

科技要闻

美团骑手亲述:京东外卖单子佣金高却难抢

头条要闻

越南总理定调与美关税谈判后 越南股市一度闪崩后反转

体育要闻

当今足坛最疯的门将,能有多离谱?

娱乐要闻

大s儿女回京!张兰气场全开汪小菲谈养老

财经要闻

宜宾银行与五粮液集团频繁关联交易

汽车要闻

捷途山海T2加长版/山海L9等 捷途新车展前亮相

态度原创

旅游
时尚
本地
艺术
公开课

旅游要闻

热闻|清明假期将至,热门目的地有哪些?

无用之书·共读 | 随机波动:读书是一种隔空的拥抱

本地新闻

云游湖北 | 澴川醉古今!孝文化名城藏了多少宝藏?

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

公开课

李玫瑾:为什么性格比能力更重要?