网易首页 > 网易号 > 正文 申请入驻

CellAgent:LLM Agent 助力单细胞测序数据分析的重要突破丨AI 4 Science

0
分享至

单细胞转录组测序技术自2013年被《Nature Methods》杂志评为年度技术以来,已快速发展十余年。

随着技术成本降低和研究推进,该技术在临床和生物学研究中的应用变得更加广泛,涵盖疾病监测、新药靶点开发、辅助生殖与产前诊断、基因调控和细胞通讯等领域。单细胞转录组测序数据分析已成为这些领域的必要步骤。

然而,目前的单细胞数据分析存在门槛较高、难度大等问题,它要求研究人员同时具备相应的生物医学知识背景和较高的编程能力、数据分析能力。整个分析流程涉及专业知识指导下的复杂工具选择和参数调节,过程繁琐且耗时,对广大研究者们形成了巨大挑战。

为了解决这一难题、打破专业壁垒,来自西北工业大学和天津大学的研究者近期共同提出一个专为单细胞数据分析任务设计的自动化LLM Agent——CellAgent。用户只需输入数据及分析需求,无需编程或单细胞数据分析基础,CellAgent即可通过多个专家级大语言模型的有效协作,实现高质量、自动化的单细胞数据分析

CellAgent显著降低了单细胞数据分析的门槛和工作量,标志着大语言模型驱动的AI智能体在科学领域应用的又一重要突破,推动了“Agent for Science”新时代的快速发展。

1

背景

单细胞RNA测序(scRNA-seq)技术允许以前所未有的规模和精度分析转录组数据,彻底改变了分子生物学。这一进步推动了计算方法的大规模创新,目前已有超过1400种工具可用于从各种角度分析scRNA-seq数据。

然而,scRNA-seq数据分析涉及相当的复杂性,需要专业的知识和技能。分析步骤包括预处理、批次校正、聚类、寻找标记基因、细胞类型注释、轨迹推断等。研究人员必须执行相应的代码或工具,并配置适合生物数据特定特征的参数和模型,这不仅需要高级编程技能,还需要坚实的生物医学背景。因此,迫切需要一种智能Agent,能够理解用户意图,自动化执行scRNA-seq数据分析任务并生成结果。

2

CellAgent多智能体

协作框架设计

scRNA-seq数据分析的复杂性和多样性需要手动选择工具和优化参数。CellAgent利用大型语言模型(LLM)来自动化整个分析流程。它通过三种LLM驱动的生物专家角色——Planner(规划者)、Executor(执行者)和Evaluator(评估者),实现高效协作。Planner负责高层次规划和任务分解,Executor执行具体任务,而Evaluator评估执行结果并促进自我优化。通过这种分层决策和自迭代优化的协作机制,CellAgent能够有效处理scRNA-seq数据分析任务,并在大多数情况下超过其他现有工具的表现。

CellAgent在50多个单细胞数据集上进行了测试,涵盖数十种组织和数百种不同的细胞类型,包括正常和疾病样本。在20多个具有专家注释标签的数据集上的实验结果表明,CellAgent表现稳健,任务完成率和分析质量均为优秀。

3

CellAgent实现了

高效去批次效应

研究评估了CellAgent在批次校正方面的性能,使用了九个涵盖人体主要组织或器官的数据集。CellAgent内部整合了多种优秀去批次算法,CellAgent根据数据集具体特性,选择合适的算法,通过内部迭代机制和Evaluator(基于GPT4v,可以有效提取图像信息)的评估结果,选择最优结果作为输出

与scVI、LIGER、Scanorama、Harmony、Combat等去批次算法相比CellAgent在批次校正和生物效应保留方面表现出色,并取得了最高的平均综合得分0.68。通过Heart数据集的UMAP图可以观察到,CellAgent成功去除了批次效应,同时保留了真实的细胞类型。

4

CellAgent提高了

细胞类型注释的准确率

细胞类型注释是单细胞数据分析中的重要一环。针对细胞类型注释任务,传统的单一工具注释结果通常具有一定的局限性,无法很好地泛化到不同的数据集中。人工手动注释同时要求研究人员有专业的知识、通常需要大量时间。

CellAgent能自动寻找细胞各个簇的差异表达基因,以及调用不同细胞类型注释工具获得答案,并综合这些不同信息完成细胞类型注释。对比七种不同方法在多个数据集上进行了性能基准测试,结果显示CellAgent在平均准确率上表现优异,并且在一些数据集(如人类外周血单个核细胞)上的注释结果与专家标注高度一致。

5

CellAgent实现了

高效轨迹推断

细胞轨迹推断在解码细胞发育和分化方面发挥着关键作用。CellAgent集成了Dyno(一个专门适用于单细胞轨迹推断的R包),CellAgent可以数据集大小、用户指定算法运行时间等信息选出潜在的不同轨迹推断算法作为备选,通过迭代机制,选出其中Top n个算法执行,然后利用Evaluator的多模态能力和专家知识,针对推测轨迹的图像进行打分,选出最优结果

在造血干细胞、人类胚胎细胞等9个数据集上,与Slingshot、Paga等五种方法进行了比较。结果显示,CellAgent在多个指标上表现出色,并在上取得了最高的平均整体得分。CellAgent在造血干细胞数据集上成功揭示了细胞的发育轨迹,并展示了其基因表达模式的变化。这表明CellAgent能够帮助科学家理解决定细胞命运和相关生物过程的机制。

6

总结

CellAgent是一种通用、可扩展、自动化的scRNA-seq数据分析工具。它采用了分层决策和自我迭代优化机制,有效保证了数据分析的质量。CellAgent不依赖于人工干预,大大降低了数据分析的难度和成本。

此外,其开放式架构使用户能够提供特定的新知识和工具,使CellAgent能够更好地符合用户的期望,成为研究人员的理想助手。CellAgent的出现不仅为生物信息学开辟了新的研究方向,而且扩展了生成式人工智能在科学中的应用,助力新发现和更深入的生物系统理解。

文章链接:https://www.biorxiv.org/content/10.1101/2024.05.13.593861

作者团队:

西北工业大学彭佳杰团队:团队致力于研究面向生物医学数据分析的人工智能方法,开发生物信息算法、发现重要生物学机制、助力疾病早筛与智能化药物设计,主要研究方向为单细胞测序数据分析、脑疾病早筛与风险评估、智能药物设计等,在生物医学、生物信息学、人工智能等多领域期刊与会议发表论文80余篇。成员包括肖弋杭(硕士生)、谢晓涵(硕士生)等。

天津大学郝建业团队:团队主要研究方向为具身智能、LLM Agent、强化学习与多智能体系统等,发表人工智能领域国际会议和期刊论文100余篇,专著2部。研究成果荣获国际会议最佳论文奖3次,NeurIPS20-22大会竞赛冠军4次。相关成果在工业基础软件智能化、自动驾驶、游戏AI、广告及推荐、5G优化、物流调度等领域落地应用。成员包括刘金毅(博士生)、郑岩(副教授)等。

更多内容,点击下方关注:

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
特朗普访华 如愿了吗?全球舆论:今非昔比

特朗普访华 如愿了吗?全球舆论:今非昔比

看看新闻Knews
2026-05-16 19:14:37
现在直播卖衣服都在擦边啊…

现在直播卖衣服都在擦边啊…

微微热评
2026-05-16 22:19:31
中美峰会,卢秀燕表态,郑丽文发声,岛内支持统一民调人数惊人

中美峰会,卢秀燕表态,郑丽文发声,岛内支持统一民调人数惊人

DS北风
2026-05-15 17:55:21
30岁女子用爬楼机锻炼,摔倒后身亡

30岁女子用爬楼机锻炼,摔倒后身亡

中国新闻周刊
2026-05-16 11:33:59
新娘换装46分钟宾客散场:当场给老公甩脸,店长曝更多,拒绝调解

新娘换装46分钟宾客散场:当场给老公甩脸,店长曝更多,拒绝调解

阿纂看事
2026-05-16 16:32:57
海风:听到特朗普这句话,台湾当局该醒了

海风:听到特朗普这句话,台湾当局该醒了

环球网资讯
2026-05-16 17:37:05
你和青春期孩子处不好的根源:太把他们当人看了

你和青春期孩子处不好的根源:太把他们当人看了

男孩派
2026-05-16 12:11:26
商务部新闻发言人就中美经贸磋商初步成果答记者问

商务部新闻发言人就中美经贸磋商初步成果答记者问

界面新闻
2026-05-16 20:15:14
江西举报恩人沈女士已社死,正脸照被爆,大叔岗位被调,景区回应

江西举报恩人沈女士已社死,正脸照被爆,大叔岗位被调,景区回应

云舟史策
2026-05-16 09:39:33
法治在线丨22笔房贷断供、贷款人集体失联 警方披露案件细节

法治在线丨22笔房贷断供、贷款人集体失联 警方披露案件细节

环球网资讯
2026-05-15 14:46:17
暗访福建10多家杨梅收购点:有商贩浸泡8000倍超甜添加剂药水里,工人一口都不敢吃,主要销往上海和浙江等地的批发市场

暗访福建10多家杨梅收购点:有商贩浸泡8000倍超甜添加剂药水里,工人一口都不敢吃,主要销往上海和浙江等地的批发市场

环球网资讯
2026-05-16 19:00:46
多名中国男子赴泰国后集体失联!家属曾接到来电,称“人很安全,已在当地找到工作,无需担心”,但全程声音哽咽、情绪压抑

多名中国男子赴泰国后集体失联!家属曾接到来电,称“人很安全,已在当地找到工作,无需担心”,但全程声音哽咽、情绪压抑

新民晚报
2026-05-16 20:30:24
从美国政要抛弃一切中国赠与的礼品事件可以看出,中美破冰尚早

从美国政要抛弃一切中国赠与的礼品事件可以看出,中美破冰尚早

魔都姐姐杂谈
2026-05-16 13:47:09
国务院824号令正式施行!亲人离世黄金24小时,不求人不花冤枉钱

国务院824号令正式施行!亲人离世黄金24小时,不求人不花冤枉钱

石辰搞笑日常
2026-05-16 18:52:36
1-0!哈兰德助攻,塞门约制胜,曼城加冕双冠王,切尔西四大皆空

1-0!哈兰德助攻,塞门约制胜,曼城加冕双冠王,切尔西四大皆空

我的护球最独特
2026-05-16 23:56:47
给近5年最好的10部犯罪剧排名:《低智商犯罪》第5,《狂飙》第2

给近5年最好的10部犯罪剧排名:《低智商犯罪》第5,《狂飙》第2

史料布籍
2026-05-16 16:55:11
中方给足面子!特朗普刚回美国,中方官宣重大消息,高市又遭打击

中方给足面子!特朗普刚回美国,中方官宣重大消息,高市又遭打击

而长终
2026-05-16 23:34:39
特朗普称“不希望台独”,赖清德回应了,十分不简单

特朗普称“不希望台独”,赖清德回应了,十分不简单

音乐时光的娱乐
2026-05-16 21:35:43
中超形势:蓉城14分领跑 卫冕冠军距降级区仅3分 下轮3场重磅对决

中超形势:蓉城14分领跑 卫冕冠军距降级区仅3分 下轮3场重磅对决

我爱英超
2026-05-16 22:00:43
特朗普团队丢弃全部中国赠品:美中“零信任”外交的生动表现

特朗普团队丢弃全部中国赠品:美中“零信任”外交的生动表现

小雨亭
2026-05-16 17:36:06
2026-05-17 03:44:49
AI科技评论 incentive-icons
AI科技评论
点评学术,服务AI
7280文章数 20751关注度
往期回顾 全部

科技要闻

涨的是车价,要的是老命

头条要闻

又想“抹黑”中国 福克斯新闻“翻车”了

头条要闻

又想“抹黑”中国 福克斯新闻“翻车”了

体育要闻

马刺2号,少年老成,这集看过?

娱乐要闻

谢霆锋北京街头骑行被偶遇,侧颜帅炸

财经要闻

造词狂魔贾跃亭

汽车要闻

大五座SUV卷王!乐道L80上市 租电15.68万元起

态度原创

家居
本地
健康
艺术
旅游

家居要闻

110㎡淡而有致的生活表达

本地新闻

用苏绣的方式,打开江西婺源

专家揭秘干细胞回输的安全风险

艺术要闻

惊!艾米·亚当斯竟是坠入凡间的仙女?

旅游要闻

重磅!珠海推出260余项活动,释放史上最强文旅红利

无障碍浏览 进入关怀版