网易首页 > 网易号 > 正文 申请入驻

谷歌、MIT等开发多智能体医疗决策框架MDAgents,医学LLM新用法

0
分享至



编辑 | 白菜叶

基础模型正在成为医学领域的宝贵工具。然而,尽管它们前景广阔,但在复杂的医学任务中如何最好地利用大型语言模型(LLM) 仍是一个悬而未决的问题。

麻省理工学院、谷歌研究院和首尔国立大学医院的研究人员提出了一种新颖的多智能体框架,称为医疗决策智能体 (MDAgents),它通过自动为 LLM 团队分配协作结构来帮助解决这一差距。

指定的个人或小组协作结构是根据手头的医疗任务量身定制的,模拟适应不同复杂程度任务的真实医疗决策过程。该团队使用最先进的 LLM 在一系列真实医学知识和医学诊断基准中评估他们的框架和基线方法,包括将 LLM 的医疗复杂性分类与人类医生进行比较。

在需要理解医学知识和多模态推理的任务中,MDAgents 在十项基准测试中的七项中取得了最佳表现,与以前方法的最佳表现相比,其显著提高了 4.2% (p < 0.05)。

消融研究表明,MDAgents 可以有效确定医学复杂性,从而优化各种医学任务的效率和准确性。值得注意的是,在小组协作中,主持人评审和外部医学知识的结合使平均准确度提高了 11.8%。

该研究以「MDAgents: An Adaptive Collaboration of LLMs for Medical Decision-Making」为题,于 2024 年 10 月 30 日更新在arXiv预印平台。



基础模型在医学领域前景广阔,尤其是在协助完成医疗决策 (MDM) 等复杂任务方面。MDM 是一个细致入微的过程,要求临床医生分析各种数据源(如影像、电子健康记录和遗传信息),同时适应新的医学研究。

LLM 可以通过综合临床数据并实现概率和因果推理来支持 MDM。然而,由于需要适应性强的多层方法,将 LLM 应用于医疗保健领域仍然具有挑战性。尽管多智能体 LLM 在其他领域显示出潜力,但它们目前的设计缺乏与有效临床应用所必需的协作式、分层决策的集成。

LLM 越来越多地应用于医学任务,例如回答医学考试问题、预测临床风险、诊断、生成报告和创建精神病评估。医学 LLM 的改进主要源于使用专门数据进行训练或使用推理时间方法,例如即时工程和检索增强生成 (RAG)。

通用模型(如 GPT-4)通过高级提示在医学基准上表现良好。多智能体框架提高了准确性,智能体通过协作或辩论来解决复杂任务。然而,现有的静态框架可能会限制不同任务的性能,因此动态多智能体方法可能更好地支持复杂的医疗决策。

麻省理工学院、谷歌研究院和首尔国立大学医院开发了 MDAgents,这是一个多智能体框架,旨在根据医疗任务的复杂性动态分配 LLM 之间的协作,模拟现实世界的医疗决策。



图示:MDAgents 框架。(来源:论文)

MDAgents 可以根据具体任务自适应地选择单独或团队协作,在各种医疗基准测试中表现良好。它在 10 个基准测试中的 7 个中超越了之前的方法,准确率提高了 4.2%。关键步骤包括评估任务复杂性、选择合适的智能体和综合响应,通过小组评审可将准确率提高 11.8%。MDAgents 还通过调整智能体使用来平衡性能和效率。

MDAgents 框架围绕医疗决策的四个关键阶段构建:

首先评估医疗查询的复杂程度,将其分为低、中、高;

根据此评估,招募合适的专家:针对较简单的病例,招募单个临床医生;针对较复杂的病例,招募多学科团队;

然后,分析阶段将根据案例的复杂程度采用不同的方法,包括从个人评估到协作讨论;

最后,系统综合所有见解以形成结论性决策,准确的结果表明,与单智能体和其他多智能体设置相比,MDAgents 在各种医疗基准上都具有有效性。



图示:PMC-VQA 数据集中中等复杂程度案例中 MDAgents 的说明性示例。(来源:论文)

该研究在 Solo、Group 和 Adaptive 条件下评估了各种医疗基准测试中的框架和基线模型,显示出显著的稳健性和效率。

Adaptive 方法 MDAgents 可根据任务复杂性有效调整推理,并在十个基准测试中的七个中始终优于其他设置。

测试MedQA和 Path-VQA 等数据集的研究人员发现,自适应复杂度选择可提高决策准确性。



图示:该方法在不同的医学基准上优于 Solo 和 Group 设置。(来源:论文)

通过结合 MedRAG 和主持人的评审,准确率可提高高达 11.8%。此外,该框架对参数变化(包括温度调整)的弹性凸显了其对复杂医疗决策任务的适应性。

论文链接:https://arxiv.org/abs/2404.15155

相关报道:https://www.marktechpost.com/2024/11/04/mdagents-a-dynamic-multi-agent-framework-for-enhanced-medical-decision-making-with-large-language-models/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
WTA年终总决赛半决赛:高芙2-0战胜萨巴伦卡,与郑钦文会师决赛

WTA年终总决赛半决赛:高芙2-0战胜萨巴伦卡,与郑钦文会师决赛

直播吧
2024-11-09 03:13:05
四川一声巨响,打破美国垄断,美根本不相信,我国会有如此大成就

四川一声巨响,打破美国垄断,美根本不相信,我国会有如此大成就

娱乐圈的哔哔王
2024-11-08 07:25:06
太难了!网传大型汽车主机厂停缴企业年金,网友:民企根本没有…

太难了!网传大型汽车主机厂停缴企业年金,网友:民企根本没有…

火山诗话
2024-11-07 06:53:15
“中年女性油腻的特征是什么?”网友回答太扎心

“中年女性油腻的特征是什么?”网友回答太扎心

有趣的火烈鸟
2024-11-08 12:04:12
祖坟风水直接关系到后人的命运,祖坟到底有多重要?

祖坟风水直接关系到后人的命运,祖坟到底有多重要?

心灵短笛
2024-04-09 14:53:28
受贿数额特别巨大!搞“家族式腐败”的戴道晋被公诉

受贿数额特别巨大!搞“家族式腐败”的戴道晋被公诉

政知新媒体
2024-11-08 10:56:09
48岁卖淫女招揽20岁壮小伙,发生关系后竟主动报警:他太欺负人了

48岁卖淫女招揽20岁壮小伙,发生关系后竟主动报警:他太欺负人了

云端小院
2024-10-13 08:10:31
特殊时期时,林彪曾私下里讲过:刘少奇、邓小平全是有能力的好人

特殊时期时,林彪曾私下里讲过:刘少奇、邓小平全是有能力的好人

丹宝说文史
2023-06-10 14:55:24
统一时机到了!台当局提出两大条件,大陆答不答应?释放信号特殊

统一时机到了!台当局提出两大条件,大陆答不答应?释放信号特殊

惊觉惯例
2024-11-08 12:56:27
娱乐圈大地震,他早该有今天了

娱乐圈大地震,他早该有今天了

煮娱星球
2024-10-22 18:33:43
中年女人,多半有这3种“情感需求”,别不懂

中年女人,多半有这3种“情感需求”,别不懂

莲子说情感
2024-09-23 09:59:05
预计到了2030年,我们将全面进入租房时代,房子会越来越难卖

预计到了2030年,我们将全面进入租房时代,房子会越来越难卖

猫小狸同学
2024-11-08 15:20:03
收到70国领导人祝贺的特朗普,在等普京贺电,等来的却是涉台警告

收到70国领导人祝贺的特朗普,在等普京贺电,等来的却是涉台警告

靓仔情感
2024-11-08 18:19:38
摩根大通:美联储料将在2025年第一季度结束缩表 而非2024年底之前

摩根大通:美联储料将在2025年第一季度结束缩表 而非2024年底之前

财联社
2024-11-09 03:04:16
10万亿刺激政策来了!美联储刚降息,中国就出手,大放水要来了?

10万亿刺激政策来了!美联储刚降息,中国就出手,大放水要来了?

说天说地说实事
2024-11-08 20:35:48
要碎了,斯瓦泰克赛后才知道自己赢球对晋级形势毫无影响:哦,谢谢

要碎了,斯瓦泰克赛后才知道自己赢球对晋级形势毫无影响:哦,谢谢

懂球帝
2024-11-08 11:02:41
黄菊:曾任国务院副总理,去世8年后骨灰从八宝山迁出,这是为何

黄菊:曾任国务院副总理,去世8年后骨灰从八宝山迁出,这是为何

文史旺旺旺
2023-10-23 13:41:51
夏洛特彻底无缘王位:11岁乔治身高超 160,穿军装神似乔治六世

夏洛特彻底无缘王位:11岁乔治身高超 160,穿军装神似乔治六世

缘缘人生观
2024-11-08 11:56:36
抗美援朝的最大骗局,美军傻傻地被中国欺骗了41年,成为国际笑话

抗美援朝的最大骗局,美军傻傻地被中国欺骗了41年,成为国际笑话

大海的诺言
2024-10-04 08:44:31
神了!王曼昱回归队友全会打球了!5人八强灭日本,她比马琳管用

神了!王曼昱回归队友全会打球了!5人八强灭日本,她比马琳管用

嘴炮体坛
2024-11-08 18:43:30
2024-11-09 04:00:49
ScienceAI
ScienceAI
关注人工智能与其他前沿技术
658文章数 203关注度
往期回顾 全部

科技要闻

停供7nm及以下AI芯片? 台积电未直接否认

头条要闻

郑钦文闯入WTA年终总决赛决赛 即时排名为世界第五位

头条要闻

郑钦文闯入WTA年终总决赛决赛 即时排名为世界第五位

体育要闻

曾在英冠坐板凳的他 是当今最火爆的射手

娱乐要闻

叶珂闪现闺蜜直播间,黄晓明评论沦陷

财经要闻

直接安排10万亿 地方政府化债压力大大减轻

汽车要闻

售10.98万起 银河星舰7 EM-i开启预售

态度原创

旅游
数码
亲子
游戏
公开课

旅游要闻

4名女游客上山迷路,多方连夜搜寻成功救出

数码要闻

影驰 RTX 4070 Ti SUPER 星曜 Plus OC 显卡开售,6399 元

亲子要闻

幼儿园老师展示小男孩穿衣,光上衣就有七层,一看就是奶奶带得孙

《野狗子》评测:恐怖游戏传奇教父,向中式恐怖题材发起挑战

公开课

AI如何揭开大自然和宇宙的奥秘

无障碍浏览 进入关怀版