网易首页 > 网易号 > 正文 申请入驻

清华开源“药研双擎”:多模态大模型+AutoPilot,重构AI制药

0
分享至

始智AI wisemodel.cn开源社区

始智AI wisemodel.cn社区是源自中国的中立开放的AI开源社区。正在,欢迎加入共同成长。wisemodel社区上线,H800/H20等资源上线,价格实惠,灵活方便,支持在线微调训练模型,及和,并。

2025年初,DeepSeek引发全球AI大模型新一轮热议。受其影响,从大模型供应商到基础设施和平台供应商,整个AI产业生态掀起新发展浪潮。DeepSeek R1推理能力强,为各行业智能化升级带来新机遇,生物医药领域也迎来“DeepSeek时刻”。

这一背景下,水木分子与清华大学 AIR 携手开源了 BioMedGPT-R1多模态生物医药推理大模型和 OpenBioMed 生命科学与药物研发智能体平台。目前已上线始智AI-wisemodel开源社区,欢迎感兴趣的朋友进行体验,以及给项目star。


模型地址

https://www.wisemodel.cn/models/PharMolix/BioMedGPT-R1/file

https://wisemodel.cn/organization/PharMolix

自发布以来,BioMedGPT和OpenBioMed受到了开源社区和产研界的广泛欢迎和好评。

BioMedGPT-R1基于DeepSeek R1,更新了文本基座模型,通过跨模态特征对齐,实现生物与文本模态融合 ,支持跨模态交互式问答推理,能对药物分子深度分析。

OpenBioMed架构底层是科研数据和知识图谱,中层是垂直大模型与核心任务算法,上层集成基座大语言模型和智能体设计平台。通过它,制药专家既能实现药物设计项目全流程自动化,也能让智能体辅助人类专家决策,有效缩短研发周期。

01.

新一代开源生物医药多模态大模型

BioMedGPT是清华大学智能产业研究院(AIR)携手水木分子开源的全球首个可商用多模态生物医药百亿参数大模型,该模型在生物医药专业领域问答能力比肩人类专家水平,发布时在自然语言、分子、蛋白质跨模态问答任务上达到SOTA。BioMedGPT 能够同时处理多种生物医学任务,具有广泛的适用性、更多的可能性。

在BioMedGPT的基础上,双方再次携手推出了BioMedGPT-R1 (图1),用DeepSeek R1蒸馏版本模型更新了BioMedGPT中现采用的文本基座模型,从而引入了更优的文本推理能力。

通过跨模态特征对齐,BioMedGPT-R1实现了生物模态与自然语言文本模态在同一个特征空间的统一融合,探索了生物多模态场景下的模型深度推理能力。

通过训练对齐翻译层(Translator),BioMedGPT-R1将生物模态编码器(Molecule Encoder与Protein Encoder)输出映射到自然语言表征空间,从而在DeepSeek R1基础上增加了生物模态数据的理解能力。


图1:BioMedGPT-R1模型框架和主要训练步骤

BioMedGPT-R1的训练分为两个主要步骤(图1):

首先,仅训练对齐翻译层Translator,使其能将编码后的生物模态表征映射到语义表征空间;然后,同时微调对齐翻译层Translator和基座大语言模型,激发其在下游任务上的多模态深度推理能力。

以化学小分子 为例,在BioMedGPT-R1中, 经过化学分子编码器提取特征,生成中间表示 ,然后通过对齐翻译层进行映射,得到化学分子表征 ,进而与经过处理和编码的语言指令表征 共同输入至基座语言模型,使语言模型能够结合两个模态信息进行综合推理,生成最终的文本回复。

基于上述模型架构与训练策略,BioMedGPT-R1支持跨模态自然语言和生物语言的交互式问答推理,可应用到药物分子深度理解分析、药物靶点探索与挖掘等领域。

例如,当需要了解某个化学分子时,BioMedGPT-R1可以从分子结构、官能团组成、生化性质和可能的应用等方面逐步推理分析,最终形成文本回复(图2)。生物医药从业人员日常工作既离不开文本,也离不开小分子、蛋白质等生物模态信息,BioMedGPT-R1将“强推理慢思考”从单文本模态,进一步推广至生物多模态场景,赋能生物医药行业。


图2:跨模态对齐后,模型实现多模态问答场景下的理解分析

清华大学AIR和水木分子研究团队以BioMedGPT-R1为基础进行系统性研究与综合评估,目前已经观察到其在化学分子理解任务上的性能提升,如在CheBI-20化学分子描述任务上相比上一版本效果提升超15%(表1),后续也将依托OpenBioMed平台开源BioMedGPT-R1模型和生物医药研发Agent系统框架


表1:在CheBI-20化学分子描述任务上产生明显性能提升

BioMedGPT-R1在生物医药相关文本问答任务上也展现出了较优的效果,如在USMLE美国医师资格考试上达到了67.1%正确率,效果逼近闭源商用大模型和人类专家水平(图3),并在专家级医疗推理与理解评测集MedXpertQA上达到和闭源商用大模型相当的效果(图4),团队正在探索生物医药场景下的多个深度推理能力应用,期待让“强推理慢思考”赋能医药研发。


图3:在USMLE美国医师资格考试评测集上效果逼近闭源商用大模型和人类专家水平


图4:在MedXpertQA专家级医学推理与理解评测集上效果与闭源商用大模型相当

02.

生命科学与药物研发智能体开源平台

清华大学 AIR 和水木分子研究团队长期持续维护 OpenBioMed 智能体开源平台,该开源平台助力应对生物医药研究工具分散和数据孤岛导致的多任务协作困难的挑战。

OpenBioMed将清华大学AIR、水木分子以及业界众多生物医药相关工具和算法等以API形式进行了“封装”,其中包括:

  • BioMedGPT、BioMedGPT-R1、OCSU 等跨模态理解模型和算法;

  • MV-Mol、ESM-2 & ESMFold、PharmolixFM-Dock等分子性质与结构预测算法;

  • MSAaaS & FoldSeek、MV-Mol 、DrugCLIP等分子检索算法;

  • MoleculeSTM、ActMolEdit、MutaPLM 等分子编辑工具;

  • BioTS+、MolCRAFT、RFDiffusion-AA 等分子设计工具等等。



OpenBioMed 以可视化编辑模式,让科研人员用拖拉拽的方式就能够轻松调用前沿 AI 算法与工具,完成智能体的设计开发。

同时,OpenBioMed 也提供了一个小分子生成设计和优化的智能体模板,科研人员可以直接输入一个靶点,智能体自动完成小分子生成设计工作,最终提交基于靶点的分子设计分析报告。

智能体以 AutoPilot 形式异步工作,无需科研人员在电脑前等待,AutoPilot智能体自主完成所有药物分析设计工作。OpenBioMed 大幅降低了复杂生物医药算法和工具间的多任务协作难度,将重构未来科研的基础设施。

水木分子致力于推动生命科学和生物医药大模型与智能体的科学研究和商业实践,除了BioMedGPT-R1和 OpenBioMed外, 其重大战略产品发布与更新升级还包括生物医药行业知识图谱和水木分子智能体知识图谱平台、PharMolix-FM 全原子基础大模型以及 ChatDD 药物研发智能体系列—ChatDD-Insight、ChatDD-Discovery 和 ChatDD-Trial,引领了全球 AI 大模型与生命科学的研究与实践。

编辑:成蕴年

----- END -----

wisemodel相关:

系统升级:

系列模型:

关于wisemodel更多

1

欢迎持续关注和支持

开源社区建设需要长期坚持和投入,更需要广大用户的积极参与、贡献和维护,欢迎大家加入wisemodel开源社区的志愿者计划和开源共创计划。期待更多开发者将开源成果,包括模型、数据集和代码等发布到 wisemodel.cn 社区,共建中立、开放的AI开源社区生态。欢迎扫码添加wisemodel微信,申请加入wisemodel社群,持续关注wisemodel.cn开源社区动态。

2

欢迎加盟wisemodel开源社区

始智AI wisemodel社区自2023年9月上线以来,逐渐成为影响力日益扩大的中立开放的AI开源社区,为了加快公司发展,我们长期需要技术、运营等人才加盟,技术侧重在AI infra、后端开发,熟悉K8S、模型训练和推理等技术, 以及熟悉开发者生态运营的成员,欢迎感兴趣的朋友加盟,可以通过添加wisemodel微信,或者将简历投递到邮箱:liudaoquan@wisemodel.cn

3

欢迎投稿优质内容

欢迎投稿分享人工智能领域相关的优秀研究成果,鼓励高校实验室、大企业研究团队、个人等,在wisemodel平台上分享各类优质内容,可以是AI领域最新论文解读、最新开源成果介绍,也可以是关于AI技术实践、应用和总结等。投稿可以发邮件到liudaoquan@wisemodel.cn,也可以扫码添加wisemodel微信。

4

关于wisemodel开源社区

始智AI wisemodel.cn开源社区由清华校友总会AI大数据专委会副秘书长刘道全创立,旨在打造和建设中立开放的AI开源创新社区,将打造成“HuggingFace”之外最活跃的AI开源社区,汇聚主要AI开源模型、数据集和代码等,欢迎高校科研院所、大型互联网公司、创新创业企业、广大个人开发者,以及政府部门、学会协会、联盟、基金会等,还有投资机构、科技媒体等,共同参与建设AI开源创新生态。

向上滑动查看

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

/阅读下一篇/

文生图开源新王!CogView4中英双语+任意分辨率,碾压传统50%冗余

返回网易首页 下载网易新闻客户端
相关推荐
热点推荐
马筱梅回应两个孩子没参加妈妈大S的葬礼,原因是S家没有通知孩子

马筱梅回应两个孩子没参加妈妈大S的葬礼,原因是S家没有通知孩子

阿矗论古今
2025-03-18 21:58:09
河南一农药厂爆炸,伤亡惨重,事因曝光,涉事企业曝光:欠税28万

河南一农药厂爆炸,伤亡惨重,事因曝光,涉事企业曝光:欠税28万

温柔看世界
2025-03-20 17:49:26
王伟忠在大S下葬后道出天大秘密!大S藏了10年的“体面”被撕碎了

王伟忠在大S下葬后道出天大秘密!大S藏了10年的“体面”被撕碎了

小娱乐悠悠
2025-03-19 15:53:59
南京男子回家迫不及待抱住妻子,结果家中鹦鹉一开口,让他崩溃!

南京男子回家迫不及待抱住妻子,结果家中鹦鹉一开口,让他崩溃!

白云故事
2025-03-14 19:05:07
突破920元!金价屡创历史新高,多家银行宣布:上调!

突破920元!金价屡创历史新高,多家银行宣布:上调!

中新经纬
2025-03-20 16:50:09
苹果推送iOS18.4.4,续航提升太猛,5GA信号前所未有

苹果推送iOS18.4.4,续航提升太猛,5GA信号前所未有

库克啥都聊
2025-03-19 10:56:07
台军报告噩耗:台海出现一个危险迹象!台防务负责人吓得语无伦次

台军报告噩耗:台海出现一个危险迹象!台防务负责人吓得语无伦次

头条爆料007
2025-03-19 08:42:21
后续来了!港府表态,外交部回应,监管部门调查,李嘉诚命中注定

后续来了!港府表态,外交部回应,监管部门调查,李嘉诚命中注定

兰妮搞笑分享
2025-03-19 10:53:08
包括5市!石家庄都市圈获批!

包括5市!石家庄都市圈获批!

鲁中晨报
2025-03-20 11:04:46
德国议会批准对宪法的修改,允许德国无限制地扩大军事安全开支

德国议会批准对宪法的修改,允许德国无限制地扩大军事安全开支

山河路口
2025-03-18 23:59:20
北京时间3月20日,广东男篮传来主教练杜峰、徐杰、胡明轩新消息

北京时间3月20日,广东男篮传来主教练杜峰、徐杰、胡明轩新消息

生活新鲜市
2025-03-20 10:27:26
上海市花被凯司令做成蛋糕了?上海市民:DNA动了,满满的童年味道!

上海市花被凯司令做成蛋糕了?上海市民:DNA动了,满满的童年味道!

上海静安
2025-03-20 11:55:54
ESPN预测明天胜率:湖人高达69.1% 雄鹿仅30.9%

ESPN预测明天胜率:湖人高达69.1% 雄鹿仅30.9%

直播吧
2025-03-20 14:57:11
原来工作留痕这么重要!关键时刻能保命,看完分享醍醐灌顶了

原来工作留痕这么重要!关键时刻能保命,看完分享醍醐灌顶了

有趣的火烈鸟
2025-02-21 13:31:06
陈都灵一觉醒来天塌了!31岁首演女主,结果被俩50老女人抢尽风头

陈都灵一觉醒来天塌了!31岁首演女主,结果被俩50老女人抢尽风头

趣文说娱
2025-03-20 17:07:26
水浒传惊天反转:新出土方腊墓志铭揭露宋江招安真相?

水浒传惊天反转:新出土方腊墓志铭揭露宋江招安真相?

谈史论天地
2025-03-19 14:24:33
突然不可用?DeepSeek最新公告

突然不可用?DeepSeek最新公告

第一财经资讯
2025-03-20 14:39:44
比鹤岗还狠!第一批日本“捡漏”买房的中国人:3万多买170m²独栋

比鹤岗还狠!第一批日本“捡漏”买房的中国人:3万多买170m²独栋

李砍柴
2025-03-20 00:18:42
全运会大冷门!国乒全国冠军2:3不敌省队选手,辽宁3:1战胜重庆

全运会大冷门!国乒全国冠军2:3不敌省队选手,辽宁3:1战胜重庆

国乒二三事
2025-03-20 13:45:55
大乱斗!积分榜:国足净胜球劣势垫底&4队6分,澳洲第2,巴林第5

大乱斗!积分榜:国足净胜球劣势垫底&4队6分,澳洲第2,巴林第5

直播吧
2024-11-20 04:26:26
2025-03-20 20:08:49
wisemodel开源社区 incentive-icons
wisemodel开源社区
始智AI wisemodel.cn开源社区,打造中国版“huggingface”
212文章数 12关注度
往期回顾 全部

科技要闻

华为发业界首款阔折叠华为Pura X,7499元起

头条要闻

看上乌克兰矿产后 特朗普又要求接管扎波罗热核电站

体育要闻

赛季快结束了,想起来自己是合同年了?

娱乐要闻

主流媒体为大S发声,生前最后一条动态被提起

财经要闻

快递诈骗 韵达出事

汽车要闻

搭华为ADS 3.3 问界新M5 Ultra售22.98万起

态度原创

教育
数码
本地
游戏
亲子

教育要闻

春分纸鸢舞,看北京中小学如何解锁“风筝”新玩法——

数码要闻

超频三北境GT360散热器评测:八年质保还有3.5寸磁吸小电视 军备竞赛再升级

本地新闻

用AI唤醒花花世界|锡城春光正当时,一半花开一半诗

《浴血黑帮》和《坦克世界》联动,谢尔比们鸟枪换坦克了

亲子要闻

宝宝高烧抽搐怎么办?这四点千万不要做!