始智AI wisemodel.cn开源社区
始智AI wisemodel.cn社区是源自中国的中立开放的AI开源社区。正在,欢迎加入共同成长。wisemodel社区上线,H800/H20等资源上线,价格实惠,灵活方便,支持在线微调训练模型,及和,并。
2025年初,DeepSeek引发全球AI大模型新一轮热议。受其影响,从大模型供应商到基础设施和平台供应商,整个AI产业生态掀起新发展浪潮。DeepSeek R1推理能力强,为各行业智能化升级带来新机遇,生物医药领域也迎来“DeepSeek时刻”。
这一背景下,水木分子与清华大学 AIR 携手开源了 BioMedGPT-R1多模态生物医药推理大模型和 OpenBioMed 生命科学与药物研发智能体平台。目前已上线始智AI-wisemodel开源社区,欢迎感兴趣的朋友进行体验,以及给项目star。
模型地址
https://www.wisemodel.cn/models/PharMolix/BioMedGPT-R1/file
https://wisemodel.cn/organization/PharMolix
自发布以来,BioMedGPT和OpenBioMed受到了开源社区和产研界的广泛欢迎和好评。
BioMedGPT-R1基于DeepSeek R1,更新了文本基座模型,通过跨模态特征对齐,实现生物与文本模态融合 ,支持跨模态交互式问答推理,能对药物分子深度分析。
OpenBioMed架构底层是科研数据和知识图谱,中层是垂直大模型与核心任务算法,上层集成基座大语言模型和智能体设计平台。通过它,制药专家既能实现药物设计项目全流程自动化,也能让智能体辅助人类专家决策,有效缩短研发周期。
01.
新一代开源生物医药多模态大模型
BioMedGPT是清华大学智能产业研究院(AIR)携手水木分子开源的全球首个可商用多模态生物医药百亿参数大模型,该模型在生物医药专业领域问答能力比肩人类专家水平,发布时在自然语言、分子、蛋白质跨模态问答任务上达到SOTA。BioMedGPT 能够同时处理多种生物医学任务,具有广泛的适用性、更多的可能性。
在BioMedGPT的基础上,双方再次携手推出了BioMedGPT-R1 (图1),用DeepSeek R1蒸馏版本模型更新了BioMedGPT中现采用的文本基座模型,从而引入了更优的文本推理能力。
通过跨模态特征对齐,BioMedGPT-R1实现了生物模态与自然语言文本模态在同一个特征空间的统一融合,探索了生物多模态场景下的模型深度推理能力。
通过训练对齐翻译层(Translator),BioMedGPT-R1将生物模态编码器(Molecule Encoder与Protein Encoder)输出映射到自然语言表征空间,从而在DeepSeek R1基础上增加了生物模态数据的理解能力。
图1:BioMedGPT-R1模型框架和主要训练步骤
BioMedGPT-R1的训练分为两个主要步骤(图1):
首先,仅训练对齐翻译层Translator,使其能将编码后的生物模态表征映射到语义表征空间;然后,同时微调对齐翻译层Translator和基座大语言模型,激发其在下游任务上的多模态深度推理能力。
以化学小分子 为例,在BioMedGPT-R1中, 经过化学分子编码器提取特征,生成中间表示 ,然后通过对齐翻译层进行映射,得到化学分子表征 ,进而与经过处理和编码的语言指令表征 共同输入至基座语言模型,使语言模型能够结合两个模态信息进行综合推理,生成最终的文本回复。
基于上述模型架构与训练策略,BioMedGPT-R1支持跨模态自然语言和生物语言的交互式问答推理,可应用到药物分子深度理解分析、药物靶点探索与挖掘等领域。
例如,当需要了解某个化学分子时,BioMedGPT-R1可以从分子结构、官能团组成、生化性质和可能的应用等方面逐步推理分析,最终形成文本回复(图2)。生物医药从业人员日常工作既离不开文本,也离不开小分子、蛋白质等生物模态信息,BioMedGPT-R1将“强推理慢思考”从单文本模态,进一步推广至生物多模态场景,赋能生物医药行业。
图2:跨模态对齐后,模型实现多模态问答场景下的理解分析
清华大学AIR和水木分子研究团队以BioMedGPT-R1为基础进行系统性研究与综合评估,目前已经观察到其在化学分子理解任务上的性能提升,如在CheBI-20化学分子描述任务上相比上一版本效果提升超15%(表1),后续也将依托OpenBioMed平台开源BioMedGPT-R1模型和生物医药研发Agent系统框架。
表1:在CheBI-20化学分子描述任务上产生明显性能提升
BioMedGPT-R1在生物医药相关文本问答任务上也展现出了较优的效果,如在USMLE美国医师资格考试上达到了67.1%正确率,效果逼近闭源商用大模型和人类专家水平(图3),并在专家级医疗推理与理解评测集MedXpertQA上达到和闭源商用大模型相当的效果(图4),团队正在探索生物医药场景下的多个深度推理能力应用,期待让“强推理慢思考”赋能医药研发。
图3:在USMLE美国医师资格考试评测集上效果逼近闭源商用大模型和人类专家水平
图4:在MedXpertQA专家级医学推理与理解评测集上效果与闭源商用大模型相当
02.
生命科学与药物研发智能体开源平台
清华大学 AIR 和水木分子研究团队长期持续维护 OpenBioMed 智能体开源平台,该开源平台助力应对生物医药研究工具分散和数据孤岛导致的多任务协作困难的挑战。
OpenBioMed将清华大学AIR、水木分子以及业界众多生物医药相关工具和算法等以API形式进行了“封装”,其中包括:
BioMedGPT、BioMedGPT-R1、OCSU 等跨模态理解模型和算法;
MV-Mol、ESM-2 & ESMFold、PharmolixFM-Dock等分子性质与结构预测算法;
MSAaaS & FoldSeek、MV-Mol 、DrugCLIP等分子检索算法;
MoleculeSTM、ActMolEdit、MutaPLM 等分子编辑工具;
BioTS+、MolCRAFT、RFDiffusion-AA 等分子设计工具等等。
OpenBioMed 以可视化编辑模式,让科研人员用拖拉拽的方式就能够轻松调用前沿 AI 算法与工具,完成智能体的设计开发。
同时,OpenBioMed 也提供了一个小分子生成设计和优化的智能体模板,科研人员可以直接输入一个靶点,智能体自动完成小分子生成设计工作,最终提交基于靶点的分子设计分析报告。
智能体以 AutoPilot 形式异步工作,无需科研人员在电脑前等待,AutoPilot智能体自主完成所有药物分析设计工作。OpenBioMed 大幅降低了复杂生物医药算法和工具间的多任务协作难度,将重构未来科研的基础设施。
水木分子致力于推动生命科学和生物医药大模型与智能体的科学研究和商业实践,除了BioMedGPT-R1和 OpenBioMed外, 其重大战略产品发布与更新升级还包括生物医药行业知识图谱和水木分子智能体知识图谱平台、PharMolix-FM 全原子基础大模型以及 ChatDD 药物研发智能体系列—ChatDD-Insight、ChatDD-Discovery 和 ChatDD-Trial,引领了全球 AI 大模型与生命科学的研究与实践。
编辑:成蕴年
----- END -----
wisemodel相关:
系统升级:
系列模型:
关于wisemodel更多
1
欢迎持续关注和支持
开源社区建设需要长期坚持和投入,更需要广大用户的积极参与、贡献和维护,欢迎大家加入wisemodel开源社区的志愿者计划和开源共创计划。期待更多开发者将开源成果,包括模型、数据集和代码等发布到 wisemodel.cn 社区,共建中立、开放的AI开源社区生态。欢迎扫码添加wisemodel微信,申请加入wisemodel社群,持续关注wisemodel.cn开源社区动态。
2
欢迎加盟wisemodel开源社区
始智AI wisemodel社区自2023年9月上线以来,逐渐成为影响力日益扩大的中立开放的AI开源社区,为了加快公司发展,我们长期需要技术、运营等人才加盟,技术侧重在AI infra、后端开发,熟悉K8S、模型训练和推理等技术, 以及熟悉开发者生态运营的成员,欢迎感兴趣的朋友加盟,可以通过添加wisemodel微信,或者将简历投递到邮箱:liudaoquan@wisemodel.cn
3
欢迎投稿优质内容
欢迎投稿分享人工智能领域相关的优秀研究成果,鼓励高校实验室、大企业研究团队、个人等,在wisemodel平台上分享各类优质内容,可以是AI领域最新论文解读、最新开源成果介绍,也可以是关于AI技术实践、应用和总结等。投稿可以发邮件到liudaoquan@wisemodel.cn,也可以扫码添加wisemodel微信。
4
关于wisemodel开源社区
始智AI wisemodel.cn开源社区由清华校友总会AI大数据专委会副秘书长刘道全创立,旨在打造和建设中立开放的AI开源创新社区,将打造成“HuggingFace”之外最活跃的AI开源社区,汇聚主要AI开源模型、数据集和代码等,欢迎高校科研院所、大型互联网公司、创新创业企业、广大个人开发者,以及政府部门、学会协会、联盟、基金会等,还有投资机构、科技媒体等,共同参与建设AI开源创新生态。
向上滑动查看
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.