始智AI wisemodel.cn开源社区
始智AI wisemodel.cn社区是源自中国的中立开放的AI开源社区。正在,欢迎加入共同成长。wisemodel社区上线,最新上线4090资源不限量,价格实惠,灵活方便,支持在线微调训练模型,及和,并。
▍ 致开发者的一封信
亲爱的开发者:
感谢您对wisemodel开源平台的支持!即日起,我们将通过月度简报为您速递:本月热门模型/数据集/代码、平台新功能亮点、开发者活动预告,助您高效捕捉开源灵感。
诚挚欢迎您常来wisemodel平台探索!期待您在社区分享见解、共建生态,若您对平台功能、未来发展有独到见解,或是优化建议,别犹豫,随时向我们反馈,您的反馈将助力我们做得更好!要是您有H100、H20、4090等算力需求,也欢迎在平台上使用或者联系小助手获取相关信息。有任何合作意向,同样可先找小助手对接,期待与您携手共进!
—— 用开源协作创造无限可能
始智AI wisemodel团队
▍ wisemodel社区2月月报
2025年2月,始智AI wisemodel开源平台进展显著,持续为AI开源生态注入创新活力。欢迎大家在wisemodel上发布模型、数据集和代码,也欢迎到平台上给感兴趣的项目star!
模型:清华大学、水木分子、智源研究院、复旦大学、上海交通大学、上海AI LAB、百川智能、联通等相关团队在wisemodel平台上新发布了BioMedGPT系列、DeepSeek-R1-FlagOS系列、Hallo3、LIMO、InternVL系列、Unichat-DeepSeek、Baichuan-M1、VideoChat等系列模型。
数据集:小红书和上海交通大学团队开源的多模态视频理解的Beachmark数据集WorldSense、南洋理工大学团队开源的评估 LMMs 从视频中获取知识能力的基准测试数据集VideoMMU、清华大学和水木分子团队开源的蛋白结构方面的数据集MutaDescribe等。
代码:南洋理工大学团队发布了MotionDiffuse、FinMoGen等动作生成系列代码仓库,清华大学团队开源了全新注意力机制T6的代码仓库,厦门大学和北大深圳团队开源的TOPICTrack可以实现对多目标跟踪误差骤降,厦门大学等团队开源的Video-RAG在长视频理解领域取得突破。
平台升级:wisemodel平台新上线了镜像保存的功能,运行中的开发环境可以一键保存成镜像,更方便模型和应用的开发,同时平台上也上线了镜像广场,官方镜像一键在线使用,用户保存的镜像也可以转为公开镜像。
最新活动:始智AI wisemodel开源平台承办了工业和信息化部工业文化发展中心的“人工智能未来设计大赛·大模型专项竞技赛”,大赛设置了基础技术与平台、2C产品和2B解决方案、大模型生态与支持、具身智能四大赛道方向,欢迎前往大赛官网wisemodel.cn/LMSC了解详情和报名。
▍ 精选社区内容
最新模型
BioMedGPT系列
BioMedGPT系列是清华大学人工智能产业研究院与水木分子联合打造的生物医药多模态大模型。初代是全球首个可商用多模态生物医药百亿参数大模型,专业问答能力出色。升级后的BioMedGPT-R1引入更优文本推理能力,提升跨模态推理水平,在多项任务上表现优异,推动“AI+医药”发展。
模型链接:
https://wisemodel.cn/models/PharMolix/BioMedGPT-LM-7B
https://wisemodel.cn/models/PharMolix/BioMedGPT-10B/intro
DeepSeek-R1-FlagOS系列
DeepSeek-R1-FlagOS系列是智源研究院联合多芯片厂商基于FlagOS开发的多芯片版本。它用同一套代码实现多芯片推理,保证效果对齐,开源开放且高效易用。支持多种芯片,能一键部署,性能与英伟达H100版匹配,推动大模型跨芯片应用。
模型链接:
https://wisemodel.cn/organization/FlagRelease
hallo3
Hallo3是由复旦等开源的肖像动画生成框架。它基于扩散Transformer网络,能解决现有方法在处理非正面视角、动态对象及逼真背景方面的难题。通过引入身份参考网络等技术,结合语音音频调节,可生成高度动态、逼真的人像动画,在多项指标上表现出色。
模型链接:
https://wisemodel.cn/models/FusionLab/hallo3
LIMO
LIMO是上海交通大学研究团队提出的创新策略及模型,即“Less Is More for Reasoning”。它打破常规,仅用817条精心设计的样本,通过简单监督微调,就能让模型在数学竞赛级题目上超越众多先进模型 ,揭示了精准引导激活模型潜力比海量数据训练更关键。
模型链接:
https://wisemodel.cn/models/BLeaves/LIMO
InternVL系列
InternVL系列是上海AI实验室OpenGVLab团队推出的开源多模态大语言模型系列。该系列模型遵循“ViT - MLP - LLM”范式,采用动态高分辨率训练、渐进式扩展策略等技术提升性能。其包括从1B到78B不同规模的模型,适应不同场景和硬件需求。InternVL2.5是该系列的最新版本,在多模态长链推理等方面表现优异。
模型链接:
https://www.wisemodel.cn/organization/Intern
Unichat-DeepSeek-R1-distill-32B
中国联通开源元景“自适应慢思考”思维链大模型后,又针对DeepSeek系列模型进行了“自适应慢思考”优化升级。在面向难度较高问题时使用慢思考模式生成长思维链,面向简单问题时则倾向于生成简洁的思维链,迅速准确的输出相关答案。
模型链接:
https://wisemodel.cn/models/UnicomAI/Unichat-DeepSeek-R1-distill-32B/intro
Baichuan-M1-14B
该百川智能模型融合Transformer架构、迁移学习、联邦学习等前沿技术,从算法与结构层面进行深度优化。在医疗数据处理上,能够快速整合分析多元异构数据;疾病诊断预测时,借助海量病例学习,精准度大幅提升;医疗影像分析中,对微小病变特征识别敏锐,为医疗决策提供有力支持。
模型链接:
https://wisemodel.cn/models/Baichuan-inc/Baichuan-M1-14B-Base
https://wisemodel.cn/models/Baichuan-inc/Baichuan-M1-14B-Instruct
VideoChat-Flash
VideoChat-Flash是一款多模态长序列处理的上下文建模系统。它采用层次化视频特征压缩技术,支持超长视频输入,通过多阶段学习提升理解能力,在基准测试中性能领先。其可应用于短时运动捕捉和长时监控异常检测场景,且能单卡部署。
模型链接:
https://wisemodel.cn/models/InternVideo/VideoChat-Flash-Qwen2-7B_res448
最新数据集WorldSense
WorldSense是小红书和上海交通大学联合提出的全新基准测试,用于评估多模态大模型真实场景理解能力。它具备全模态协同、视频与任务多样、标注质量高的特点。基于该基准测试发现,现有多模态大模型表现不佳,这凸显了全模态协同的重要性,也为提升模型性能指明方向。
数据集链接:
https://wisemodel.cn/datasets/JackHong/WorldSense/intro
VideoMMU
VideoMMMU是首个评估LMMs从视频获取知识能力的基准测试。它涵盖六大学科,含300个专家级视频与900个人工标注问题,按感知等三阶段设计问答对,还提出知识增益度量指标。实验显示LMMs性能随任务复杂度增加下降,与人类有差距,为提升其能力指明方向。
数据集链接:
https://wisemodel.cn/datasets/VideoMMMU/VideoMMMU
MutaDescribe
MutaDescribe是清华大学和水木分子团队开发的首个大规模蛋白质突变数据集。其从UniprotKB/SwissProt数据库收集单点突变,经质量控制、数据增强和平衡等处理,包含丰富文本注释,为蛋白质突变研究提供了重要数据支持。
数据集链接:
https://www.wisemodel.cn/datasets/PharMolix/MutaDescribe
最新代码MotionDiffuse
MotionDiffuse由南洋理工大学等研究者提出,是最早的基于扩散模型的文本驱动动作生成框架之一,旨在解决文本驱动的人体动作生成问题,通过一系列去噪步骤生成动作,能模拟复杂数据分布,生成生动的动作序列。
代码链接:
https://www.wisemodel.cn/codes/Mingyuan/MotionDiffuse
FinMoGen
FineMoGen是一种动作生成与编辑框架,由南洋理工大学提出。它采用时空混合注意力架构,能合成细粒度动作,构建了Human - Mogen数据集,在动作生成质量上表现出色,还具备零样本动作编辑能力。
代码链接:
https://www.wisemodel.cn/codes/Mingyuan/FineMoGen
T6
T6是基于张量积注意力(TPA)机制构建的先进Transformer模型,由姚期智院士团队打造。TPA通过动态张量分解,大幅降低内存占用,还能与RoPE位置编码无缝集成。实验显示,T6在训练困惑度和基准测试表现出色。
代码链接:
https://wisemodel.cn/codes/yifanzhang/T6/intro
TOPICTrack
TOPICTrack是一种全新的多目标跟踪算法,采用并行关联范式,运用TOPIC方法融合运动和外观特征,结合AARM模块增强外观特征表示。实验显示,该算法在多个数据集上性能领先,能有效降低跟踪误差。
代码链接:
https://wisemodel.cn/codes/holmescao/TOPICTrack
Video-RAG
VideoRAG是厦门大学和罗切斯特大学联合推出的长视频理解创新方案。它借助开源工具,将视觉对齐的文本信息作为辅助输入,经检索后与视频帧、问题整合到现有视觉语言模型中。该方案即插即用、资源友好且性能优异,在多基准测试中表现出色,已上线开源社区。
代码链接:
https://wisemodel.cn/codes/Video-RAG/Video-RAG
平台升级镜像广场上线
镜像广场提供了多种AI模型的一键部署选项,用户还能通过镜像体验模型在线服务、获取API,部分镜像还配备了开发环境等。用户点击对应镜像,即可部署在线体验或者API服务。
体验链接:
https://wisemodel.cn/images
运行中的开发环境详情页面有“保存镜像”选项卡,直接按相应的流程保存镜像,后台会自动进行镜像保存的操作,保存成功后刷新可以看到制作状态和占用空间的变化。
最新活动人工智能未来设计大赛·大模型专项竞技赛
由工业和信息化部工业文化发展中心主办,清华大学金融科技研究院学术支持,始智AI wisemodel开源平台承办,聚焦大模型基础技术与平台、2C产品与2B解决方案、生态服务与支撑、具身智能四大核心赛道,汇聚清华专家、大模型公司及十余家头部投资机构,链接产学研资源,加速项目落地与商业化。
报名链接:
https://wisemodel.cn/LMSC
开源社区建设需长期坚持与投入,也依赖广大开发者参与、贡献和维护。期待更多开发者把模型、数据集、代码等开源成果发布到wisemodel.cn社区,一起共建中立、开放的AI开源社区生态。
—— 欢迎联系我们 ——
----- END -----
wisemodel相关:
系统升级:
大赛报名:
系列模型:
关于wisemodel更多
1
欢迎持续关注和支持
开源社区建设需要长期坚持和投入,更需要广大用户的积极参与、贡献和维护,欢迎大家加入wisemodel开源社区的志愿者计划和开源共创计划。期待更多开发者将开源成果,包括模型、数据集和代码等发布到 wisemodel.cn 社区,共建中立、开放的AI开源社区生态。欢迎扫码添加wisemodel微信,申请加入wisemodel社群,持续关注wisemodel.cn开源社区动态。
2
欢迎加盟wisemodel开源社区
始智AI wisemodel社区自2023年9月上线以来,逐渐成为影响力日益扩大的中立开放的AI开源社区,为了加快公司发展,我们长期需要技术、运营等人才加盟,技术侧重在AI infra、后端开发,熟悉K8S、模型训练和推理等技术, 以及熟悉开发者生态运营的成员,欢迎感兴趣的朋友加盟,可以通过添加wisemodel微信,或者将简历投递到邮箱:liudaoquan@wisemodel.cn
3
欢迎投稿优质内容
欢迎投稿分享人工智能领域相关的优秀研究成果,鼓励高校实验室、大企业研究团队、个人等,在wisemodel平台上分享各类优质内容,可以是AI领域最新论文解读、最新开源成果介绍,也可以是关于AI技术实践、应用和总结等。投稿可以发邮件到liudaoquan@wisemodel.cn,也可以扫码添加wisemodel微信。
4
关于wisemodel开源社区
始智AI wisemodel.cn开源社区由清华校友总会AI大数据专委会副秘书长刘道全创立,旨在打造和建设中立开放的AI开源创新社区,将打造成“HuggingFace”之外最活跃的AI开源社区,汇聚主要AI开源模型、数据集和代码等,欢迎高校科研院所、大型互联网公司、创新创业企业、广大个人开发者,以及政府部门、学会协会、联盟、基金会等,还有投资机构、科技媒体等,共同参与建设AI开源创新生态。
向上滑动查看
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.