网易首页 > 网易号 > 正文 申请入驻

HiDream:最强文生图开源模型,来自合肥

0
分享至

刚出道的 HiDream-I1,拿下了 Hugging Face 趋势榜第二(图像榜第一),Artificial Analysis 文生图第二,排在Midjourney、Google Imagen、FLUX、SDXL 之前,仅次于 GPT-4o 。

老实讲,看多了龙争虎斗,本应对此免疫。

但被提醒道:这是个创业团队搞的,来自合肥

打了个猛子...牛逼牛逼,真尼玛牛逼


Hugging Face 模型趋势榜 Artificial Analysis 图像竞技场

不得不仔细看了几眼:

  • • 它是MIT 协议, 开源的可商用

  • • 它是 中国团队做的 ,也没拿自己和谁对标

  • • 它是 可部署的 ,权重、脚本、demo、量化全部已放出

  • 这不是大厂项目,这不是!这不是!

真的,这东西,是我们“默认国内早就该有”,但直到现在才出来的东西。

甚是好奇,随即我联系上了背后团队,问了大量私货,有了这篇文章。

真实可用,不是PPT

HiDream-I1 分三个版本:Full / Dev / Fast,分别对应不同的推理场景。

这里有几个官方 Case,来自


画面细节 色彩与光效 崩坏控制 物理法则
我去跑了几个任务: 可爱的举重猫猫 富有张力的镜头特写 带上文字也可以

生成质量稳定,理解力准确,出图速度在 Full 版下约 30 秒/张,Dev 版下 10 秒/张,Fast 则为 5 秒/张,可以直接挂进内容生产链路中使用。

这些速度不是靠粗暴剪枝换来的:Dev 和 Fast 模型是在原版基础上,通过 GAN 辅助的扩散蒸馏方式做出的结构级压缩:保留了大模型的细节能力,同时显著降低了推理成本。Fast 版本则进一步压缩采样步数,有了更快的速度

直接能用

HiDream-I1 优化了整套部署支撑,所以无论是做项目原型,还是打包进服务,这套模型的部署链路都非常顺畅:

  • 15GB 显存起步 就能跑 Dev 版本,推理速度约 10 秒一张图

  • Hugging Face 上权重齐全 ,配套的推理脚本和配置文件全部开源

  • Diffusers 接口支持完整 ,可以一键加载到现有 pipeline 里使用

  • 可接入 ComfyUI / Gradio ,可直接嵌入原本工作流

  • 支持 4bit 量化与 LoRA 微调 ,适合本地部署和行业定制任务

官方在 hf 上的介绍

可以在 Hugging Face 上先玩(也有对应的 Space)

https://huggingface.co/HiDream-ai/HiDream-I1-Full

他们也有更加产品化的网站(面向海外的)

https://vivago.ai/studio


产品是面向海外的 一些数据

在几项主流评测里,会发现它的表现也都在第一梯队:

  • DPG-Bench :评估模型对复杂提示的理解与还原能力,得分 85.89 ,总分第一

  • GenEval :评估 模型对提示中对象的理解与执行能力,得分 0.83 ,开源模型中最高

  • HPS v2.1 :评估图像的主观美感和语义一致性,HiDream-I1 得分 33.82 ,高于 Midjourney V5、SDXL、DALL·E 3

DPG-Bench:评估模型对复杂提示的理解与还原能力 GenEval:评估模型对提示中对象的理解与执行能力 HPS v2.1 :评估图像的主观美感和语义一致性

这些 benchmark 来自公开信息,可以复现试试。

它们的结果,其实只说明一件事: HiDream-I1 在理解文本、还原细节、维持画面质量这三件事上,是稳的。

One More Thing

I1 之后,这几天他们还会开源 E1。


https://github.com/HiDream-ai/HiDream-E1/

I for Image,E for Editor:从图像生成,到图像编辑

用对话的方式改图,像 GPT-4o 那种,敬请期待。

来自合肥,低调做事

第一次注意到 HiDream 这个团队,还是去年初雪;

再次看到,已是春暖花开。

当时只道是寻常,没第一时间去深聊。

而在过去两周里,HiDream-I1 在开源生态中一路高歌猛进,排名跃升,着实令人咋舌:参数不大,速度稳定,出图质量靠得住,还能跑到顶级开源模型前列。这在如今的开源图像模型里,已经很罕见了。

好奇之下,我联系到他们,和团队聊了半个下午,拼出这个项目的全貌。

HiDream.ai 成立于 2023 年 3 月,在合肥。就是那个背靠中科大,孵化了京东方、科大讯发的合肥

创始人梅涛,亦是中科大背景:在中科大读了本、硕、博,微软亚洲研究院做了 12 年研究员,后来在京东探索研究院任副院长,还是 IEEE Fellow、加拿大工程院外籍院士。

这个项目的天使轮,来自群友:一个叫“中喝大”的中科大校友群。在这里 15 位校友自发组了 LLP,投下“种子一号基金”。在之后,是上面提到的「敦鸿资本领投的 Pre-A 轮融资后,又获得数亿元 A 轮融资,两轮融资总共规模达到数亿元人民币」。在行业之内,融的不算多。

梅涛自己说,他创业不是为了跟谁竞争,也不是为了赶热点,而是想证明——中国的科研人才可以在工业级产品线中做出自己的东西。哪怕晚几年,但路径能跑通、结构能复制。

目前, HiDream.ai 团队也就 50 人上下,但拥有目前行业中最丰富的多模态版权语料库,并且把训练 ROI 做到了业内平均的 1/5。模型路线走的是自研架构、全流程闭环,也是在中国少数真正“从基础模型一路做到应用层闭环”的图像/视频方向创业公司之一。


办公室实拍...没啥构图,主打真诚

在他们上周海外爆火了一波后,照理说你会看到铺天盖地的 PR 稿件,来讲什么“国产替代”或“国产超越”的故事。

但实际上,啥也没有。看到的就只是把权重挂上 Hugging Face,贴好推理脚本、样例代码、demo 页面,然后静静等社区试用。

我问他们,“为什么不讲点东西?”

团队的回答是:“说得响没用,能用才有价值。

语气平实,节奏克制。

能看出,他们不是不准备,而是不着急。

这两天,他们还会正式开源 HiDream-E1,E for Editor。


Git 上已经有了 Readme,开出来不远了

接下来,HiDream 还会陆续发布多模态 Agent 模型 HiDream-A1(A for Agent)、产品 vivaGO v2.0面向专业创作者的终端 App,以及视频生成的相关东西(预估是5月)。

没喊口号,按计划在推进。不在造势,而在做事。

结尾

很有意思,AI 的大火从北京烧到上海,进而点亮了「杭州六小龙」,也让我们看到了 Manus 在武汉崛起。

现在,合肥也交出了自己的答卷:HiDream

一个创业团队,从图像模型切入,在没人关注的节点,把一件“早就该有人做的事”做出来了。

春风拂面,桃花满枝。

我们越发看见、也越发确信:

中国的创业公司,不讲故事,也能把答案写在时代的卷首。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
72老太一辈子没结婚,病重住院后中年男子赶来:妈,我们来了

72老太一辈子没结婚,病重住院后中年男子赶来:妈,我们来了

雨仔讲故事
2025-05-17 18:53:05
入夏才发现:不兴短裤了!满街中年男人都在穿“宽松裤”,真帅气

入夏才发现:不兴短裤了!满街中年男人都在穿“宽松裤”,真帅气

时尚穿搭生活馆
2025-05-18 15:43:21
一张执行令,扯下52岁董卿消失遮羞布,十年央视主持生涯功亏一篑

一张执行令,扯下52岁董卿消失遮羞布,十年央视主持生涯功亏一篑

简读视觉
2025-04-24 15:10:03
华为鸿蒙PC震撼发布,对应的核心企业+一季度前10强+华为昇腾概念

华为鸿蒙PC震撼发布,对应的核心企业+一季度前10强+华为昇腾概念

叮当当科技
2025-05-19 07:56:07
再次明确!最高法:债权人向债务人拨打电话,即便接听电话的非债务人,也可认定为诉讼时效中断

再次明确!最高法:债权人向债务人拨打电话,即便接听电话的非债务人,也可认定为诉讼时效中断

微法官
2025-05-10 00:05:15
王楚钦屡遭针对原因!实力或已远超樊振东,球拍开裂真凶确定

王楚钦屡遭针对原因!实力或已远超樊振东,球拍开裂真凶确定

十点体坛
2025-05-20 11:13:29
又一专割中年男人的“智商税”饮料卖爆了,狂揽近亿,暴增834%!

又一专割中年男人的“智商税”饮料卖爆了,狂揽近亿,暴增834%!

泠泠说史
2025-04-23 15:40:19
不要摘!不要摘!不要摘!已经有人中招!医生:5-8片就能致命

不要摘!不要摘!不要摘!已经有人中招!医生:5-8片就能致命

牛锅巴小钒
2025-05-19 00:15:40
媒体报道称,特朗普对内塔尼亚胡失去耐心,对加沙的苦难表达关切

媒体报道称,特朗普对内塔尼亚胡失去耐心,对加沙的苦难表达关切

山河路口
2025-05-20 23:43:41
莫伦特斯:恩德里克被姆巴佩维尼修斯的光环掩盖了,应该出租锻炼

莫伦特斯:恩德里克被姆巴佩维尼修斯的光环掩盖了,应该出租锻炼

直播吧
2025-05-21 00:49:43
为什么小米自主研发设计的3nm芯片可以被代工,而华为却不行?

为什么小米自主研发设计的3nm芯片可以被代工,而华为却不行?

生活新鲜市
2025-05-21 01:50:19
陶强龙助攻,王钰栋破门打入个人赛季第9球!

陶强龙助攻,王钰栋破门打入个人赛季第9球!

直播吧
2025-05-20 15:55:13
中东惊变!以色列,即将大难临头!

中东惊变!以色列,即将大难临头!

大嘴说天下
2025-05-20 22:51:40
罗马诺:皇马希望有更多本土球员,该策略由老佛爷拍板

罗马诺:皇马希望有更多本土球员,该策略由老佛爷拍板

懂球帝
2025-05-21 02:25:09
丈夫不愿同房,我实在忍不了去找公公诉苦,他的一个动作让我愣了

丈夫不愿同房,我实在忍不了去找公公诉苦,他的一个动作让我愣了

红豆讲堂
2025-04-23 10:55:06
国家发改委:内卷式竞争扭曲了市场机制、扰乱了公平竞争秩序 必须加以整治

国家发改委:内卷式竞争扭曲了市场机制、扰乱了公平竞争秩序 必须加以整治

21世纪经济报道
2025-05-20 11:20:04
调整!4月10日中央五套直播乒乓球有变-CCTV5节目单

调整!4月10日中央五套直播乒乓球有变-CCTV5节目单

郭錉包工头
2025-04-10 00:26:29
局部暴雨!冷空气将抵达江苏!

局部暴雨!冷空气将抵达江苏!

江苏警方
2025-05-20 19:52:24
【特稿】连损三架“超级大黄蜂” “杜鲁门”号航母离开红海

【特稿】连损三架“超级大黄蜂” “杜鲁门”号航母离开红海

新华社
2025-05-20 14:37:05
伟大传承!巴萨新10号出炉 1.8亿巨星接班梅西 年薪800万欧元

伟大传承!巴萨新10号出炉 1.8亿巨星接班梅西 年薪800万欧元

夕落秋山
2025-05-20 09:44:18
2025-05-21 03:39:00
赛博禅心
赛博禅心
拜AI古佛,修赛博禅心
39文章数 4关注度
往期回顾 全部

科技要闻

苹果公布WWDC25邀请函:6月10日举行

头条要闻

球拍受损裁判却称没问题 王楚钦:为什么每次都是我

体育要闻

广厦总冠军!CBA历史第8支总冠军球队!

娱乐要闻

包文婧二胎生啦 晒出四人全家福

财经要闻

一年定期破1 跨城存款"特种兵"淡出江湖

汽车要闻

几千块提不走!最便宜的汽车奔腾小马真相在这里

态度原创

本地
家居
时尚
亲子
公开课

本地新闻

云游中国 |重庆人手一只熊猫?四世同堂等你打卡

家居要闻

明暗深浅 探寻层次轨迹

高圆圆、唐嫣在戛纳红毯美炸了!40岁的她们越活越惊艳

亲子要闻

睿哥的旅行碎片来啦~

公开课

李玫瑾:为什么性格比能力更重要?