网易首页 > 网易号 > 正文 申请入驻

阶跃星辰开源“AI版PS”-Step1X-Edit,媲美GPT-4o

0
分享至

作者|沐风

来源|AI先锋官

前两天,OpenAI刚刚开源了AI生图模型GPT-image-1,紧接着,阶跃星辰就上线并开源了与GPT-4o和Gemini2 Flash等闭源模型相当的的图像编辑模型Step1X-Edit。

你可以用它新增、删除图片中的目标,换句话说,它其实就是“开源AI版Adobe Photoshop”

并且,阶跃星辰将Step1X-Edit的论文、模型、代码、评测数据集一次性全部放出来来了。

现在登录阶跃AI官网(stepfun.com)或App即可使用。

在针对自然语言图像编辑任务,Step1X-Edit具备以下核心能力:

语义精准解析:支持自然语言描述的复杂组合指令,指令无需模板,能够灵活应对多轮、多任务编辑需求,同时支持对图像中文字进行识别、替换与重构;

身份一致性保持:编辑后能稳定保留人脸、姿态与身份特征;

高精度区域级控制:支持对指定区域进行文字、材质、色彩等定向编辑,保持图像风格统一。

据介绍,Step1X-Edit首次在开源体系中实现MLLM与DiT的深度融合。

MLLM 模块负责处理自然语言指令与图像内容,具备多模态语义理解能力,可将复杂编辑需求解析为latent控制信号;

Diffusion模块再根据MLLM生成的latent信号完成图像的重构或局部修改,确保图像细节保真与风格统一。

这一结构使得模型在编辑精度与图像保真度上实现大幅提升,换句话说就是“听得懂、改得准、保得住”。

为了训练模型,阶跃星辰构建了一个高质量的数据集,共生成2000万条图文指令三元组,最终保留样本超过100万条。

数据覆盖11类高频图像编辑任务类型,包括文字替换、风格迁移、材质变换、人物修图等需求。

另外,阶跃星辰还开发了一个植根于真实世界用户指令的新型基准测试GEdit-Bench。

基于该基准,在语义一致性、图像质量与综合得分三项指标上,评测了包括开源模型(Instruct-Pix2Pix、MagicBrush、AnyEdit、OmniGen)和闭源模型(GPT-4o、豆包、Gemini 2.0 Flash)。

针对闭源模型(如GPT-4o)因安全策略拒绝部分指令的情况,报告分为两类测试结果,分别为:

交集子集:所有模型均成功返回结果的样本

全集:基准中所有样本(仅统计模型成功生成的案例)。

测试结果表明,Step1X-Edit在11个评估维度上全面超越开源模型,比肩GPT-4o、豆包和Gemini 2.0 Flash。

同时,为全面测试多语言能力,每个样本均配对了中英文指令:

在中文指令测试集(GEdit-Bench-CN)中,Step1X-Edit表现稳定,部分指标超越Gemini 2.0 Flash和豆包。

官方也放出了Step1X-Edit与多个的模型(豆包、Gemini、GPT-4o)在相同输入下的图像编辑效果。

可以发现:Step1X-Edit的图像编辑效果更好,生成的图像更自然一些。

当然,小编还是更倾向与实际体验,所以这就让它来改几张图试试。

左为原图,右为Step1X-Edit修改图

提示词:给小姐姐脖子上增加一条适合她的项链

提示词:去除图片中人物脖子上的项链

提示词:将图片中的小熊形状的月饼更换为小兔子形状

提示词:将图片里的场景改为“草原”

提示词:将头发从自然披散改为马尾辫

提示词:将图片改为像素风格

提示词:将图片中的小男孩改为女孩,头发自然披散至肩部,吉卜力风格

整体看起来相当不错。

不过,小编建议,在修改图片时将你的需求尽量写详细,不然的话......如下。

提示词:将图片中的小男孩改为女孩

扫码邀请进群,我们带你一起来玩转ChatGPT、GPT-4、文心一言、通义千问、讯飞星火等AI大模型,顺便学一些AI搞钱技能。

往期文章回顾

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
河南女孩高考故意交白卷,怒写8000字抨击教育制度,后来怎样了?

河南女孩高考故意交白卷,怒写8000字抨击教育制度,后来怎样了?

莫地方
2026-06-04 01:55:05
毛远新透露,毛主席最后的遗嘱应该只有9个字

毛远新透露,毛主席最后的遗嘱应该只有9个字

历史伟人录
2024-09-27 13:44:11
太阴险!相亲女喝了咖啡后呕吐,怀疑男方下药而报警,结果是孕反

太阴险!相亲女喝了咖啡后呕吐,怀疑男方下药而报警,结果是孕反

谭谈社会
2026-06-02 10:41:44
运动员哪能这么白这么露?铁三女神冯竟爽再次夺冠,回击流言蜚语

运动员哪能这么白这么露?铁三女神冯竟爽再次夺冠,回击流言蜚语

杨华评论
2026-06-03 02:20:48
小米推出米家简约商务双肩包,149元

小米推出米家简约商务双肩包,149元

IT之家
2026-06-03 13:06:21
美媒:中国“无围壳”潜艇打破百年传统,代差式领先欧美

美媒:中国“无围壳”潜艇打破百年传统,代差式领先欧美

世家宝
2026-06-04 13:55:41
钱再多有什么用?45岁黄宗泽安排好后事,他的现状给娱乐圈提了醒

钱再多有什么用?45岁黄宗泽安排好后事,他的现状给娱乐圈提了醒

黔乡小姊妹
2026-06-04 14:09:30
被判无期的犯人,每天在监狱里如何生活?真实日常远比想象难熬

被判无期的犯人,每天在监狱里如何生活?真实日常远比想象难熬

芳姐侃社会
2026-05-31 20:40:00
唐斯没被文班打下去;布伦森折弯马刺

唐斯没被文班打下去;布伦森折弯马刺

张佳玮写字的地方
2026-06-04 12:31:12
释永信和深圳女商人

释永信和深圳女商人

哲空空
2026-06-04 11:43:55
18年来继父从不进我房间,妈妈去世后他给我一把钥匙,说:别恨我

18年来继父从不进我房间,妈妈去世后他给我一把钥匙,说:别恨我

林林故事揭秘
2025-06-21 14:19:08
70万海归挤破头回国,一句“我们不承认”打回原形,董明珠说对了

70万海归挤破头回国,一句“我们不承认”打回原形,董明珠说对了

大鱼简科
2026-06-04 14:55:45
高龄补贴不会自动到账!不少长辈白白丢了补助,抓紧自查

高龄补贴不会自动到账!不少长辈白白丢了补助,抓紧自查

林子说事
2026-06-04 13:50:43
魔都最惨薪水输送带:上海9号线,把打工人硬生生逼到站地铁

魔都最惨薪水输送带:上海9号线,把打工人硬生生逼到站地铁

王姐懒人家常菜
2026-06-04 11:43:32
二房全员缺席何猷君婚礼,三处细节揭开内情,大家错怪何超琼了

二房全员缺席何猷君婚礼,三处细节揭开内情,大家错怪何超琼了

林轻吟
2026-06-04 14:40:19
马科斯不择手段:废两票策反一人,十二票夺回参议院

马科斯不择手段:废两票策反一人,十二票夺回参议院

看尽人间百态
2026-06-04 12:33:06
编制外岗也要管!“当时不懂,就和朋友玩了”,女生政审被刷不服

编制外岗也要管!“当时不懂,就和朋友玩了”,女生政审被刷不服

蝴蝶花雨话教育
2026-06-03 00:05:13
后院起火,卢卡申科立场动摇,官方声明:白俄绝不会出兵帮普京

后院起火,卢卡申科立场动摇,官方声明:白俄绝不会出兵帮普京

面包夹知识
2026-06-01 20:22:17
撕破脸!刚曝张柏芝三胎爹,coco再揭谢贤黑料,徐静蕾太高明

撕破脸!刚曝张柏芝三胎爹,coco再揭谢贤黑料,徐静蕾太高明

照亮你的前行之路
2026-06-03 11:32:03
“哪怕坐牢,我也不后悔!”

“哪怕坐牢,我也不后悔!”

阿振观点
2026-06-02 12:19:48
2026-06-04 17:20:49
AI先锋官 incentive-icons
AI先锋官
AIGC大模型及应用精选与评测
533文章数 92关注度
往期回顾 全部

科技要闻

历史最大IPO!马斯克下周冲击万亿富豪

头条要闻

业主不满物业收每天4元停车费 争吵被骂"住不起就滚"

头条要闻

业主不满物业收每天4元停车费 争吵被骂"住不起就滚"

体育要闻

欧冠决赛躺赢?他也曾是大巴黎的英雄

娱乐要闻

难怪奚梦瑶能嫁入豪门

财经要闻

SpaceX发行价135美元 6月12日上市交易

汽车要闻

北京现代5月销量强势反弹:国内17065辆 出口环比翻倍

态度原创

旅游
时尚
亲子
房产
军事航空

旅游要闻

再添婚恋文旅新地标!昆山首个园林相亲角启用

粗腿宽肩,正在成为中女审美新风向

亲子要闻

孩子明知要挨父母打,为啥还待在原地不肯躲?知道原因心疼抱抱娃

房产要闻

震撼!海口顶豪“素颜出境”,直接顶穿品质天花板!

军事要闻

美众议院要求特朗普停止对伊动武并撤军

无障碍浏览 进入关怀版