网易首页 > 网易号 > 正文 申请入驻

OpenAI深夜放大招!GPT-4o原生图像生成上线,动动嘴就能P图生图,设计师要失业了?

0
分享至

今天是2025年3月26日,科技圈再次被OpenAI点燃!就在谷歌发布Gemini 2.5的同一时间,OpenAI毫无预警地甩出“王炸”——GPT-4o原生多模态图像生成功能正式上线。这一次,AI不仅能听懂你的话,还能“画”出你脑中每一个像素级的想象。从逼真照片到奇幻插画,从精准图表到品牌Logo,只需一句话,甚至一个眼神(如果你用语音输入),AI就能在1分钟内交出答卷。

更疯狂的是,免费用户也能用

(提示:「创建一张逼真的照片,内容是两名 20 多岁的女巫(一名是灰白色挑染发型,另一名是长卷的红褐色头发)正在阅读一个街标。

背景:纽约威廉斯堡一条普通的城市街道,一根电线杆上完全被许多详细的街标覆盖(例如,街道清扫时间、需要停车许可证、车辆分类、拖车规则),包括中间的几个荒谬的标志:Broom Parking for Witches Not Permitted in Zone C,Magic Carpet Loading and Unloading Only (15-Minute Limit) 等等。

人物:一名女巫拿着一把扫帚,另一名女巫拿着一个卷起的魔法地毯。她们在前景中,身体微微背向相机,头部微微倾斜,仔细查看标志。

从背景到前景的构图:街道 + 停放的汽车 + 建筑物 → 街标 → 女巫。人物必须是离拍摄相机最近的。」)

一、颠覆认知:这不是DALL-E,而是“全能大脑”的降维打击

过去,ChatGPT生成图像依赖DALL-E 3模型,而这次GPT-4o的突破在于——图像生成不再是独立模块,而是直接嵌入多模态大模型的“原生能力”。简单来说,同一个AI大脑既能写诗、写代码,又能画图、改图,甚至结合上下文“边聊边改”。

三大核心革新让行业颤抖

  1. 精准到变态的文本渲染


    过去AI生成带文字的图像总像“抽象艺术”,但GPT-4o能完美呈现菜单、Logo甚至信息图中的每一个字符。有用户测试生成了一张“纽约女巫看街标”的图片,连“Broom Parking for Witches Not Permitted in Zone C”这种荒诞标语都清晰可辨。

  2. 多轮对话修图,像指挥设计师一样


    “把猫P上侦探帽,再加个游戏UI界面”“把电锯广告改成奶奶切火鸡”——GPT-4o能基于聊天记录持续优化图像,甚至保持角色设计的一致性。一位游戏开发者称:“迭代10版角色,发型和服装细节都能无缝衔接,简直像有个AI美工团队随叫随到!”

  3. 知识库+多模态联动,让AI真正“懂”创作


    上传一张蜗牛图片,要求“设计三角形车轮的车辆”,GPT-4o不仅能画出结构图,还会自动标注专利信息;输入“旧金山多雾成因”,它能生成带科学图表的信息图,甚至调用地理知识标注关键数据。

(提示:「我在 Marin 开设了一家名为 Haein 的传统概念餐厅,主打采用有机农场新鲜食材烹制的韩式料理,并根据时令供应轮换菜单。请您设计一份菜单图片,需包含以下菜品 —— 整体风格要兼顾传统 / 乡村韵味与高端精致感。请为每道菜品配上优雅的彼得兔风格的插画,确保所有文字正确呈现,并使用白色背景。

顶部:大酱汤(发酵大豆炖菜) - 18 美元

大酱汤是用当地的蘑菇、豆腐和时令蔬菜做成的,配上米饭……

底部:时令米酒 —— 每杯 12 美元」)

二、实测效果:这些图你敢信是AI画的?

OpenAI官方放出的案例已让网友惊呼“疯狂”,而普通用户的实测更让人瞠目结舌:

  • 场景1:韩式餐厅菜单设计

    用户描述“传统与高端融合的韩餐菜单,配彼得兔风格插画”,GPT-4o生成的图片中,菜品名称、价格、插画排版堪比专业设计师作品,连“时令米酒”的字体阴影都细腻逼真。

  • 场景2:科幻级游戏角色迭代

    一位开发者上传草图后,通过对话逐步添加“赛博朋克机械臂”“发光纹身”,GPT-4o在10次修改中始终保持角色面部特征一致,最终输出可直接用于3D建模的设定图。

  • 场景3:学术图表秒变PPT

    用户输入“牛顿棱镜实验图解”,生成信息图后追加指令:“把图放到咖啡桌上,加个画图的人”,GPT-4o立即输出第一视角场景,连桌面的反光都真实到离谱。

网友辣评

“OpenAI这是把Midjourney+Photoshop+PPT三合一了,还附赠一个24小时待命的艺术总监!” “以后甲方说‘感觉不对’的时候,我可以当场改给他看,再也不用熬夜了……”
三、技术内幕:人类训练师如何“教AI画画”?

GPT-4o的突破背后,是一套**“人类反馈强化学习(RLHF)”**的杀手锏。OpenAI研究员Gabriel Goh透露,团队雇佣了大量人类训练师,专门标注AI生成图像中的错别字、畸形手脚、透视错误等问题,再让模型从错误中学习。

四大技术升级点

  • 文本-图像联合训练

    模型同时学习文本、代码和图像的关联,而非单独处理图像;

  • 上下文感知生成

    能记住聊天历史中的图像和描述,确保多次输出风格统一;

  • 超强多对象处理

    单张图可容纳10-20个不同物体,且能精准绑定属性(比如“穿红裙拿蓝气球的女人”);

  • 风格无缝切换

    从手绘草图到4K写实,只需一句指令。

四、谁会被颠覆?这五大行业已瑟瑟发抖
  1. 设计行业


    Logo、海报、包装设计成本直降90%,小型企业甚至个人博主都能拥有“专属设计团队”。

  2. 游戏开发

    NPC角色、场景原画、UI界面均可AI生成,有团队实测“3天做完过去1个月的美术工作量”。

  3. 教育出版


    “牛顿棱镜实验”“细胞结构图”等教学素材可一键生成,还能根据教材版本定制风格。

  4. 广告营销


    “生成100版母亲节海报A/B测试”成为可能,品牌方惊呼“再也不用为改稿扯皮了”。

  5. 影视概念设计


    《流浪地球4》团队被曝已接入GPT-4o,用于快速迭代科幻场景设定。

五、免费用户怎么玩?手把手教你薅OpenAI羊毛

即日起,**所有ChatGPT用户(包括免费版)**均可通过以下步骤尝鲜:

  1. 打开ChatGPT,输入“/image”触发图像模式;

  2. 用自然语言描述需求,例如:“一张赛博朋克风格的猫咪侦探海报,背景是雨夜东京,文字标题《Whisker Code》”;

  3. 添加细节参数(可选):“比例16:9,主色调#FF5733,右侧留白20%”;

  4. 生成后输入“把猫改成三只,加上霓虹灯边框”,AI会自动迭代。

高阶技巧

  • 上传图片+指令

    :拍下你的草图,让AI转化成专业设计稿;

  • 知识库调用

    :输入“用GPT-4o的知识解释量子计算,并生成信息图”;

  • 多模态组合

    :先让AI写一首诗,再命令“把这首诗变成蛋壳纹理的卡片”。

六、冷静!这些坑千万别踩

尽管GPT-4o强到逆天,OpenAI也坦承其局限:

  • 长图易翻车

    :生成海报时底部可能被裁剪,需多次调整;

  • 非拉丁文字偶现乱码

    :中文标语建议生成后人工校对;

  • 版权黑洞

    :训练数据含大量未授权艺术作品,商用需谨慎。

七、终极预言:AI消灭创意,还是解放人类?

Sam Altman说这是“创作自由的新高度”,但艺术家群体已分裂成两派:

  • 乐观派


    “AI把重复劳动自动化,人类终于可以专注真正的创意!”

  • 悲观派


    “当甲方自己会生成100版方案,设计师连改稿的机会都没了……”

无论如何,一个事实已无法逆转:谁先掌握GPT-4o,谁就握住了视觉时代的入场券

以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章,我们,下次再见。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
450万粉网红丹尼·科尔曼痛失14岁爱子:曾以为只是口腔小毛病,确诊已是癌症三期

450万粉网红丹尼·科尔曼痛失14岁爱子:曾以为只是口腔小毛病,确诊已是癌症三期

热搜摘要官
2026-05-23 00:24:36
耿同学的博导杨昀,和中日友好医院开除的肖飞,还一起发表论文

耿同学的博导杨昀,和中日友好医院开除的肖飞,还一起发表论文

笔墨V
2026-05-23 14:44:37
梅根的心机一览无遗:女儿莉莉贝特跪在地上给她整理鞋子,像仆人

梅根的心机一览无遗:女儿莉莉贝特跪在地上给她整理鞋子,像仆人

毒舌小红帽
2026-05-22 18:16:50
哈登19+5尽力了!108-121骑士0-3落后:他就是头号罪人!

哈登19+5尽力了!108-121骑士0-3落后:他就是头号罪人!

运筹帷幄的篮球
2026-05-24 09:26:32
医生忠告:患上高血压的人,一定要补充2种维生素,预防脑梗上门

医生忠告:患上高血压的人,一定要补充2种维生素,预防脑梗上门

健康科普365
2026-05-23 18:16:01
骑士遭尼克斯压制,0-3=出局!哈登爆发创历史,老詹该回克利夫兰了

骑士遭尼克斯压制,0-3=出局!哈登爆发创历史,老詹该回克利夫兰了

梦忆之浅
2026-05-24 12:16:19
广东队3消息:北控想要杜润旺,徐杰离开国家队,区俊炫毛遂自荐

广东队3消息:北控想要杜润旺,徐杰离开国家队,区俊炫毛遂自荐

孤影来客
2026-05-24 13:14:51
美防长:“战斧”导弹将延迟最多两年交付日本

美防长:“战斧”导弹将延迟最多两年交付日本

参考消息
2026-05-24 11:07:06
最低调普京女婿被亿万富豪当街暴打:拒绝10亿赔偿,只提一个要求

最低调普京女婿被亿万富豪当街暴打:拒绝10亿赔偿,只提一个要求

贰文
2024-10-31 00:30:11
外媒热议U17亚洲杯中国亚军 日媒:成功照搬日本 越媒:复兴基础

外媒热议U17亚洲杯中国亚军 日媒:成功照搬日本 越媒:复兴基础

郝小小看体育
2026-05-23 10:21:39
美国为什么没有贪官,美国看着特别清廉,他们不喜欢钱吗

美国为什么没有贪官,美国看着特别清廉,他们不喜欢钱吗

西楼知趣杂谈
2026-05-23 10:51:57
情侣在瑞士雪山顶“撒欢”,就这么被全世界直播了···

情侣在瑞士雪山顶“撒欢”,就这么被全世界直播了···

新欧洲
2026-04-21 19:37:05
荷兰人掀了桌子,想将国内芯片产业倒退十年,中国反手甩出三张牌

荷兰人掀了桌子,想将国内芯片产业倒退十年,中国反手甩出三张牌

李子橱
2026-05-23 11:45:07
被“数字围墙”困住的新能源车主:外面换刹车油都出故障码,必须回4S店在线匹配

被“数字围墙”困住的新能源车主:外面换刹车油都出故障码,必须回4S店在线匹配

金融界
2026-05-22 12:08:12
那个让一汽“全体起立”的男人倒下了

那个让一汽“全体起立”的男人倒下了

ZAKER新闻
2026-05-24 10:11:19
对于明天周一A股,我只说2句话:第一,4067点很可能并不是最终底部!

对于明天周一A股,我只说2句话:第一,4067点很可能并不是最终底部!

趋势清风侠
2026-05-24 08:55:25
外媒:印度成功破解霹雳-15E源代码,将为“阵风”带来电子战优势

外媒:印度成功破解霹雳-15E源代码,将为“阵风”带来电子战优势

零度Military
2026-05-22 01:05:03
细思极恐!韩媒说具俊晔见到大S时她已不能动,称二胎导致大脑受损

细思极恐!韩媒说具俊晔见到大S时她已不能动,称二胎导致大脑受损

八卦王者
2026-05-24 12:08:41
毫无人性!四川女子带百斤大狗进店咬伤小孩,转头就弃狗跑路逃逸

毫无人性!四川女子带百斤大狗进店咬伤小孩,转头就弃狗跑路逃逸

行者聊官
2026-05-23 14:49:18
阿森纳夺冠就翻脸!29 岁巨星仅 500 万甩卖,昔日王牌彻底边缘化

阿森纳夺冠就翻脸!29 岁巨星仅 500 万甩卖,昔日王牌彻底边缘化

澜归序
2026-05-24 05:47:42
2026-05-24 14:11:00
前沿科技学习分享圈 incentive-icons
前沿科技学习分享圈
朝看花开满树红,暮看花落树还空。若将花比人间事,花与人间事一同。
1691文章数 370关注度
往期回顾 全部

科技要闻

我戴着摄像头上班,正在帮AI抢走我饭碗

头条要闻

白宫发生枪击事件枪手已死亡 曾多次踩点问如何进白宫

头条要闻

白宫发生枪击事件枪手已死亡 曾多次踩点问如何进白宫

体育要闻

唐斯发牌,大头逆袭:骑士跌向残忍夏季

娱乐要闻

李晨郑恺冲上热搜!跑男停宣引热议

财经要闻

爆炸致82人遇难 留神峪煤业存违法行为

汽车要闻

2027款星途瑶光上市 把"全球车"标准卷进13万级市场

态度原创

教育
游戏
时尚
本地
公开课

教育要闻

南京信息工程大学,就业又爆出大新闻了!

十年磨一剑?《犹大》最早也要2027年才发售

伊姐周六热推:电视剧《嫁金枝》;电视剧《大唐迷雾 第一季》......

本地新闻

用云锦的方式,打开江苏南京

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版