网易首页 > 网易号 > 正文 申请入驻

谷歌新版Gemini可“一句话P图”,付费图库危矣?

0
分享至

最近两天,科技圈被谷歌的一项新功能刷屏了。谷歌上周扩大了 Gemini 2.0 Flash 模型图像生成功能的访问权限,让开发者可通过 Google AI Studio 和 Gemini API 免费使用这一实验性功能,也是其首个原生的全模态图像生成器。

与传统 AI 图像生成不同,Gemini 2.0 Flash 不是像 ChatGPT 调用 DALL-E 3 或 Grok 调用 flux.1 那样让语言模型去调用单独的扩散模型,而是在处理文本提示的同一模型中原生生成图像。目前谷歌并未公开此功能的详细技术细节,只简单介绍称它“结合多模态输入、增强推理和自然语言理解”。

因为有了这种能力,现在用户只需一句简单的提示语,就能完成以前需要 Photoshop 等专业软件才能实现的复杂图像编辑任务。在各大社交平台上,大家已经玩疯了这个功能。

比如,可以上传一件时尚外套的图片,然后要求模型让照片中的模特穿上这件衣服,结果非常自然。

或者是让人物手持一瓶香水,合成效果也非常出色。

或者更实用一点的,你还可以在迟到时让 Gemini 将自己在家拍的自拍照转换成在地铁故障现场等车的场景照片。虽然有眼尖的网友指出,生成图像中背景人物看起来像虚构角色,主角的拇指形状也很奇特,但整体效果看起来还是挺让人惊讶的。

笔者也用两道题目试了一下,简单一点的要求实现起来还是很轻松的。

但比较复杂的题目,效果就不尽如人意了。

这款实验版 Gemini 2.0 Flash 模型还有许多特别的功能:

  • 图文故事模式:开发者可以生成带插图的故事,保持人物和场景的一致性。用户可以提出反馈意见,随时调整故事情节或艺术风格。
  • 对话式图像编辑:支持多轮编辑对话,用户可以通过自然语言指令不断完善图像,实现实时协作和创意探索。
  • 基于世界知识的图像生成:利用模型的推理能力,创建基于真实世界知识的上下文准确图像。比如,它可以根据实际配料和烹饪方法准确地为食谱配图。
  • 改进的文本渲染:在图像中呈现清晰、拼写正确的文本,特别适合制作广告、社交媒体帖子和邀请函。

在 X 上,不少用户直言这项技术可能意味着 Photoshop 和 Canva 等专业图像编辑工具的末日。一位用户评论道:“谷歌这次真的做到了,普通人不需要学习任何专业技能就能完成高级修图任务。”

不过在众多应用场景中,有一项功能却引发了巨大的争议,那就是它能轻松移除图像水印,包括来自 Getty Images 和其他知名图库的版权保护水印。

根据多位社交媒体用户的展示和技术媒体的实测,Gemini 不仅能够移除水印标记,还能智能填补水印去除后留下的空白区域,而且处理后的图像质量相当高——AI 不仅移除了水印痕迹,还进行了像素级的智能重建,效果类似于 Google Photos 应用中的魔法橡皮擦功能。

甚至,当处理低分辨率的图像时,Gemini 不仅能去除水印,还会自动提升整体图像质量。根据一位测试者的详细记录,他上传的 485×632 像素图像在处理后变成了 783×1024 像素的高清图像。虽然最终生成的图像会带有 Gemini 自己的水印,但这个水印很容易通过简单的裁剪操作去除。

Reddit 上多位用户分享的对比图显示,Gemini 能够成功移除 iStock 和 Getty 的复杂水印,甚至处理那些带有半透明设计元素的版权标记。通常情况下,要获取无水印的图像,用户需要支付一次性费用或订阅相关服务,但现在 Gemini 2.0 Flash 免费就能完成这一任务。

不过,这一功能目前只在 Google AI Studio 的开发者工具中可用,如果用户尝试在面向消费者的移动或桌面版 Gemini 应用中去除水印,系统会显示警告信息:“未经版权持有者明确许可移除图像水印在大多数国家是违法的,应尊重版权法和知识产权。如果想使用带水印的图像,应联系版权持有者并获取许可。”

这项功能被发现后,立即引发了广泛争议。和 Gemini 不一样的是,它的主要竞争对手 Anthropic 的 Claude 3.7 Sonnet 和 OpenAI 的 GPT-4o 都明确拒绝执行移除水印的请求。当被要求移除图像水印时,Claude 甚至直白地表示这是“不道德且可能违法”的行为(虽然它只能生成 SVG 图像)。

X 平台上一位名为 tmophoto 的用户警告说:“如果你因为移除水印被抓到,惩罚可能是直接盗用图像的 100 倍那么严重。现在可以用 AI 生成图像,根本没必要偷图。”

对此,Menlo Ventures 合伙人、前谷歌工程师 Deedy Das 反驳道:“严格来说,新生成的图像虽然与原图相似,但实际上是从头创建的。如何在法律上证明它们是同一张图像?”

从模型生成的包含文字的图片的效果上来看,或许它的确并非完全复制原图以生成。

不过许多用户对此并不买账,认为这在法律上毫无疑问是侵权行为。

从法律角度看,美国版权法明确规定,未经原始所有者同意移除水印属于违法行为(除极少数特殊情况外)。欧盟《人工智能法案》第 50 条更是明确要求AI 系统的输出应采用“机器可读格式”,并且必须能够被识别为“人工生成或操纵”的内容。中国最佳也宣布了类似的“识别措施”,要求 AI 生成的内容应当有人类和机器可读的标识。

实际上,谷歌曾在 2023 年与其他 AI 公司(包括 Meta、Anthropic、亚马逊和 OpenAI)共同向白宫承诺实施 AI 生成内容的水印系统,以应对美国前总统拜登提出的关于 AI 造假内容风险的担忧。今年早些时候,谷歌还为其 Photos 应用中的 AI Reimagine 工具处理的照片添加了名为 SynthID 的数字水印技术,这种水印虽然肉眼无法识别,但机器可以检测并验证其 AI 来源。

而谷歌与水印技术的渊源还可以追溯到更早之前。2017 年,一个谷歌研究团队曾开发过一种能从图像中移除库存和机构水印的算法。这项发表在计算机视觉和模式识别会议上的研究,主要目的是揭示现有水印技术的漏洞,并推动水印安全性的改进。

研究论文中写道:“我们揭示了可见水印使用方式中的一个漏洞,它允许自动移除水印并高精度地恢复原始图像。这种攻击利用了水印在多个图像中的一致性,不受水印复杂度或位置的限制。”

研究团队在食品、自然和时尚等多个类别的知名图库数据库上测试了这一工具。整个系统依靠检测、抠图、重建、分解和混合因子等多阶段技术。不过与当时的研究不同,现在的 Gemini 2.0 Flash 是一个面向所有人的工具,用户无需任何编程或技术知识就能使用,这种低门槛显然更容易导致其被滥用,也因此,这项技术招致如此大的争议。

Digital Trends 评论道:“移除图像水印是一项绝对不应做的行为,原因有很多。除了违反当地法律外,这还剥夺了艺术家和摄影师的辛勤工作成果,而他们已经因为自己的作品在未经许可或未获报酬的情况下被用于训练 AI 而面临困境。”

谷歌目前尚未对媒体关于 Gemini 水印移除功能的质疑做出官方回应。考虑到该功能目前被标记为“实验性”且“不用于生产环境”,谷歌有可能在未来的更新中对其进行限制或调整。对于开发者和用户来说,这也是一个关于技术边界与伦理责任的重要思考点。

参考资料:

1.https://techcrunch.com/2025/03/16/people-are-using-googles-new-ai-model-to-remove-watermarks-from-images/

2.https://x.com/deedydas/status/1901042632958345369

3.https://www.yahoo.com/tech/saw-google-gemini-ai-erase-101201568.html?guccounter=1&guce_referrer=aHR0cHM6Ly93d3cuZ29vZ2xlLmNvbS8&guce_referrer_sig=AQAAAFLOk5Yl3NiN6NLhLsrVJnRhO89tTN-G75BS9zPhrClIDIEYAyCvRRUJiF-R85TRAGcPpg-4XZshAfe9Ez3wy_Zjol-lCHIlgUPBFEO4dHnWSz3dUNaKc9D2W6m-FBVLrpzqRnZIfc6A3QiWWvpgeNn3Geq7JEaYFq6Jib_KPJxA

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
香港偶遇46岁容祖儿 弯腰驼背走路肚子只剩一张皮 鞋跟高都有20cm

香港偶遇46岁容祖儿 弯腰驼背走路肚子只剩一张皮 鞋跟高都有20cm

科学发掘
2026-06-01 06:03:49
小米、鸿蒙智行、小鹏、蔚来等,5月份交付量盘点

小米、鸿蒙智行、小鹏、蔚来等,5月份交付量盘点

科技锋说
2026-06-01 13:38:17
年轻人想去纪委工作,要三思而行!

年轻人想去纪委工作,要三思而行!

一口娱乐
2026-05-30 19:36:20
多车企公布5月份成绩单:鸿蒙智行交付46122台,蔚来公司交付37705台,极氪交付34377辆,小米交付超30000台

多车企公布5月份成绩单:鸿蒙智行交付46122台,蔚来公司交付37705台,极氪交付34377辆,小米交付超30000台

中新经纬
2026-06-01 12:37:11
女生对性渴望属于正常现象吗?

女生对性渴望属于正常现象吗?

宇宙时空
2026-05-31 14:35:09
午评:沪指跌0.12% 煤炭板块、AI应用概念大涨

午评:沪指跌0.12% 煤炭板块、AI应用概念大涨

证券时报
2026-06-01 11:54:02
中韩半导体ETF等多只爆款基金,将停牌1小时!近50%美股QDII停购或限购

中韩半导体ETF等多只爆款基金,将停牌1小时!近50%美股QDII停购或限购

新浪财经
2026-05-31 22:15:03
蔚来五月交付破3.7万台创历史新高

蔚来五月交付破3.7万台创历史新高

盖世汽车
2026-06-01 12:42:05
“张雪机车”阿拉贡站第一、二回合正赛均获第8名,张雪发文:德比斯把问题都揽到自己身上是不对的,将直面短板快进改进

“张雪机车”阿拉贡站第一、二回合正赛均获第8名,张雪发文:德比斯把问题都揽到自己身上是不对的,将直面短板快进改进

海峡网
2026-06-01 09:29:55
伊朗把浓缩铀“快递”到中国,特朗普气得拍桌:这招太阴了!

伊朗把浓缩铀“快递”到中国,特朗普气得拍桌:这招太阴了!

浪子的烟火人间
2026-05-30 10:12:09
爬长城偶遇胡歌,真人不仅又高又帅还特别有少年感,笑容十分治愈

爬长城偶遇胡歌,真人不仅又高又帅还特别有少年感,笑容十分治愈

乡野小珥
2026-05-29 10:24:54
为了赖掉周星驰8000万,他们亲手葬送了900亿的影视帝国。

为了赖掉周星驰8000万,他们亲手葬送了900亿的影视帝国。

流苏晚晴
2026-05-27 18:41:20
老杜家族开始行动,没收小马科斯“主导权”,菲律宾大风暴逼近

老杜家族开始行动,没收小马科斯“主导权”,菲律宾大风暴逼近

世界有奇事
2026-06-01 13:40:43
罗马尼亚遭袭后,梅德韦杰夫警告:欧盟已进入与俄罗斯的战争

罗马尼亚遭袭后,梅德韦杰夫警告:欧盟已进入与俄罗斯的战争

澎湃新闻
2026-05-31 11:04:28
直到伊朗下令轰炸美空军基地,全世界才惊觉:中国有句话说得很对

直到伊朗下令轰炸美空军基地,全世界才惊觉:中国有句话说得很对

锅锅爱历史
2026-05-31 17:22:37
直到伊朗下令轰炸美空军基地,全世界才惊觉:中国有句话说得很对

直到伊朗下令轰炸美空军基地,全世界才惊觉:中国有句话说得很对

古史青云啊
2026-06-01 14:42:55
再创历史新高!零跑汽车5月全系车型交付量达81569台

再创历史新高!零跑汽车5月全系车型交付量达81569台

CNMO科技
2026-06-01 14:34:04
史上最和谐的皇室兄弟:哥哥将皇位让给弟弟,弟弟追封哥哥为皇帝

史上最和谐的皇室兄弟:哥哥将皇位让给弟弟,弟弟追封哥哥为皇帝

鹤羽说个事
2026-05-30 23:07:30
新闻联播都快"看不懂"了,近年出现了越来越多专业的新词汇

新闻联播都快"看不懂"了,近年出现了越来越多专业的新词汇

飘逸的云朵
2026-05-30 03:39:47
痛心!山西秦秀宇老师心梗去世,年仅39岁,自称60岁正是闯的年纪

痛心!山西秦秀宇老师心梗去世,年仅39岁,自称60岁正是闯的年纪

小鋭有话说
2026-06-01 12:09:23
2026-06-01 15:52:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16777文章数 514992关注度
往期回顾 全部

科技要闻

关停三年后,天涯社区今起开放访问

头条要闻

天涯社区重启 推出1999元"新天涯创世成员产品服务包"

头条要闻

天涯社区重启 推出1999元"新天涯创世成员产品服务包"

体育要闻

哭过之后,文班亚马想给波波维奇打电话

娱乐要闻

奚梦瑶婚礼现场图!一双儿女当花童

财经要闻

网红驱蚊产品,标注化妆品竟含农药成分

汽车要闻

上市三周交付3603台!华境S跻身旗舰大六座第一梯队

态度原创

艺术
游戏
健康
教育
军事航空

艺术要闻

吴镇写竹,清清爽爽

多人联机欢乐游戏《崩溃小队》现已推出!首周购买可享近6折优惠价!

尝试干细胞疗法如何避免踩坑?

教育要闻

三年级数学,竖式谜,你有思路吗?

军事要闻

韩国最大军工企业爆炸 已造成5人死亡

无障碍浏览 进入关怀版