网易首页 > 网易号 > 正文 申请入驻

港科、北交、复旦等提出针对 VLM 的大规模预训练对抗攻击 AnyAttack | CVPR 2025

0
分享至

大规模预训练攻击框架 Any Attack 无需预设标签,即可将普通图像转化为有目标的 有目标 对抗样本。

作者丨张家明

近年来,视觉语言模型(Vision-Language Models, VLMs)在多模态 AI 领域展现了重要的研究价值和应用潜力,但其安全性问题也逐渐受到关注。例如,攻击者可能通过对抗样本操控模型输出,导致模型生成错误信息或内容被篡改等风险。传统对抗攻击方法因依赖预设标签,难以适应大规模数据场景,因此其威胁范围相对有限。

针对这一问题,来自香港科技大学、北京交通大学、复旦大学、新加坡管理大学等机构的学者联合提出了一种新的大规模预训练攻击框架AnyAttack,通过设计的创新自监督学习任务,在LAION-400M数据集上完成了对攻击噪声生成器的大规模预训练。基于预训练的攻击生成器,攻击者可以针对任何下游任务,微调生成指向任何目标图像的对抗噪声。该框架能够在无需预设标签的情况下,将普通图像转化为有目标的有目标对抗样本,从而有效测试和评估大规模VLM模型的鲁棒性。相关研究成果已被计算机视觉领域顶级会议 CVPR 2025 收录。

论文标题:《AnyAttack: Towards Large-scale Self-supervised Adversarial Attacks on Vision-language Models》

论文地址: https://arxiv.org/abs/2410.05346

项目主页:

https://jiamingzhang94.github.io/anyattack/

图1.上:现有攻击方法依赖标签监督信息;

下:AnyAttack框架不依赖标签完成大规模自监督预训练。

1

实际意义

传统的有目标对抗攻击方法通常依赖预定义标签,这在一定程度上限制了其可扩展性和实际应用范围。相比之下,AnyAttack通过在LAION-400M数据集上进行大规模预训练(图1),摆脱了对标签监督的依赖,从而显著提升了攻击的灵活性和适应性。这一方法使任何一张图像都能被转化为对抗攻击,并能误导VLM生成特定目标输出,为VLM鲁棒性研究提供了新的工具和方法。

图2. AnyAttack框架:自监督对抗噪声预训练阶段(上)和自监督对抗噪声微调阶段(下)。

  • 攻击框架介绍

如图2所示,AnyAttack是一个两阶段自监督学习框架

自监督对抗噪声预训练:AnyAttack框架的核心创新在于其自监督预训练机制。研究团队设计了一种全新的训练范式,将对抗攻击转化为自监督学习问题。在预训练阶段,框架使用冻结的图像编码器从输入图像中提取嵌入向量,这些标准化的嵌入向量随后被送入解码器网络,生成对应的对抗噪声。研究者期待所生成的对抗噪声加在任意的图像上所组成的对抗图像都会被VLMs识别为输入图像,这形成了一种自监督的训练模型,即以输入图像本身为监督来引导生成对抗噪声。具体来说,在一个batch中给定一个样本作为输入图像,则该batch中其余的样本皆为该样本的负样本,研究者根据这种正负样本对的关系来构建了对比损失。为了提升对抗噪声的泛化能力,研究者还引入了创新的K-增强策略,该策略在每个batch内创建了多个随机打乱版本的干净图像。换言之,所得到的对抗噪声被加在不同的干净图像上都应当被VLMs识别为输入图像,这增加了正样本的构建方式,这种设计使得对抗噪声更加通用,实现了“任意图像→任意目标输出”的灵活攻击能力,而不依赖于特定的图像内容或标签信息,从而提升了任意性和迁移性。

2

实验结果

  • 成功攻击开源模型

研究团队对AnyAttack进行了全面评估,在CLIP、BLIP、BLIP2、InstructBLIP和MiniGPT-4五个开源模型上的评估证明了其在开源和商业视觉-语言模型上的可迁移性和有效性。图3给出了具体的示例。在CLIP模型上,攻击成功率(Retrieval)比表现最好的基线方法提升了17.33个百分点;在BLIP、BLIP2、InstructBLIP和MiniGPT-4模型上的Image Captioning任务分别提升了0.6, 3.8, 8.5和2.5(CIDEr)。

图3. AnyAttack成功攻击开源视觉语言模型

CLIP、BLIP、BLIP2、InstructBLIP和MiniGPT-4

  • 成功迁移攻击商业模型

更令人担忧的是,尽管商业系统通常具有更强大的安全措施,AnyAttack仍然表现出令人瞩目的迁移能力,成功操纵了Google Gemini、Claude Sonnet、Microsoft Copilot和OpenAI GPT等商业VLMs。图4给出了具体的示例。通过调用Gemini 1.5 Flash和GPT-4o mini的API进行了量化实验,测试了100张图像,攻击成功率分别达到了31%和38%,分别超过基线方法26%和10%。

图4. AnyAttack成功迁移攻击商业视觉语言模型

Google Gemini、Claude Sonnet、Microsoft Copilot和OpenAI GPT

3

总结

本研究工作揭示了视觉语言大模型生态系统中存在的系统性安全风险。实验结果表明,即使模型基于不同的数据集和架构进行训练,其防御机制在面对自监督攻击方法时,仍表现出显著的跨模型迁移脆弱性。研究团队开源了基于LAION-400M预训练的对抗噪声生成器,该工具通过单次前向传播即可生成有目标对抗样本,相比基于梯度的传统攻击方法,攻击效率有明显优势,可以用来评测视觉语言模型的鲁棒性。

更多内容,点击下方关注:

未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!

公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
弘一法师:永远不要去责怪你生命里的任何人,好的人给你快乐,坏的人给你经历,别人怎么对你,是过往,你怎么对别人,是修行

弘一法师:永远不要去责怪你生命里的任何人,好的人给你快乐,坏的人给你经历,别人怎么对你,是过往,你怎么对别人,是修行

每日一首古诗词
2026-05-26 12:07:58
四川稻城亚丁景区摆渡车将下调收费,执行8折优惠,景区工作人员回应:价格调整属实,目前暂未收到正式文件;此前曾被文旅部点名批评

四川稻城亚丁景区摆渡车将下调收费,执行8折优惠,景区工作人员回应:价格调整属实,目前暂未收到正式文件;此前曾被文旅部点名批评

潇湘晨报
2026-05-26 11:12:49
随着尼克斯4-0横扫骑士,雷霆2-2马刺,总决赛最新夺冠概率出炉

随着尼克斯4-0横扫骑士,雷霆2-2马刺,总决赛最新夺冠概率出炉

小火箭爱体育
2026-05-26 10:54:16
当不成首相了?高市早苗或将被迫下台,日媒硬刚:必须做出解释

当不成首相了?高市早苗或将被迫下台,日媒硬刚:必须做出解释

观史搜寻着
2026-05-26 14:25:10
沙利文万字长文承认:面对中国,我们确实错了!

沙利文万字长文承认:面对中国,我们确实错了!

浪子的烟火人间
2026-05-26 01:30:03
欧美的社保,为什么还没有崩?

欧美的社保,为什么还没有崩?

新浪财经
2026-05-24 23:21:09
一口气连放8集!尼古拉斯·凯奇《暗影蜘蛛侠》正式播出

一口气连放8集!尼古拉斯·凯奇《暗影蜘蛛侠》正式播出

3DM游戏
2026-05-26 10:00:22
骑士0-4尼克斯!哈登赛后评价阿特金森,米切尔谈哈登也把话挑明

骑士0-4尼克斯!哈登赛后评价阿特金森,米切尔谈哈登也把话挑明

鱼崖大话篮球
2026-05-26 12:31:50
踢球者:沙尔克希望与卡里乌斯续约,并将其薪资上调至顶薪行列

踢球者:沙尔克希望与卡里乌斯续约,并将其薪资上调至顶薪行列

云隐南山
2026-05-26 14:32:02
德国军事专家表示:现在不是美国不敢对中国动手

德国军事专家表示:现在不是美国不敢对中国动手

回京历史梦
2026-05-25 18:35:53
11岁男孩顶替退伍军人领国家俸禄15年,被揭穿后:敢告我就弄死你

11岁男孩顶替退伍军人领国家俸禄15年,被揭穿后:敢告我就弄死你

莫地方
2026-05-25 01:15:03
美国抽身欧洲,俄罗斯一旦翻盘,中国必须立刻封死这三个致命缺口

美国抽身欧洲,俄罗斯一旦翻盘,中国必须立刻封死这三个致命缺口

松林侃世界
2026-05-24 02:51:44
这美女也太顶了!主教练喝水好啊!得看!

这美女也太顶了!主教练喝水好啊!得看!

柚子说球
2026-05-25 20:11:02
“粉木耳”配图女性剪影,盒马就产品标签设计道歉,已全部下架并内部复盘改进流程

“粉木耳”配图女性剪影,盒马就产品标签设计道歉,已全部下架并内部复盘改进流程

界面新闻
2026-05-26 10:53:59
后院起火,塞尔维亚数万人抗议,人在北京的武契奇,坦言或将辞职

后院起火,塞尔维亚数万人抗议,人在北京的武契奇,坦言或将辞职

史行途
2026-05-26 13:39:07
巴萨看笑了!皇马宁愿 6000 万买水货,也不 2500 万回购自家瑰宝

巴萨看笑了!皇马宁愿 6000 万买水货,也不 2500 万回购自家瑰宝

奶盖熊本熊
2026-05-26 03:58:25
郑丽文6月1日就要去美国了,即使不回来了,我也要将郑丽文说透

郑丽文6月1日就要去美国了,即使不回来了,我也要将郑丽文说透

小影的娱乐
2026-05-26 02:40:52
李晨郑恺停更后续,节目中更多被欺凌片段爆出,沙溢评论区已沦陷

李晨郑恺停更后续,节目中更多被欺凌片段爆出,沙溢评论区已沦陷

乐天闲聊
2026-05-25 13:59:46
两岸统一开始提速! 大陆开始着手接管台湾治权, 赖清德的桌子被掀

两岸统一开始提速! 大陆开始着手接管台湾治权, 赖清德的桌子被掀

别吵吵
2026-05-26 08:28:04
没有先进光刻机也能造出高端芯片,华为发表的“韬(τ)定律”是什么?

没有先进光刻机也能造出高端芯片,华为发表的“韬(τ)定律”是什么?

每日经济新闻
2026-05-25 13:46:09
2026-05-26 15:47:00
AI科技评论 incentive-icons
AI科技评论
点评学术,服务AI
7304文章数 20754关注度
往期回顾 全部

科技要闻

今年秋季,麒麟芯片将首次落地"逻辑折叠"

头条要闻

外媒:中美身处两个"陷阱"之间 两国力求全都规避

头条要闻

外媒:中美身处两个"陷阱"之间 两国力求全都规避

体育要闻

上赛季差点降入英甲,下赛季要踢英超了

娱乐要闻

台媒贴脸!S妈被问大S嗑药当场沉默

财经要闻

中国铝行业爆单 下一个“煤炭”大周期?

汽车要闻

涉水加强 福特烈马亚马逊限量版上市 售价39.98万

态度原创

房产
亲子
健康
教育
公开课

房产要闻

招商地产接盘碧桂园!海口这个烂尾豪宅,要彻底改命?

亲子要闻

备孕肌醇产品哪款值得买?2026热门肌醇品牌实测排行,协同滋养卵巢助力备孕

几百块一瓶的外泌体精华,涂脸上是“智商税”吗?

教育要闻

5月24日河南平顶山高二男孩年级第一,数学稳定在140-150分

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版