网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

攻击成功率从3%到接近100%，空格键可绕过 Meta AI 模型安全系统

2024-07-31 10:36:13　来源: IT之家

山东举报

0

分享至

IT之家 7 月 31 日消息，Meta 公司上周在发布 Llama 3.1 AI 模型的同时，还发布了 Prompt-Guard-86M 模型，主要帮助开发人员检测并响应提示词注入和越狱输入。

IT之家在这里简要补充下背景知识：

提示词注入（prompt injection）：将恶意或非预期内容添加到提示中，以劫持语言模型的输出。提示泄露和越狱实际上是这种攻击的子集；
提示词越狱（prompt jailbreaks）：绕过安全和审查功能。

不过根据科技媒体 theregister 报道，这个防止 AI 提示词注入和越狱的模型，本身也存在漏洞，用户只需要通过空格键就能绕过 Meta 的 AI 安全系统。

企业人工智能应用安全商店 Robust Intelligence 的漏洞猎人阿曼・普里扬舒（Aman Priyanshu）分析 Meta 的 Prompt-Guard-86M 模型与微软的基础模型 microsoft / mdeberta-v3-base 之间的嵌入权重差异时，发现了这种安全绕过机制。

用户只需要在字母之间添加空格并省略标点符号，就可以要求 Meta 的 Prompt-Guard-86M 分类器模型“忽略之前的指令”。

Priyanshu 在周四提交给 Prompt-Guard repo 的 GitHub Issues 帖子中解释说：

绕过方法是在给定提示符中的所有英文字母字符之间插入按字符顺序排列的空格。这种简单的转换有效地使分类器无法检测到潜在的有害内容。

Robust Intelligence 首席技术官海勒姆・安德森（Hyrum Anderson）表示

无论你想问什么令人讨厌的问题，你所要做的就是去掉标点符号，在每个字母之间加上空格。它的攻击成功率从不到 3% 到接近 100%。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

AI被连续否定30次：ChatGPT越改越错，Claude坚持自我、已读不回

量子位 2024-09-08 13:27:35
79 跟贴 79
两个AI关小黑屋：Llama3.1把Claude Opus聊自闭了

量子位 2024-08-11 12:58:22
9 跟贴 9

300美元的Meta智能眼镜“火了”，配套应用下载量大涨200%！机构：2035年AI眼镜销量有望达14亿副

每日经济新闻 2024-12-25 17:00:07
42 跟贴 42

8岁小孩哥上手用AI制作游戏，全程2小时，引来50多万人围观

机器之心Pro 2024-09-03 14:38:55
49 跟贴 49
国内开店卷不动，换上AI出海试试

量子位 2024-07-17 16:09:25
0 跟贴 0

让ChatGPT不敢开口的名字！神秘bug引马斯克围观

量子位 2024-12-02 19:33:09
132 跟贴 132

全世界跑得最快的人形机器人，还能跳科目三都知道波士顿动力的机器人会空翻，那你知道中国品牌宇树科技有

爱范儿 2024-07-04 20:41:36
6420 跟贴 6420
肌肉骨骼居然和人类一样。外网爆火的克隆机器人，灵活性超高，胸腔里还复刻了人类的心脏瓣膜，宛如《西部世

量子位 2024-10-26 12:28:00
0 跟贴 0

搭载ChatGPT的《星际穿越》机器人爆火，马斯克：想要！ ChatGPT复刻版《星际穿越》机器人T

量子位 2024-07-09 12:03:11
0 跟贴 0
全球最远1.4米！国产宇树创人形机器人跳远纪录，外网惊叹碾压特斯拉

量子位 2024-10-19 12:16:06
2961 跟贴 2961
波士顿动力新机器人后空翻视频炸圈！扮作圣诞老人，动作干净丝滑

量子位 2024-12-25 16:00:03
25 跟贴 25
网友一个定积分的WIFI密码，测出了AI数学之王。Grok超强数学思维碾压ChatGPT，引马斯克点

量子位 2024-10-31 18:55:41
18 跟贴 18
国产机器狗驮成年小伙遛弯视频爆火，新通勤工具有了

量子位 2024-12-24 18:28:22
3 跟贴 3
AI大模型权威评测：豆包中文对话最强，OpenAI o1推理和数学占优

智东西 2024-12-25 18:35:46
21 跟贴 21
人形机器人狂奔！山地、草地、公路无障碍，原速演示全程高能

量子位 2024-10-14 13:19:05
1171 跟贴 1171
程序员的AI救赎时刻接入这个数据库业务提问自动解决

量子位 2024-12-20 18:25:44
0 跟贴 0
AI指挥机器人拍照，1:1复刻大片构图

量子位 2024-12-18 18:21:56
0 跟贴 0
告别屈膝小碎步让机器人像人一样走路国产团队造出“钢铁侠”

量子位 2024-10-24 11:42:12
0 跟贴 0
网友用350美元造出能走能玩的端到端人形机器人

量子位 2024-11-15 17:47:23
0 跟贴 0
Ilya播客干货引热议：LLM不仅是统计学

量子位 2024-12-24 11:34:18
0 跟贴 0
Meta搞出带触觉机器手，多模态操控精度提升94%

量子位 2024-11-24 12:34:42
0 跟贴 0
AIGC让电影成本降到几千块，全球创作者规模将急剧扩大

量子位 2024-12-23 11:41:50
0 跟贴 0
一个平台管好四万五千台设备，六周完成终端设备“无感迁移” | 创新场景

钛媒体APP 2024-07-19 12:12:32
1 跟贴 1
大模型可视化工具爆火，GPT推理过程一目了然

量子位 2024-11-18 15:41:30
0 跟贴 0
AI如何改变社交娱乐新姿势？阿里云专家解读来了

量子位 2024-11-27 20:35:45
0 跟贴 0
AI时代下基础设施每个环节将发生怎样的变化？

量子位 2024-12-18 11:08:29
0 跟贴 0
为什么AI可以下围棋、打Dota，却连简单的家务都做不好？

量子位 2024-12-17 18:39:55
0 跟贴 0
国产AI视频神器X-Portrait 2，效果碾压Runway

量子位 2024-11-14 17:24:46
0 跟贴 0
AI是怎么认出AI视频的？人类靠寻找“违和感”，AI靠的是

量子位 2024-11-08 18:51:54
0 跟贴 0
第一个100%开源的MoE大模型，7B的参数，1B的推理成本

机器之心Pro 2024-09-05 10:30:36
0 跟贴 0
「数字孪生」东京上线！Jim Fan：具身智能零样本迁移现实世界，共享「蜂群思维」

新智元 2024-12-26 15:11:59
0 跟贴 0
Science大突破！生命科学迎来最大“翻身”，预计这次要重回巅峰！

生物世界 2024-12-26 14:10:32
0 跟贴 0
机器人身穿衣服做家务被质疑！来自OpenAI押注的独角兽因过于逼真被怀疑是真人套壳——人形机器人初

量子位 2024-09-04 18:16:57
0 跟贴 0
最有打工天赋的机器人出现了！一镜到底的连续大负载搬运，动态超稳，来自国产的逐际动力

量子位 2024-08-12 10:39:39
0 跟贴 0
摒弃人工标注，AutoAlign方法基于大模型让知识图谱对齐全自动化

机器之心Pro 2024-07-26 15:01:16
0 跟贴 0
莫桑比克一监狱发生骚乱！致33人死亡，约1500名囚犯越狱

主持人杨杨 2024-12-26 11:56:49
0 跟贴 0
老师罚儿子写十页字母，萌娃用一锤定音法写完，字母上充满怨气！

搞怪笑工厂 2024-12-24 09:32:16
3 跟贴 3
豆包电脑版，原地封神了！

雷科技 2024-09-25 18:25:33
12 跟贴 12
监狱的发展历史，原来越狱手段如此五花八门！

探索自然的数位菌 2024-12-23 20:48:52
1 跟贴 1
1992年东营暴狱事件，8名罪犯企图驾车越狱，武警果断击毙3名凶犯

祭怀莲 2024-12-26 12:26:58
0 跟贴 0

台海观澜丨柯文哲被起诉，没有贪污罪

台海观澜丨柯文哲被起诉，没有贪污罪

经济观察报

2024-12-26 15:27:20

美国政坛又爆丑闻：81岁议员或已认知障碍多年马斯克直呼：太疯狂了…

美国政坛又爆丑闻：81岁议员或已认知障碍多年马斯克直呼：太疯狂了…

财联社

2024-12-25 18:30:15

国家统计局：修订后的2023年国内生产总值为1294272亿元，比初步核算数增加33690亿元，增幅为2.7%

国家统计局：修订后的2023年国内生产总值为1294272亿元，比初步核算数增加33690亿元，增幅为2.7%

每日经济新闻

2024-12-26 16:06:04

俞灏明正式官宣恋情！两人夕阳下拥抱入怀，王晓晨一脸娇羞真般配

俞灏明正式官宣恋情！两人夕阳下拥抱入怀，王晓晨一脸娇羞真般配

西瓜爱娱娱

2024-12-26 14:31:58

女子花7.3万修复鼻孔，术后鼻梁却歪成C形，机构：整了7次，别折腾了

女子花7.3万修复鼻孔，术后鼻梁却歪成C形，机构：整了7次，别折腾了

极目新闻

2024-12-26 17:11:22

内蒙古黑老大易连峰调戏一女子，不料女子背景强大，一夜就此覆灭

内蒙古黑老大易连峰调戏一女子，不料女子背景强大，一夜就此覆灭

荔枝人物记

2024-12-23 18:55:24

雅典娜疑似被“潮汕商会”解救回国，知情者曝光更多细节！

雅典娜疑似被“潮汕商会”解救回国，知情者曝光更多细节！

阿凫爱吐槽

2024-12-26 11:45:08

成都一10米高圣诞树起火！原因遭曝光，网友：长津湖的怒火

成都一10米高圣诞树起火！原因遭曝光，网友：长津湖的怒火

派大星纪录片

2024-12-26 15:24:21

身价暴跌4000万！年度“跳水王”诞生：14场仅2球，巴黎血亏

身价暴跌4000万！年度“跳水王”诞生：14场仅2球，巴黎血亏

叶青足球世界

2024-12-26 19:54:22

俄罗斯再次打下民航客机？

西楼饮月

2024-12-26 11:10:28

这才是阳谋！俄罗斯财政部长说他们正在用比特币进行对外贸易

这才是阳谋！俄罗斯财政部长说他们正在用比特币进行对外贸易

二向箔

2024-12-26 19:00:15

案件：北京一女教授在家养病长达10年，民警进门后，当场愣在原地

案件：北京一女教授在家养病长达10年，民警进门后，当场愣在原地

五元讲堂

2024-12-24 16:57:49

央视主持人31岁正当红，因一句话辞职赴美，17年后？

央视主持人31岁正当红，因一句话辞职赴美，17年后？

诸神的护佑

2024-12-25 20:01:51

长沙圣诞节被高估了，解放西特警都出动路也封了，结果根本没人！

长沙圣诞节被高估了，解放西特警都出动路也封了，结果根本没人！

青青子衿

2024-12-25 19:52:14

济南一位60岁孕妇产下男婴，街道：系家中二孩，可申领育儿补贴

济南一位60岁孕妇产下男婴，街道：系家中二孩，可申领育儿补贴

极目新闻

2024-12-26 14:41:28

系故意抹黑！比亚迪李云飞回应巴西劳工风波，员工“红手印”表态

系故意抹黑！比亚迪李云飞回应巴西劳工风波，员工“红手印”表态

二向箔

2024-12-26 18:37:13

我们可能还是忽视了舔狗经济崩盘的影响

我们可能还是忽视了舔狗经济崩盘的影响

卢诗翰

2024-12-26 11:01:18

终于没人过圣诞了

阿亮评论

2024-12-25 19:11:44

净利润54%，全球供不应求！英伟达严查东南亚高端芯片流向的底气

净利润54%，全球供不应求！英伟达严查东南亚高端芯片流向的底气

大风文字

2024-12-26 12:57:33

迈腾“细节控”，不怕帕萨特带PRO

迈腾“细节控”，不怕帕萨特带PRO

网上车市

2024-12-26 17:50:17

爱科技，爱这里 - 前沿科技人气平台

263664文章数 605701关注度

往期回顾全部

科技要闻

小米正搭建GPU万卡集群，大力投入AI大模型

头条要闻

美印太总部司令称有信心在台海冲突中取胜国防部回应

头条要闻

美印太总部司令称有信心在台海冲突中取胜国防部回应

体育要闻

再见，中超最后的超级巨星

娱乐要闻

57岁王祖贤分享近照，状态太好又被质疑整容

财经要闻

69亿订单"消失"，卓然股份隐藏了什么?

汽车要闻

新物种iCAR V23的“尤里卡时刻”

态度原创

家居

时尚

教育

公开课

军事航空

家居要闻

现代简约提升温馨质感

专栏 | 变美，是美学也是科学

教育要闻

25调剂专区｜25考研调剂信息汇总第1期

公开课

李玫瑾：为什么性格比能力更重要？

军事要闻

中方批菲防长涉华言论出格荒唐

© 1997-2024 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版