网易首页 > 网易号 > 正文 申请入驻

大神Karpathy:我给大模型「SQL注入」攻击,简直不要太轻松

0
分享至



机器之心报道

编辑:杜伟、泽南

大模型的安全性,可以说是「有很大进步空间」。

AI 大牛 Andrej Karpathy 又来科普知识了,这次的主题是「利用特殊 token 对 LLM 进行类 SQL 注入的攻击」。

所谓 SQL 注入攻击,它是一种网络攻击技术。攻击者通过将恶意的 SQL 语句插入到应用程序的输入字段中,诱使后台数据库执行这些恶意的 SQL 语句。此类攻击通常利用应用程序对用户输入的处理不当,比如没有正确地对输入进行过滤或转义,导致攻击者能够访问、修改甚至删除数据库中的数据。



由于人们的安全意识逐渐升高,目前对于大多数软件产品来说,SQL 注入都不应该出现。

但在大模型领域,一切都还处于初步阶段。LLM 分词器负责对输入字符串中的特殊 token(如 、<|endoftext|> 等)进行解析。虽然这看起来很方便,但最多会导致误判;最坏的情况下会导致 LLM 安全漏洞,相当于 SQL 注入攻击。

这里就要注意了:用户输入字符串是不受信任的数据。

在 SQL 注入中,你可以使用「DROP TABLE」攻击来破解不良代码。在 LLM 中同样会遇到相同的问题,不良代码会将字符串的特殊 token 描述符解析为实际的特殊 token,弄混输入表示,导致 LLM 无法分发聊天模版。

下面是一个使用当前 huggingface Llama 3 分词器默认的示例。

可以看到,同时出现了两种不直观的情况:

  • <|begin_of_text|> token 被(128000)被添加到了序列前面
  • <|end_of_text|> token(128001)从字符串中被解析出来,并插入了特殊 token。现在文本(可能来自用户)可能与 token 协议混淆,并导致 LLM 无法分发,进而产生未定义的输出结果。

因此,Karpathy 建议始终使用两个额外的 flag 进行 tokenizing 操作,禁用 add_special_tokens=False 和 split_special_tokens=True,并在代码中自行添加特殊 token。他认为这两个选项的命名会有点令人困惑。对于聊天模型,你也可以使用聊天模板 apply_chat_template。

通过以上操作,你可以得到一些看到来更正确的东西。比如 <|end_of_text|> 现在被视为任何其他字符串序列,并被底层 BPE 分词器分解,就像任何其他字符串一样。



Karpathy 认为对编码和解码的调用永远不应该通过解析字符串的方式来处理特殊 token,我们需要完全弃用这一功能。相反,这些应该只通过单独的代码路径来显式且以编程方式来添加。在 tiktoken 中,始终使用 encode_ordinary;在 huggingface 中,使用上文提到的 flag 更安全。至少要注意到这个问题,并始终保持自己 token 的可视化并测试自己的代码。

Karpathy 认为这些东西非常微妙且记录不全,他预计现在大约 50% 的代码都出现了上述问题导致的 bug。

即使是出厂前经历了严格测试的 ChatGPT 也出现了一些奇怪的问题。最好的情况是它只删除了 token,最坏的情况则是以一种未定义的方式混淆了 LLM。Karpathy 也不清楚背后发生了什么,但 ChatGPT 无法将字符串 <|endoftext|> 重复发给他。所以这里要格外注意。



Andrej Karpathy 的文章一出,立刻引起了讨论。有人问:那么 LLM 开发人员需要采取什么措施来提升安全性吗?

Karpathy 认为说来也简单,始终以「普通」方式标记字符串,即 utf8 字节序列就可以了。这让人想起了安全领域中的「最小特权」原则 —— 本质上,通过将功能限制在绝对必要的范围内,就可以最大限度地减少发生意外后果的可能性。



也有人表示「我们已经在这个方向上前进了」。VLM 模型 PaliGemma 作者,Google DeepMind 科学家 Lucas Beyer 表示,我们在新工作得代码里已经提升了安全机制,这会有些麻烦,尤其是在支持多个 tokenizer 时,但总体而言是值得的。它也会让代码更加直接。



也有网友问道,如果代码是正确的,但是训练数据时候输入 <|endoftext|> 会发生什么?

Karpathy 表示,如果代码没错,什么都不会发生。但问题是很多代码可能并不正确,这会悄悄破坏大模型的世界观。



Karpathy 发现的新问题,你怎么看呢?

参考内容:

https://twitter.com/karpathy/status/1823418177197646104

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
山东男子当街将70岁老母双腿打断,得知真相后,众人都说老母该死

山东男子当街将70岁老母双腿打断,得知真相后,众人都说老母该死

神奇的锤子
2024-09-02 16:01:35
8年花了800万整成范冰冰,嫁给盗版李晨,被骗婚的她现在怎样了

8年花了800万整成范冰冰,嫁给盗版李晨,被骗婚的她现在怎样了

柴叔带你看电影
2024-09-14 00:32:02
哈兰德4场9球,在球队进球榜排次席的利物浦&切尔西仅7球

哈兰德4场9球,在球队进球榜排次席的利物浦&切尔西仅7球

直播吧
2024-09-15 00:37:16
国足惜败沙特后伊万点燃三把火,韦世豪重返国家队,王大雷遭弃用

国足惜败沙特后伊万点燃三把火,韦世豪重返国家队,王大雷遭弃用

阿牛体育说
2024-09-15 00:14:52
055舰率队开进日本海!看到编队阵容后,日本:你管这叫演习?

055舰率队开进日本海!看到编队阵容后,日本:你管这叫演习?

小lu侃侃而谈
2024-09-13 21:28:26
国家一级演员,当了院长比西门庆玩的还花,潜规则女演员、画家

国家一级演员,当了院长比西门庆玩的还花,潜规则女演员、画家

叙说
2023-10-01 10:00:03
笑喷了!张兰说自己要参加《花儿与少年》,吓得官方连忙置顶回复

笑喷了!张兰说自己要参加《花儿与少年》,吓得官方连忙置顶回复

十原故里
2024-09-14 16:21:30
印度越赔越大,恐退出金砖国家,中国不想挽留,只怪印度野心太大

印度越赔越大,恐退出金砖国家,中国不想挽留,只怪印度野心太大

大宗看萌宠
2024-09-14 23:51:44
被西方制裁三年,还有俄罗斯精英看不上中企投资,被普京当场驳斥

被西方制裁三年,还有俄罗斯精英看不上中企投资,被普京当场驳斥

历史微鉴
2024-09-14 23:40:19
震惊!美国性感网红收入狂甩NBA球星,OnlyFans平台就赚66亿美金

震惊!美国性感网红收入狂甩NBA球星,OnlyFans平台就赚66亿美金

国际情爆猿
2024-09-14 02:41:55
暴雨!大暴雨!节前晚高峰!四川人今天请注意→

暴雨!大暴雨!节前晚高峰!四川人今天请注意→

自贡市消防救援支队
2024-09-14 19:38:17
中国模拟兵推结果出炉,解放军三轮导弹齐射,摧毁美军航母打击群

中国模拟兵推结果出炉,解放军三轮导弹齐射,摧毁美军航母打击群

文雅笔墨
2024-09-14 23:41:45
突发地震!多地网友称在床上被晃醒!已监测到8次余震……

突发地震!多地网友称在床上被晃醒!已监测到8次余震……

极目新闻
2024-09-14 08:28:54
五重暴击之下,“疯狂小杨哥”还能翻身吗?

五重暴击之下,“疯狂小杨哥”还能翻身吗?

上游新闻
2024-09-13 19:42:24
太炸裂!福建一家长在群内曝光多段不雅视频,涉及多名学生妈妈

太炸裂!福建一家长在群内曝光多段不雅视频,涉及多名学生妈妈

阿纂看事
2024-09-14 16:41:09
美对我国电动汽车加征关税100% 律师:我国可对美加征报复性关税

美对我国电动汽车加征关税100% 律师:我国可对美加征报复性关税

吴国雄走私辩护律师
2024-09-14 19:45:35
库尔斯克战役惨败!乌军全军覆没,泽连斯基还能撑多久?

库尔斯克战役惨败!乌军全军覆没,泽连斯基还能撑多久?

知鉴明史
2024-09-13 17:05:03
当“硅胶脸”混进《中餐厅8》,撞上天然脸演员,简直是降维打击

当“硅胶脸”混进《中餐厅8》,撞上天然脸演员,简直是降维打击

娱乐八卦木木子
2024-09-14 14:48:43
美国对华关税正式生效!一场美国大选闹剧,美贸易代表被嘲笑

美国对华关税正式生效!一场美国大选闹剧,美贸易代表被嘲笑

美人茶话会
2024-09-15 00:19:02
才知道,华为专卖店把三折叠屏样机罩住是有原因的,引起热议!

才知道,华为专卖店把三折叠屏样机罩住是有原因的,引起热议!

奇特短尾矮袋鼠
2024-09-13 13:50:10
2024-09-15 01:06:44
机器之心Pro
机器之心Pro
专业的人工智能媒体
9461文章数 142009关注度
往期回顾 全部

科技要闻

华为三折叠,炸出570万"黄牛"

头条要闻

媒体:62岁周铁根被查 其施政经历在江苏官场上属少见

头条要闻

媒体:62岁周铁根被查 其施政经历在江苏官场上属少见

体育要闻

男篮这俩18岁黑小伙,可真别吹了……

娱乐要闻

陆虎陈曌旭婚礼现场照 中式婚服太唯美

财经要闻

美提高部分中国商品的301关税 中方回应

汽车要闻

再上昆仑 全新福特探险者上市 售30.98万元起

态度原创

健康
教育
手机
游戏
艺术

炉甘石洗剂,凭啥成了止痒全能王?

教育要闻

北京香山论坛·高端访谈|上合组织副秘书长:上合组织积极应对新风险、新挑战

手机要闻

华为HarmonyOS NEXT将于9月底推出正式版 不再兼容安卓

玩家通关《星战亡命徒》打5.5分:重复性高且颇受局限

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

无障碍浏览 进入关怀版