网易首页 > 新闻中心 > 新闻 > 正文

火山引擎大模型应用防火墙发布,提供All in One安全防护能力

0
分享至

(原标题:火山引擎大模型应用防火墙发布,提供All in One安全防护能力)

当前,以大模型为代表的人工智能迅猛发展,极大提升生产力的同时,也给全球网络安全、数字安全领域带来全新的挑战。在此背景下,企业在落地AI业务时,应如何保证自身的网络安全?

为此,火山引擎推出大模型应用防火墙,为大模型推理提供 All in One 的安全防护能力,实现从“被动防御”到“主动对抗”的跨越式升级,降低由模型攻击、推理服务滥用、系统权限突破带来的安全风险。

据了解,大模型应用防火墙能够有效抵御算力DDoS 攻击,消除发生率约30%的恶意tokens 消耗风险;通过防范提示词注入攻击,使敏感数据泄露事件发生率降低70%;同时降低模型滥用、幻觉、回复不准确的发生率90%以上,并严格满足输入输出合规要求,将不良信息输出率控制在5%以内。

在大模型应用防火墙建设的过程中,火山引擎根据攻防实践,构建起了用户接入层、智能体层、服务/业务层、模型推理层、模型训练层等五层威胁模型,基于底层攻击逻辑,总结有针对性的对抗技术。

图片1.png

提示词拼接注入攻击分析图

例如企业在面对提示词拼接注入攻击时,攻击者操纵LLM的prompt工程技术,通过分工协作的“越狱 Prompt”+“恶意诱导 Prompt”,绕过平台和模型原生安全机制,诱导模型生成恶意内容。

对于这种绕过模型内容安全机制的攻击场景,大模型应用防火墙采用意图识别、防提示词注入、动态对抗与价值观校准等多重防护机制,实现以AI能力对抗AI攻击,大幅提升了大模型的安全性。

经实践结果反馈,通过深度上下文引擎,防火墙可识别97%的隐式攻击,并基于千万级对抗样本训练,覆盖20+提示词攻击场景,检出率达99%+;同时,经某大模型服务平台实测,违规内容及价值观偏移回答均下降98%。轻量化架构则可在100ms内即完成风险拦截,误判率较行业低一倍。

再如,在企业经常面对的聊天数据窃取攻击场景下,防火墙也发挥出非常实用的效果。对于企业来说,AI智能化应用无疑是业务数据的“处理厂”,攻击者可以通过间接提示词注入的攻击方式,诱导大模型绕过智能体自身的防护机制,索取如用户对话数据等敏感信息。

图片2.png

数据窃取攻击分析图

而对于数据窃取攻击,大模型应用防火墙在提供注入攻击对抗外,还通过RAG数据加密/替换、模型计算环境安全性提升,访问识别等方式,降低数据泄露风险。

经实践结果显示,采用“深度学习小模型+大模型”的技术方案,对敏感数据进行脱敏/替换/占位处理,可降低96%的敏感信息泄露风险;另外,防火墙会将经过精调的提示词注入防护模型,以应对指令劫持、角色扮演、反向诱导等数十种攻击。

而与私密云计算方案结合,则可以进一步保护RAG知识库、系统提示词等核心数据,确保即使这些数据被窃取,攻击者也无法解密,从而使注入攻击拦截率达到99%。通过实时动态脱敏模块,使防火墙可以对用户对话信息进行字段级加密,数据泄露风险降低98%。针对插件攻击,智能流量监测则可识别系统内异常的外联请求,阻断未授权访问。

除此之外,系统权限攻击,也是企业在日常运营中经常遭遇的攻击手段。攻击者通过 AI 智能体的人机交互页面,实现基于 SQL 注入、RCE 提权等专业化攻击,篡改业务数据、远程命令执行、模型供应链投毒、基于反弹 shell 攻击控制底层系统,严重危害企业核心业务安全。

图片3.png

系统权限攻击分析图

而火山引擎推出的大模型应用防火墙,首先能识别固定规则的攻击代码、恶意攻击意图,同时还能应对攻击者诱导大模型自己总结和生成的攻击代码,抵御模型输入的恶意提示词攻击,同类攻击拦截率可达95%+。

不仅如此,防火墙还能在大模型对话链路中判断 UserPrompt 中是否包含攻击行为,如有,则拦截请求,从源头处切断威胁。

此外,防火墙还会对Agent行为进行全方位的检测,观察Agent调用的RAG、Tool等外部返回数据中是否包含间接注入攻击,规避模型生成的任务和代码中可能包含的威胁。而在大模型应用发布时,则检测 SystemPrompt/LLM Response 中是否包含恶意内容,如存在,则拒绝应用发布。

最后,当面对堪称“网络安全顽疾”的DDoS攻击时,考虑到新型的算力DDoS攻击,可利用大模型的推理能力将算力耗尽;同时推理服务盗用“薅羊毛”同样是DDoS 攻击之外的另一个典型威胁,导致算力资源可能被恶意窃取,因此大模型应用防火墙通过算力资源熔断和建立相应检测模型等方式,并通过针对性的技术迭代和策略适配,构建了新型的智能体算力防护体系。

图片4.png

可用性攻击分析图

首先,基于用户行为链分析引擎,防火墙可识别90%的自动化“薅羊毛”行为。而动态资源熔断机制则实时监控算力消耗,使无效资源调用减少80%,且效果已在实践中得到验证。在帮助某头部大模型厂商抵御黑灰产破解转售应用API时,成功规避算力损失40%以上。

火山引擎表示,未来将持续构建包括大模型应用防火墙的全面智能化防御策略与服务,致力于为企业大模型应用落地,开辟安全可信的推理空间。

相关推荐
热点推荐
上海女子19万元购“德国造”入户门 付款近一年后仍未收到货|云投诉

上海女子19万元购“德国造”入户门 付款近一年后仍未收到货|云投诉

封面新闻
2025-03-25 19:46:05
隐瞒了我们14年!原来金晨的亲生父亲竟是他,难怪女儿能大红大紫

隐瞒了我们14年!原来金晨的亲生父亲竟是他,难怪女儿能大红大紫

星辰生肖馆
2025-03-25 06:10:09
全运会爆大冷:男单全国冠军0-4惨败,钱天一惊险,向鹏剃光头

全运会爆大冷:男单全国冠军0-4惨败,钱天一惊险,向鹏剃光头

知轩体育
2025-03-26 15:32:32
赛力斯,大消息!超80亿元

赛力斯,大消息!超80亿元

中国基金报
2025-03-26 14:18:44
阿根廷4-1巴西,赛后评分:不是维尼修斯第一,阿根廷8号排第一

阿根廷4-1巴西,赛后评分:不是维尼修斯第一,阿根廷8号排第一

侧身凌空斩
2025-03-26 09:59:24
潮汕一孙女怕78岁爷爷无聊给他买了两头猪:猪被养得干净粉嫩,享受和孙女一样的待遇

潮汕一孙女怕78岁爷爷无聊给他买了两头猪:猪被养得干净粉嫩,享受和孙女一样的待遇

潇湘晨报
2025-03-25 14:45:08
高血压疫苗要上市?打一针就不用再吃降压药?看看医生咋回答

高血压疫苗要上市?打一针就不用再吃降压药?看看医生咋回答

奇妙的本草
2025-03-26 00:00:09
“壹号土猪肉”的“壹号土”是注册商标?公司回应:用于旗下系列产品

“壹号土猪肉”的“壹号土”是注册商标?公司回应:用于旗下系列产品

上游新闻
2025-03-26 12:03:26
1-4!巴西惨遭双杀 创造25年耻辱 阿根廷提前直通世界杯 万人狂欢

1-4!巴西惨遭双杀 创造25年耻辱 阿根廷提前直通世界杯 万人狂欢

侃球熊弟
2025-03-26 09:34:42
比恒大还惨!中国第二大民企倒了,负债7500亿,创始人被带走

比恒大还惨!中国第二大民企倒了,负债7500亿,创始人被带走

影史侃谈
2025-03-16 22:40:07
李晟浪姐6排名断层第一,本人还是懵的,老公李佳航应援成亮点

李晟浪姐6排名断层第一,本人还是懵的,老公李佳航应援成亮点

涟漪读史
2025-03-26 16:44:31
张雨霏,获新职

张雨霏,获新职

政知新媒体
2025-03-25 18:08:45
《棋士》爆了,我想说:但凡王宝强拉跨点,都压不住这群王炸配角

《棋士》爆了,我想说:但凡王宝强拉跨点,都压不住这群王炸配角

追风小狗
2025-03-26 16:35:20
蔚来李斌:去年我们花3亿美元买了80万颗英伟达芯片

蔚来李斌:去年我们花3亿美元买了80万颗英伟达芯片

芯榜
2025-03-25 08:58:45
“山西订婚强奸案”男方拒绝缓刑,目前这个案子,法院极其难办

“山西订婚强奸案”男方拒绝缓刑,目前这个案子,法院极其难办

泸沽湖
2025-03-26 11:22:01
纸团砸中私家车赔偿7000元?社区:湿水纸团砸凹车盖

纸团砸中私家车赔偿7000元?社区:湿水纸团砸凹车盖

南方都市报
2025-03-25 18:33:13
周薪5.5万镑英媒:迪亚斯给利物浦下最后通牒,不涨薪就离队

周薪5.5万镑英媒:迪亚斯给利物浦下最后通牒,不涨薪就离队

直播吧
2025-03-26 16:19:40
越闹越大!“亚亚在台湾”老公首度露面,喊话内政部:暂停驱离。

越闹越大!“亚亚在台湾”老公首度露面,喊话内政部:暂停驱离。

趣文说娱
2025-03-25 16:03:21
人民日报转发!赤岭小孩哥生存概率不足25%,三大因素成就此壮举

人民日报转发!赤岭小孩哥生存概率不足25%,三大因素成就此壮举

奇思妙想草叶君
2025-03-25 22:43:16
周继红,退休

周继红,退休

新京报政事儿
2025-03-26 16:55:17
2025-03-26 18:16:49

头条要闻

泽连斯基:美国已被俄罗斯操纵 世界不信任俄罗斯

体育要闻

冯潇霆:我们这代人,离世界杯就差一点

娱乐要闻

陈慧琳,撕下了“李湘杨幂”的假面具

财经要闻

万科王石返贫,一把年纪还为生活奔波

科技要闻

传比亚迪2025年全年销量目标550万辆

汽车要闻

搭载千里浩瀚智驾 旗舰大六座领克900预售33万起

态度原创

家居
游戏
本地
艺术
时尚

家居要闻

艺术时尚 独特差异魅力

童年回忆《英雄无敌3》经典归来?《英雄无敌》新作试玩公开

本地新闻

多少年轻人生活的乐子,是国产现偶给的

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

越简单越高级,中年女人的2个“穿搭要点”,学会了时髦优雅

×