[LG]《SoftInstructionDe-escalationDefe

爱生活爱珂珂 2025-10-28 10:16:22

[LG]《Soft Instruction De-escalation Defense》N P Walter, C Sitawarin, J Hayes, D Stutz... [CISPA Helmholtz Center for Information Security & Google DeepMind] (2025)

本文提出一种针对大语言模型（LLM）工具代理系统的迭代式提示注入防御机制——软指令控制（SIC）。该方法通过多轮检测和重写输入中的恶意指令，逐步清理潜在攻击指令，确保输入安全后才交给模型执行。核心思路是：

1. 在代理系统接收外部不可信数据前，先注入已知“控制指令”作为检测哨兵。

2. 对数据反复重写（掩码、重述或删除指令），防止恶意命令继续存在。

3. 多级检测（全文及分块检测）确认无指令后，清除占位符并交由模型处理。

4. 若检测到指令无法清除，系统则中断执行以保障安全。

该方案不修改模型本体，作为前置模块独立运行，兼顾安全与实用性。实验证明，SIC在多种主流模型及复杂攻击场景下均实现了近乎零的攻击成功率（ASR），且对正常任务性能影响极小。相比现有检测类防御，SIC更难被绕过，显著提升了系统安全门槛。

但论文也坦承SIC不是万无一失。面对极强适应性攻击，仍有15%的攻击成功率，主要因攻击者利用非命令式结构化任务描述或权威式语言绕过检测。未来防御需结合全局上下文和工具调用动态理解，提升对复杂攻击的识别能力。

总结：SIC提供了一种简单、轻量、模块化的迭代式提示注入清洗机制，有效降低了工具代理系统被恶意指令操控的风险，是当前实用且有前景的防御策略。

原文链接：arxiv.org/abs/2510.21057

安全大语言模型提示注入人工智能安全 LLM PromptInjectionDefense

0 阅读：0

爱生活爱珂珂

感谢大家的关注

作者最新文章

1

如何打造一个AI智能体？ ——来自Dhanian的实用拆解1️⃣ 定义目标与环

2

《What Makes 5% of AI Agents Actually Wor

3

Nanonets-OCR2：颠覆传统OCR，智能将文档转为结构化Markdown

4

François Chollet 提出：智能思考的关键步骤是“观察 → 得出结论

5

《Just Talk To It - the no-bs Way of Agen

6

[LG]《How Reinforcement Learning After Ne

7

[LG]《Representation-Based Exploration fo

8

晚安～ [月亮] 晚安

9

《爱可可微博热门分享(10.14)》

10

Naveen Naidu彻底从Claude Code转向了Codex，分享日常工

热门分类

科技TOP

1

这是做什么工作的？电脑上也看不懂

2

我预感红米k90可能会卖爆！这外观设计颜值一点不输小米17系列，再加上旗舰级别

3

老美开心了，终于让英伟达倒闭了！刚刚英伟达总裁黄仁勋对外宣布：中方市场份额降

4

华为Mate80会在2025年11月发布，大家最关心的是它用的芯片，麒麟9030

5

陈奕迅将现身K90发布会今晚陈奕迅会携新版《K歌之王》空降K90系列发布会现场，

6

中国移动你是良心发现了吗？中国移动你是良心发现了吗？18年的老用户了，每个月就

7

这下你用iPhone的控制中心不会迷茫了。

8

估计不止刘强东和雷军就连马云也发懵了于东来最近这是怎么了，他竟然又说50万元3小

9

10月份即将发布的新手机，看看有没有你喜欢的？

10

华为Mate70Pro在某多多上面百亿补贴的价格才四千多？敢不敢买？看上m

科技最新文章

1

雷军的两位得力女助手，小米两位女副总裁许斐和张剑慧，学历和履历差距太大。许斐是清

2

3K预算能买到好用的平板嘛？最近想换平板，预算就卡在3K左右，本来想着看看

3

柔光屏的含金量此刻具象化了！之前在宿舍用旧平板的时候真的太难受了！顶灯一照，屏

4

即将开启11月中端影像机大战！OPPO、vivo、荣耀两亿像素普及！！三款

5

据说下个月华为Mate80就要发布了，麒麟9030芯片，使用了类似5nm的制造工

6

华为当年的一个部门做变频器，觉得利润低没前途，于是放弃了。后来那波人，慢慢搞慢慢

7

继小米手机智能工厂、小米汽车超级工厂后，小米第三座大型智能工厂小米智能家电工厂正

8

我好像突然想明白了，为什么有些APP打死都不适配鸿蒙，或者适配得磨磨唧唧的。从鸿

9

一加Ace6价格正式公布，价格如下，12+256259916+256

10

全世界最先进的芯片企业，美国高通公司和英伟达公司，先后都被中国进行了制裁或者立案