-
标题
-
简介
《LLM越狱攻击预防与框架 v3.3》系统梳理了大语言模型从指令注入到多模态对抗、表征工程到智能体工具滥用的全部越狱路径,配套可落地的防御体系(对齐-检测-沙箱-监控)。文档以威胁模型为纲,将攻击按提示工程、输出结构、优化、模糊、组合、MCP滥用六大类拆解,并提供测试脚本与红队演练方案,帮助安全团队在模型全生命周期内快速定位脆弱点、迭代加固。适用于AI产品、红队及合规审计人员。
-
提示本站仅做资料的整理和索引,转载引用请注明出处
相关推荐
-
2016-09-05 14:11:46
-
2025-09-04 13:15:29.470073
-
2025-08-10 12:58:21.769108
-
2016-02-26 15:54:26
附件下载
-
LLM越狱攻击与防御框架_v3.3_20250608_from_freedemon.pdf