从内容合规到行为可控的智能体治理思路

2026年4月17日

29

534

深信服受邀分享AI智能体安全治理'新解法'

在2026年世界互联网大会亚太峰会上,深信服副总裁杜智伟围绕AI智能体的安全治理发表了题为“从'内容合规'到'行为可控',智能体失控风险下的AI治理范式重构”的演讲,提出面向自治智能体的全新治理思路。

智能体能力演进与风险分类

演讲指出,第三代数字员工类智能体已具备长程自主规划、环境感知和跨系统操作能力,核心风险可归为权限滥用、高级提示注入攻击和涌现行为导致的逻辑黑盒问题,传统以内容合规为核心的治理已不足以应对。

治理范式的转型路径

建议从被动的内容审查转向构建行为管控机制,包括细粒度权限控制、运行时行为监测、异常逆向溯源与可解释性增强,以确保智能体在复杂场景下的可控性与可问责性。

从'内容合规'向'行为可控'转型,是应对自治智能体失控风险的关键治理思路。

“小墨”

落地建议与实践

深信服提出结合技术手段与制度设计,推动建立行为级审计、沙箱验证、攻击演练与持续治理闭环,并强调产业协同以形成统一的规范与工具链。

面向未来的治理方向

随着智能体能力持续演进,治理体系需同步提升对复杂行为的检测与响应能力,推动形成以行为可控为核心、覆盖权限、提示与涌现行为防控的完整治理体系。

如有侵权,请联系删除。

Related Articles

联系我们 获取方案
小墨 AI