世界数字科学院(WDTA)在联合国日内瓦总部正式发布全球首个《AI智能体运行安全测试标准》,标志着AI智能体从技术探索迈向安全可控的规模化应用阶段。该标准由蚂蚁集团、清华大学、中 国电信牵头,联合普华永道、新加坡南洋理工大学等二十余家国内外机构共同编制,填补了智能体安全测试领域的国际空白。
智能体作为具备自主决策与执行能力的AI形态,其“跨语言墙”行为特性带来新型安全风险。标准首次构建全链路风险分析框架,将输入输出、大模型、RAG、记忆和工具五大关键链路与运行环境深度绑定,创新提出模型检测、网络通信分析、工具模糊测试等测试方法。例如,通过模拟用户连续追问等对抗场景,检验智能体在复杂交互中的安全防护能力,避免单轮测试导致的防御漏洞。
目前,标准已在金融、医疗等领域试点应用。蚂蚁集团基于该标准打造的“蚁天鉴”系统,可抵御单次50万量级的饱和攻击,确保政务场景中智能体决策的合规性。中国信通院同步启动的“可信AI智能体测试床”,进一步推动标准与产业实践深度融合。
这一标准的发布,不仅为全球AI治理提供了“中国方案”,更通过技术合规与产业应用的平衡,推动智能体从实验室走向千行百业,为构建安全可信的智能社会奠定基石。
版权声明:本文仅代表作者观点,不代表5G日报立场。
本文系作者授权5G日报发表,未经许可,不得转载。