科技生活大侠阿里发布“AI安全诊断大师”,帮AI体检看病一条龙服务( 二 )


文章图片
“AI安全诊断大师”的可视化诊断结果界面
目前研究人员已经提出了不少对抗样本攻击方法 , 不同模型对于不同的攻击算法的防御能力表现也会不一样 , 因此对AI模型进行安全评估时 , 需要针对各种攻击算法进行独立评估 , 同时也有必要综合多个评估结果给出整体结论 。
为此 , “AI安全诊断大师”集成了目前业界常见的攻击算法 , 同时也在不断补充这一集合 。 对于目标模型 , 基于每种算法都能给出扰动量-识别率曲线以评估模型面对该算法攻击下的防御性能 , 综合了各种算法和各扰动量下的识别率给出最终安全性评估分值 。
以下是“AI安全诊断大师”分别处于Resnet50和VGG16中 , 在不同攻击下的鲁棒性表现 。 横轴是扰动的噪声强度 , 纵轴是模型识别准确率 , 每一条实曲线表示一种攻击方法 , 可以看出使用相同攻击方法时扰动强度越大则攻击成功率越高 , 导致模型识别准确率下降越多;而虚线是在每一个扰动强度下多种攻击方法下模型识别准确率的最小值组成的 , 表示模型在该扰动强度下的最低防御能力 。 因此 , 曲线下的面积可用于评估模型在各攻击方法和综合方法下的鲁棒性 。
科技生活大侠阿里发布“AI安全诊断大师”,帮AI体检看病一条龙服务
文章图片
“AI安全诊断大师”在不同攻击下的鲁棒性表现
除了对模型进行面对白盒攻击的安全评估之外 , 它还可以提供黑盒攻击实验并进行安全评估 。 就好比对于那些不方便“面诊”的“患者” , 只能提供API接口的AI服务 , “AI安全诊断大师”提供了多种黑盒查询攻击和迁移攻击的手段 , 只需要调用接口即可评测服务的安全性 。
对于模型的安全性能评估不是最终目标 。 “AI安全诊断大师”检测出算法服务的潜在安全风险后 , 还会提供针对恶意攻击的防火墙功能 , 通过算法对不同种类攻击的脆弱性程度 , 定制化提出防御升级的方案 。
下图是通过黑盒迁移攻击针对多个算法API进行实验后 , 绘制的成功率直方图报告 。 图中左侧部分是在输入样本中添加不同的随机噪声后 , 导致算法输出结果出错的比例 , 在大部分情况下各API都具备了较高的鲁棒性 , 右侧则是使用不同的对抗样本生成方法进行的攻击 , 其中白盒攻击成功率最高 , 而黑盒攻击下各API之间的成功率差别就非常明显了 , 也表示它们所用的模型在安全性上的差距 。
科技生活大侠阿里发布“AI安全诊断大师”,帮AI体检看病一条龙服务
文章图片
“AI安全诊断大师”给多个算法API出具的遭遇攻击的体检报告
“将多种攻击检测和对抗防御方法作为附加模块 , 可为AI模型部署前置服务 , 在不修改原模型的基础上 , 提升模型对于对抗样本攻击的防御性能 , 降低用户使用成本和风险 。 经过在色情、暴恐、敏感图像识别等多种内容安全服务上的测试 , ‘AI安全诊断大师’可将模型对外部攻击的有效防御能力整体提升40%以上 。 ”华棠说 。
王树徽评价:“阿里安全从整体层面考虑了人工智能安全的架构性漏洞 , 提出了‘安全基建’的构想和技术系统 。 在关键技术层面 , 集成了最新的AI攻防技术 , 充分考虑了人工智能安全攻防两端的应用需求 , 分析结果可解释性强 , 易于理解并指导实践 。 在实用层面 , 提供了一套切实可行、即插即用的解决方案 , 定制化提出防御升级方案 , 帮助广大人工智能技术实践者有效提高其算法系统的免疫力和安全水平 。 此外 , 阿里安全的新一代安全架构的应用成果也有望促进人工智能技术的发展和进步 , 为新一代人工智能的理论方法研究提供了支持 。 ”
目前阿里安全正在与相关部门、高校、企业一起参与人工智能安全标准的制定 , “AI安全诊断大师”作为优秀应用案例被收录于全国信息标准化技术委员会打造的《人工智能安全标准化白皮书(2019版)》 。
科技生活大侠阿里发布“AI安全诊断大师”,帮AI体检看病一条龙服务


推荐阅读