# Is Robustness the Cost of Accuracy 读书报告

Is Robustness the Cost of Accuracy 读书报告

论文链接:https://arxiv.org/abs/1808.01688v1
源代码地址:https://github.com/huanzhang12/Adversarial_Survey

简介

在图像分类领域,深度学习模型已经得到了广泛的应用,并且取得了卓越的性能。分类的准确度长期以来都是评价图像分类模型性能的最核心甚至唯一标准。但最近研究表明,即使是充分训练好的深度神经网络模型也很容易被对抗攻击算法攻破。所以模型的鲁棒性应该作为除了准确率之外的另一个重要的指标

由此就有一个重要的命题被提出了:模型的准确性和鲁棒性之间是否存在关联?会有什么样的关联?这也是本论文重点关注的问题。

研究内容

论文中选取了基于 ImageNet 的 18 个模型进行具体的实验,用于评估这些模型的鲁棒性以及与准确率之间的关系。

18个模型

模型鲁棒性的评估

为了合理的衡量模型的鲁棒性,总体上使用两种方式来进行评估。

  1. adversarial attacks
  2. attack-agnostic approaches

第一种方式就是选取某种特定的对抗攻击方式,如 FGSM, C&W 等,对模型进行攻击,然后找出其最小的攻击扰动大小,从而计算得到最小的对抗距离。这种方法是对模型鲁棒性的上边界的估计。

第二种方法采用一种更加泛化的方式对模型本身的鲁棒性进行评估,而不依赖于特定攻击。本文中使用的就是 CLEVER score。该方法基于局部利普希兹常数和极值定理对模型鲁棒性下边界进行估计。

鲁棒性评估的相关指标

  1. Attack success rate 攻击成功率
  2. Distortion 攻击扰动大小
  3. CLEVER score
  4. Transferability 攻击的迁移性

这里具体阐述一下论文中这些指标的测量方式。

首先攻击成功率是通过利用多种对抗攻击方式,并且限制攻击中扰动参数的大小来实现的。比如使用 FGSM,显示其扰动大小参数为 0.1 0.2 0.5 从而可以分别得到不同扰动范围下的攻击成功率。

攻击扰动大小指的就是成功实现某一攻击所需要的扰动的大小。其中使用 l2 和 l-infinite 参数作为距离的衡量。在扰动大小评估中,使得对抗攻击能够 100% 成功,并且通过二分搜索的方法找到最小的扰动参数的限制。

而对于对抗样本的迁移性的,文中使用各模型生成的对抗样本去分别攻击其他模型从而得到每一种模型对于迁移攻击的抵抗性和适应能力。

实验结果

这里截取部分代表性的图表展示。包括攻击成功率,攻击扰动大小,以及模型迁移性的一些分析。


各模型攻击成功率和攻击扰动距离
准确率与扰动距离之间的关系
用第 i 行模型生成的对抗样本攻击第 j 列的模型的成功率

结论

通过对这18个模型的大量实验和分析,可以得到以下几个重要结论:

  1. 生成对抗样本的扰动大小与模型分类错误率的对数值呈线性关系。由此可以说明模型的鲁棒性是提升模型性能时必须加以考量的一个指标。
  2. 模型结构比模型的大小对鲁棒性的影响更大
  3. 论文研究了对抗样本的迁移性,发现 VGG 生成的对抗样本的迁移性较好,而其他的模型生成的对抗样本基本只适用于同类的网络。

总结

本文最大的贡献应该是对大量的DNN模型做了大量的实验,并且对准确率和鲁棒性之间的关系进行了探究,这是之前未曾有人做过的。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 2018-4-9 为自己祷告: 挪去今生骄傲! 【经文】 不要为明日自夸, 因为一日要生何事,你尚且不能知道。 (...
    Nancy荣美阅读 3,283评论 0 0
  • 快乐是什么?对我来说,快乐是可以随时玩,不用考试、做作业,没有补习班,那样,便是天堂。大人们的快乐是什么呢?是钱吗...
    透明湖畔阅读 155评论 1 1
  • 重逢 文/一树繁花 一个熟悉的背影 总在茫茫人海闪现 一个似曾相识的笑容 总在晃然之间 出现在陌生的面孔...
    一树繁花_649d阅读 165评论 0 0
  • 时间:2016.7.25晚 进度:p1-19第一章 别当了主持人就不是人了 书摘: 感悟: “你关心的都是你自己,...
    喜欢豆豆的小苏打阅读 282评论 0 0

友情链接更多精彩内容