towards robust detection of adversarial examples
play

Towards Robust Detection of Adversarial Examples Tianyu Pang, - PowerPoint PPT Presentation

Towards Robust Detection of Adversarial Examples Tianyu Pang, Chao Du, Yinpeng Dong and Jun Zhu Department of Computer Science and Technology Tsinghua University TSAIL NeurIPS | 2018 Adversarial Examples From


  1. Towards Robust ¡Detection ¡of ¡Adversarial ¡Examples Tianyu Pang, Chao Du, Yinpeng Dong and Jun Zhu Department of Computer Science and Technology Tsinghua University TSAIL NeurIPS | ¡2018

  2. Adversarial ¡Examples ¡ From ¡Dong ¡et ¡al. ¡(CVPR ¡2018)

  3. We ¡Detect ¡Adversarial ¡Examples, ¡and ¡How? Design ¡new ¡detectors: • Kernel ¡density ¡detector ¡(Feinman ¡et ¡al. ¡2017) • LID ¡detector ¡(Ma ¡et ¡al. ¡ICLR ¡2018) ¡ • ……

  4. We ¡Detect ¡Adversarial ¡Examples, ¡and ¡How? Design ¡new ¡detectors: • Kernel ¡density ¡detector ¡(Feinman ¡et ¡al. ¡2017) • LID ¡detector ¡(Ma ¡et ¡al. ¡ICLR ¡2018) ¡ • …… Train ¡the ¡models ¡to ¡better ¡collaborate ¡with ¡existing ¡detectors

  5. Reverse ¡Cross ¡Entropy Cross-­‑Entropy ¡(CE): Reverse ¡Cross-­‑Entropy ¡(RCE): 1 " : ¡One-­‑hot ¡label 𝑆 " : ¡Reverse ¡label 3 3 3 3 3 3 3 3 3 {0, ¡0, ¡0, ¡ 1 , ¡0, ¡0, ¡0, ¡0, ¡0, ¡0} { 4 , ¡ 4 , ¡ 4 , ¡ 0 , ¡ 4 , ¡ 4 , ¡ 4 , ¡ 4 , ¡ 4 , ¡ 4 } car plane bird cat deer dog frog horse ship truck car plane bird cat deer dog frog horse ship truck 𝓜 𝑫𝑭 = −𝟐 𝒛 * 𝐦𝐩𝐡(𝐆) 𝓜 𝑺𝑫𝑭 = −𝑺 𝒛 * 𝐦𝐩𝐡(𝐆)

  6. The ¡RCE ¡Training ¡Method Phase ¡1: ¡Reverse ¡Training Training ¡the ¡model ¡by ¡minimizing ¡the ¡RCE ¡loss Phase ¡2: ¡Reverse ¡Logits Negating ¡the ¡logits ¡fed ¡to ¡the ¡softmax ¡layer ¡to ¡give ¡predictions

  7. Theoretical ¡Analysis Property ¡1: ¡Consistent ¡and ¡Unbiased When ¡the ¡training ¡error ¡ 𝜷 ⟶ 𝟏 , ¡the ¡prediction ¡tends ¡to ¡the ¡one-­‑hot ¡label ¡ Property ¡2: ¡Tighter ¡Bound The ¡difference ¡between ¡any ¡two ¡non-­‑maximal ¡elements ¡decreases ¡as ¡ 𝚷(𝜷 𝟑 )

  8. Experiments CE RCE t-­‑SNE ¡visualization ¡of ¡learned ¡features ¡on ¡CIFAR-­‑10

  9. Experiments AUC-­‑scores ¡( 𝟐𝟏 :𝟑 ) ¡on ¡adversarial ¡examples

  10. For ¡more ¡results ¡and ¡analyses, ¡please ¡come ¡ Poster: ¡Room ¡210 ¡& ¡230 ¡AB ¡ #11 Code: ¡https://github.com/P2333/RCE TSAIL NeurIPS | ¡2018

Recommend


More recommend