overfeat
play

OverFeat Integrated Recogni.on, Localiza.on and Detec.on - PowerPoint PPT Presentation

OverFeat Integrated Recogni.on, Localiza.on and Detec.on using Convolu.onal Networks Sermanet et. al Presenta.on by Eric Holmdahl Roadmap 1. Goal 2. Background


  1. OverFeat ¡ Integrated ¡Recogni.on, ¡Localiza.on ¡and ¡Detec.on ¡using ¡ Convolu.onal ¡Networks ¡ Sermanet ¡et. ¡al ¡ Presenta.on ¡by ¡Eric ¡Holmdahl ¡

  2. Roadmap ¡ 1. Goal ¡ 2. Background ¡ 3. Related ¡Work ¡ 4. Algorithm ¡Overview ¡ 5. Breakdown ¡By ¡Task ¡ 1. Classifica.on ¡ 2. Localiza.on ¡ 3. Detec.on ¡

  3. Goal ¡ Perform ¡classifica.on, ¡localiza.on, ¡and ¡ detec.on ¡on ¡the ¡ImageNet ¡Dataset ¡

  4. Classi3ication ¡ Determining ¡what ¡is ¡the ¡main ¡object ¡in ¡an ¡image ¡

  5. Localization ¡ • Determining ¡where ¡an ¡object ¡is ¡located ¡in ¡an ¡image ¡

  6. Detection ¡ • Performing ¡localiza.on ¡for ¡all ¡objects ¡present ¡in ¡an ¡image ¡

  7. Background: ¡Feed ¡Forward ¡Neural ¡ Networks ¡

  8. Background: ¡Convolutional ¡Nets ¡ • Alterna.ng ¡convolu.on ¡and ¡max ¡pooling ¡layers ¡feed ¡into ¡fully ¡ connected ¡neural ¡net ¡ • Max ¡pooling: ¡with ¡window ¡size ¡kxk, ¡outputs ¡highest ¡intensity ¡value ¡ in ¡window ¡size ¡ • Convolu.on: ¡Scanning ¡window, ¡shared ¡weights ¡within ¡window ¡

  9. ¡ ¡ Related ¡Work ¡

  10. Krizhevsky ¡et. ¡Al: ¡ ImageNet ¡ Classi-ication ¡With ¡Deep ¡Convolutional ¡ Neural ¡Networks ¡

  11. Review: ¡Krizhevsky ¡ Architecture ¡ • Large ¡CNNs ¡used ¡to ¡densely ¡process ¡images ¡with ¡overlapping ¡ windows ¡ • ReLU ¡Nonlinear ¡neuron ¡output ¡ • DropOut ¡

  12. Krizhevksy ¡Results ¡ • Brought ¡CNNs ¡to ¡forefront ¡of ¡classifica.on/localiza.on/ detec.on ¡problem ¡

  13. Giusti ¡et. ¡al: ¡ Fast ¡Image ¡Scanning ¡With ¡ Deep ¡Convolutional ¡Networks ¡ ¡

  14. Giusti ¡Fast ¡Scanning ¡ • Problem: ¡CNNs ¡perform ¡a ¡great ¡deal ¡of ¡ redundant ¡compu.ng ¡of ¡convolu.ons ¡ due ¡to ¡overlapping ¡patches ¡ • Solu.on: ¡Apply ¡convolu.on ¡to ¡en.re ¡ image ¡at ¡once! ¡

  15. Giusti ¡et. ¡al: ¡ Fast ¡Image ¡Scanning ¡ With ¡Deep ¡Convolutional ¡Networks ¡ Convolu.onal ¡Layer: ¡ ¡ ¡ ¡ ¡ ¡ Max ¡Pooling ¡Layer: ¡

  16. Giusti ¡et. ¡al: ¡ Fast ¡Image ¡Scanning ¡ With ¡Deep ¡Convolutional ¡Networks ¡ ¡

  17. Giusti ¡et. ¡al: ¡Results ¡ Provides ¡massive ¡improvements ¡in ¡speed ¡for ¡sliding ¡window ¡CNNs! ¡

  18. Algorithm ¡Overview ¡

  19. Algorithm ¡Overview: ¡Training ¡ Train ¡ Train ¡Classifier ¡ Localiza.on ¡ Regressor ¡

  20. Algorithm ¡Overview: ¡Training ¡ Train ¡ Train ¡Classifier ¡ Localiza.on ¡ Regressor ¡

  21. Algorithm ¡Overview: ¡Training ¡ Train ¡ Train ¡Classifier ¡ Localiza.on ¡ Regressor ¡

  22. Algorithm ¡Overview: ¡Training ¡ Train ¡ Train ¡Classifier ¡ Localiza.on ¡ Regressor ¡ • Input: ¡Images ¡with ¡classifica.on ¡and ¡bounding ¡box ¡ • Training ¡objec.ve: ¡Minimize ¡l2 ¡norm ¡between ¡ generated ¡bounding ¡box ¡and ¡ground ¡truth ¡ • One ¡regressor ¡generated ¡for ¡each ¡possible ¡image ¡ class ¡ • Output: ¡(x,y) ¡coordinates ¡of ¡top ¡le[, ¡top ¡right ¡corner ¡ of ¡bounding ¡box ¡ ¡ ¡

  23. Algorithm ¡Overview: ¡Runtime ¡ 1. ¡Perform ¡classifica.on ¡at ¡each ¡loca.on ¡using ¡trained ¡CNN ¡ ¡

  24. Algorithm ¡Overview: ¡Runtime ¡ 2. ¡Perform ¡localiza.on ¡on ¡all ¡classified ¡regions ¡generated ¡by ¡classifier ¡

  25. Algorithm ¡Overview: ¡Runtime ¡ 3. ¡Merge ¡bounding ¡boxes ¡with ¡sufficient ¡overlap ¡from ¡localiza.on ¡and ¡ sufficient ¡confidence ¡of ¡being ¡same ¡object ¡from ¡classifier ¡

  26. Breakdown ¡By ¡Task ¡

  27. Classi3ication ¡

  28. OverFeat ¡Feature ¡Extraction ¡ • First ¡5 ¡layers ¡of ¡Deep ¡Convolu.onal ¡Neural ¡Net: ¡similar ¡to ¡ Krizhevsky’s ¡ • Images ¡downsampled ¡to ¡256x256 ¡ • No ¡contrast ¡normaliza.on, ¡non-­‑overlapping ¡pooling ¡

  29. OverFeat ¡Classi3ication: ¡Dense ¡ Sliding ¡Window ¡

  30. Multi-­‑Scale ¡Classi3ication ¡ • Classifica.on ¡performed ¡at ¡6 ¡scales ¡at ¡test ¡.me, ¡but ¡only ¡1 ¡ scale ¡at ¡run.me ¡ • Increases ¡robustness ¡of ¡model ¡

  31. Classi3ication: ¡CNNs ¡and ¡Sliding ¡ ConvNets for Detection Windows ¡ ● Single output: ○ 1x1 output ○ no feature space ○ blue: feature maps ○ green: operation kernel ○ typical training setup OverFeat • Pierre Sermanet • New York University

  32. Classi3ication: ¡CNNs ¡and ¡Sliding ¡ ConvNets for Detection Windows ¡ ● Multiple outputs: ○ 2x2 output ○ input stride 2x2 ○ recompute only extra yellow areas OverFeat • Pierre Sermanet • New York University

  33. Classi3ication: ¡CNNs ¡and ¡Sliding ¡ ConvNets for Detection Windows ¡ ● With feature space ○ 3 input channels ○ 4 feature maps ○ 2 feature maps ○ 4 feature maps ○ 2 outputs (e.g. 2-class classifier) OverFeat • Pierre Sermanet • New York University

  34. Classi3ication: ¡Results ¡

  35. Localization ¡

  36. Training ¡Localizer ¡ • Use ¡same ¡first ¡5 ¡layers ¡as ¡trained ¡classifier ¡ • Remove ¡fully ¡connected ¡layers, ¡replace ¡with ¡regressor ¡ • Train ¡again ¡on ¡labeled ¡input ¡with ¡bounding ¡boxes ¡

  37. Localization: ¡Fully ¡Connected ¡ Layers ¡

  38. Localization: ¡Bounding ¡Boxes ¡ Produced ¡By ¡Regression ¡

  39. Localization: ¡Combing ¡ Predictions ¡ Algorithm: ¡

  40. Localization: ¡Results ¡

  41. Detection ¡

  42. ImageNet Challenge 2013 ● Detection: ○ 200 classes ○ Smaller objects than classification/localization ○ Any number of objects (including zero) ○ Penalty for false positives OverFeat • Pierre Sermanet • New York University

  43. Differences ¡Between ¡Detection ¡ and ¡Location ¡ • Can ¡now ¡have ¡many ¡objects ¡instead ¡of ¡just ¡ one ¡ • Penalized ¡for ¡incorrect ¡guesses ¡ • Need ¡to ¡dis.nguish ¡background ¡from ¡ objects ¡

  44. Training ¡Detector ¡ • Almost ¡iden.cal ¡to ¡classifica.on/ localiza.on ¡training ¡ • New ¡class ¡added ¡– ¡background ¡ • Background ¡class ¡updated ¡on ¡the ¡fly: ¡ extremely ¡incorrect ¡classifica.ons ¡are ¡ used ¡to ¡train ¡background ¡class ¡

  45. Detection ¡Results ¡

  46. Conclusion ¡ OverFeat ¡provides ¡a ¡way ¡to ¡extract ¡powerful ¡CNN ¡based ¡ features ¡for ¡image ¡classifica.on, ¡localiza.on ¡and ¡detec.on ¡with ¡ high ¡speed ¡and ¡precision ¡

  47. Thanks! ¡

More recommend