analysis of large scale visual recogni4on
play

Analysis of Large Scale Visual Recogni4on Fei-Fei Li and - PowerPoint PPT Presentation

Analysis of Large Scale Visual Recogni4on Fei-Fei Li and Olga Russakovsky Olga Russakovsky, Jia Deng, Zhiheng Huang, Alex Berg, Li Fei-Fei Detec4ng


  1. Analysis ¡of ¡Large ¡Scale ¡Visual ¡ Recogni4on ¡ Fei-­‑Fei ¡Li ¡and ¡Olga ¡Russakovsky ¡ Olga ¡Russakovsky, ¡Jia ¡Deng, ¡Zhiheng ¡Huang, ¡Alex ¡Berg, ¡Li ¡Fei-­‑Fei ¡ Detec4ng ¡avocados ¡to ¡zucchinis: ¡what ¡have ¡we ¡done, ¡and ¡where ¡are ¡we ¡going? ¡ ICCV ¡2013 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ h"p://image-­‑net.org/challenges/LSVRC/2012/analysis ¡

  2. Backpack ¡

  3. Strawberry ¡ Flute ¡ Traffic ¡light ¡ Backpack ¡ Matchs4ck ¡ Bathing ¡cap ¡ Sea ¡lion ¡ Racket ¡

  4. Large-­‑scale ¡recogni>on ¡

  5. Large-­‑scale ¡recogni>on ¡ Need ¡benchmark ¡datasets ¡

  6. PASCAL ¡VOC ¡2005-­‑2012 ¡ 20 ¡object ¡classes ¡ ¡22,591 ¡images ¡ Classifica>on: ¡person, ¡motorcycle ¡ Detec4on ¡ Segmenta4on ¡ Person ¡ Motorcycle ¡ Ac>on: ¡riding ¡bicycle ¡ Everingham, ¡Van ¡Gool, ¡Williams, ¡Winn ¡and ¡Zisserman. ¡ The ¡PASCAL ¡Visual ¡Object ¡Classes ¡(VOC) ¡Challenge. ¡IJCV ¡2010. ¡

  7. ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ Large ¡Scale ¡Visual ¡ Recogni4on ¡Challenge ¡(ILSVRC) ¡2010-­‑2012 ¡ 20 ¡object ¡classes ¡ ¡22,591 ¡images ¡ 1000 ¡object ¡classes ¡ ¡1,431,167 ¡images ¡ Dalma4an ¡ h"p://image-­‑net.org/challenges/LSVRC/{2010,2011,2012} ¡

  8. Variety ¡of ¡object ¡classes ¡in ¡ILSVRC ¡

  9. Variety ¡of ¡object ¡classes ¡in ¡ILSVRC ¡

  10. ILSVRC ¡Task ¡1: ¡Classifica4on ¡ Steel ¡drum ¡

  11. ILSVRC ¡Task ¡1: ¡Classifica4on ¡ Steel ¡drum ¡ Output: ¡ Output: ¡ Scale ¡ Scale ¡ ✗ ¡ ✔ ¡ T-­‑shirt ¡ T-­‑shirt ¡ Steel ¡drum ¡ Giant ¡panda ¡ Drums4ck ¡ Drums4ck ¡ Mud ¡turtle ¡ Mud ¡turtle ¡

  12. ILSVRC ¡Task ¡1: ¡Classifica4on ¡ Steel ¡drum ¡ Output: ¡ Output: ¡ Scale ¡ Scale ¡ ✗ ¡ ✔ ¡ T-­‑shirt ¡ T-­‑shirt ¡ Steel ¡drum ¡ Giant ¡panda ¡ Drums4ck ¡ Drums4ck ¡ Mud ¡turtle ¡ Mud ¡turtle ¡ Σ ¡ 1 ¡ Accuracy ¡= ¡ ¡ ¡ 1[correct ¡on ¡image ¡i] ¡ 100,000 ¡ 100,000 ¡ images ¡

  13. ILSVRC ¡Task ¡1: ¡Classifica4on ¡ 2010 ¡ 0.72 ¡ # ¡Submissions ¡ 2011 ¡ 0.74 ¡ 2012 ¡ 0.85 ¡ Accuracy ¡(5 ¡predic4ons/image) ¡

  14. ILSVRC ¡Task ¡2: ¡Classifica4on ¡+ ¡Localiza4on ¡ Steel ¡drum ¡

  15. ILSVRC ¡Task ¡2: ¡Classifica4on ¡+ ¡Localiza4on ¡ Steel ¡drum ¡ Output ¡ Persian ¡ Loud ¡ cat ¡ speaker ¡ Steel ¡ ✔ ¡ drum ¡ Folding ¡ Picket ¡ chair ¡ fence ¡

  16. ILSVRC ¡Task ¡2: ¡Classifica4on ¡+ ¡Localiza4on ¡ Steel ¡drum ¡ Output ¡ Persian ¡ Loud ¡ cat ¡ speaker ¡ Steel ¡ ✔ ¡ drum ¡ Folding ¡ Picket ¡ chair ¡ fence ¡ Output ¡(bad ¡localiza4on) ¡ Output ¡(bad ¡classifica4on) ¡ Persian ¡ Persian ¡ Loud ¡ Loud ¡ cat ¡ cat ¡ speaker ¡ speaker ¡ King ¡ Steel ¡ ✗ ¡ ✗ ¡ penguin ¡ drum ¡ Folding ¡ Folding ¡ Picket ¡ Picket ¡ chair ¡ chair ¡ fence ¡ fence ¡

  17. ILSVRC ¡Task ¡2: ¡Classifica4on ¡+ ¡Localiza4on ¡ Steel ¡drum ¡ Output ¡ Persian ¡ Loud ¡ cat ¡ speaker ¡ Steel ¡ ✔ ¡ drum ¡ Folding ¡ Picket ¡ chair ¡ fence ¡ Accuracy ¡= ¡ ¡ ¡ Σ ¡ 1 ¡ 1[correct ¡on ¡image ¡i] ¡ 100,000 ¡ 100,000 ¡ images ¡

  18. ILSVRC ¡Task ¡2: ¡Classifica4on ¡+ ¡Localiza4on ¡ (5 ¡predic4ons) ¡ Accuracy ¡ ¡ ¡

  19. What ¡happens ¡under ¡the ¡hood? ¡

  20. What ¡happens ¡under ¡the ¡hood ¡ on ¡classifica4on+localiza4on? ¡

  21. What ¡happens ¡under ¡the ¡hood ¡ on ¡classifica4on+localiza4on? ¡ Olga ¡Russakovsky, ¡Jia ¡Deng, ¡Zhiheng ¡Huang, ¡Alex ¡Berg, ¡Li ¡Fei-­‑Fei ¡ Detec4ng ¡avocados ¡to ¡zucchinis: ¡what ¡have ¡we ¡done, ¡and ¡where ¡are ¡we ¡going? ¡ ICCV ¡2013 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡hfp://image-­‑net.org/challenges/LSVRC/2012/analysis ¡

  22. Preliminaries: ¡ ILSVRC-­‑500 ¡(2012) ¡dataset ¡ • Leading ¡algorithms ¡ • What ¡happens ¡under ¡the ¡hood ¡ on ¡classifica4on+localiza4on? ¡ Olga ¡Russakovsky, ¡Jia ¡Deng, ¡Zhiheng ¡Huang, ¡Alex ¡Berg, ¡Li ¡Fei-­‑Fei ¡ Detec4ng ¡avocados ¡to ¡zucchinis: ¡what ¡have ¡we ¡done, ¡and ¡where ¡are ¡we ¡going? ¡ ICCV ¡2013 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡hfp://image-­‑net.org/challenges/LSVRC/2012/analysis ¡

  23. Preliminaries: ¡ ILSVRC-­‑500 ¡(2012) ¡dataset ¡ • Leading ¡algorithms ¡ • What ¡happens ¡under ¡the ¡hood ¡ on ¡classifica4on+localiza4on? ¡ • A ¡closer ¡look ¡at ¡small ¡objects ¡ • A ¡closer ¡look ¡at ¡textured ¡objects ¡ Olga ¡Russakovsky, ¡Jia ¡Deng, ¡Zhiheng ¡Huang, ¡Alex ¡Berg, ¡Li ¡Fei-­‑Fei ¡ Detec4ng ¡avocados ¡to ¡zucchinis: ¡what ¡have ¡we ¡done, ¡and ¡where ¡are ¡we ¡going? ¡ ICCV ¡2013 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡hfp://image-­‑net.org/challenges/LSVRC/2012/analysis ¡

  24. Preliminaries: ¡ ILSVRC-­‑500 ¡(2012) ¡dataset ¡ • Leading ¡algorithms ¡ • What ¡happens ¡under ¡the ¡hood ¡ on ¡classifica4on+localiza4on? ¡ • A ¡closer ¡look ¡at ¡small ¡objects ¡ • A ¡closer ¡look ¡at ¡textured ¡objects ¡ Olga ¡Russakovsky, ¡Jia ¡Deng, ¡Zhiheng ¡Huang, ¡Alex ¡Berg, ¡Li ¡Fei-­‑Fei ¡ Detec4ng ¡avocados ¡to ¡zucchinis: ¡what ¡have ¡we ¡done, ¡and ¡where ¡are ¡we ¡going? ¡ ICCV ¡2013 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡hfp://image-­‑net.org/challenges/LSVRC/2012/analysis ¡

  25. ILSVRC ¡(2012) ¡ 1000 ¡object ¡classes ¡ Hard ¡to ¡localize ¡ Easy ¡to ¡localize ¡

  26. ILSVRC-­‑500 ¡(2012) ¡ 500 ¡classes ¡with ¡smallest ¡objects ¡ Hard ¡to ¡localize ¡ Easy ¡to ¡localize ¡

  27. ILSVRC-­‑500 ¡(2012) ¡ 500 ¡classes ¡with ¡smallest ¡objects ¡ Hard ¡to ¡localize ¡ Easy ¡to ¡localize ¡ Object ¡scale ¡(frac4on ¡of ¡image ¡area ¡occupied ¡by ¡target ¡object) ¡ ILSVRC-­‑500 ¡(2012) ¡ 500 ¡object ¡categories ¡ 25.3% ¡ ¡ PASCAL ¡VOC ¡(2012) ¡ 20 ¡object ¡categories ¡ 25.2% ¡

  28. Chance ¡Performance ¡of ¡Localiza4on ¡ Steel ¡drum ¡ B 1 ¡ B 8 ¡ B 9 ¡ B 2 ¡ B 6 ¡ B 5 ¡ B 4 ¡ B 7 ¡ B 3 ¡ N ¡= ¡9 ¡here ¡

  29. Chance ¡Performance ¡of ¡Localiza4on ¡ Steel ¡drum ¡ B 1 ¡ B 8 ¡ B 9 ¡ B 2 ¡ B 6 ¡ B 5 ¡ B 4 ¡ B 7 ¡ B 3 ¡ N ¡= ¡9 ¡here ¡

  30. Chance ¡Performance ¡of ¡Localiza4on ¡ Steel ¡drum ¡ B 1 ¡ B 8 ¡ B 9 ¡ B 2 ¡ B 6 ¡ B 5 ¡ B 4 ¡ B 7 ¡ B 3 ¡ N ¡= ¡9 ¡here ¡ ILSVRC-­‑500 ¡(2012) ¡ 500 ¡object ¡categories ¡ 8.4% ¡ PASCAL ¡VOC ¡(2012) ¡ 20 ¡object ¡categories ¡ 8.8% ¡

  31. Level ¡of ¡clufer ¡ Steel ¡drum ¡ - Generate candidate object regions using method of � � Selective Search for Object Detection � � vanDeSande et al. ICCV 2011 � - Filter out regions inside object � - Count regions �

  32. Level ¡of ¡clufer ¡ Steel ¡drum ¡ - Generate candidate object regions using method of � � Selective Search for Object Detection � � vanDeSande et al. ICCV 2011 � - Filter out regions inside object � - Count regions � ILSVRC-­‑500 ¡(2012) ¡ 500 ¡object ¡categories ¡ 128 ¡± ¡35 ¡ PASCAL ¡VOC ¡(2012) ¡ 20 ¡object ¡categories ¡ 130 ¡± ¡29 ¡

Recommend


More recommend