Beyond Object Recognition in 2D Georgia Gkioxari Object Recognition - PowerPoint PPT Presentation

Beyond Object Recognition in 2D Georgia Gkioxari

Object Recognition in 2D

The World is 3D Whelan et al., Reconstructing Scenes with Mirror and Glass Surfaces, SIGGRAPH 2018

Motion is Important for Recognition Johansson, Biological Motion Perception

Appearance (x, y) Motion Shape (x, y, t) (x, y, z)

2D: Mask R-CNN He et al., Mask R-CNN, ICCV 2017

2D: Mask R-CNN • Object Localization • Instance Segmentation • Pose Estimation from a Single Image He et al., Mask R-CNN, ICCV 2017

2D + t: Object & Pose Tracking Challenges • Multiple Objects • Occlusions • Variations in Poses

2D + t: 3D Mask R-CNN Girdhar et al., Detect-And-Track: Efficient Pose Estimation in Videos, CVPR 2018

2D + t: 3D Mask R-CNN 3D inflated CNN Girdhar et al., Detect-And-Track: Efficient Pose Estimation in Videos, CVPR 2018

2D + t: 3D Mask R-CNN Predicts 3D tubes instead of 2D rois Girdhar et al., Detect-And-Track: Efficient Pose Estimation in Videos, CVPR 2018

2D + t: 3D Mask R-CNN RoiAlign in (x, y, t) Girdhar et al., Detect-And-Track: Efficient Pose Estimation in Videos, CVPR 2018

2D + t: 3D Mask R-CNN Tube object classification Girdhar et al., Detect-And-Track: Efficient Pose Estimation in Videos, CVPR 2018

2D + t: 3D Mask R-CNN Pose estimation for each tube for each time step Girdhar et al., Detect-And-Track: Efficient Pose Estimation in Videos, CVPR 2018

2D + t: 3D Mask R-CNN Girdhar et al., Detect-And-Track: Efficient Pose Estimation in Videos, CVPR 2018

The Challenges When Learning from Video • 3D CNNs are time and memory consuming • Small batch sizes • Prone to overfitting • Redundant Computations • Consecutive frames look similar • 3D convolutions allocate the same amount of computation across time and pixels • 3D extensions of Image-based CNNs might be suboptimal

Slow-Fast Networks for Video Recognition Feichtenhofer et al., arXiv 2018

Slow-Fast Networks for Video Recognition Slow pathway Slow T C T C T C prediction H,W T C Fast αT αT βC βC αT Fast pathway βC Feichtenhofer et al., arXiv 2018

Slow-Fast Networks for Video Recognition Slow pathway T C T C T C H,W concat T C αT αT βC βC αT Fast pathway βC Feichtenhofer et al., arXiv 2018

Slow-Fast Networks for Video Recognition • Kinetics 400

Slow-Fast Networks for Video Recognition • AVA

Can Motion Also Help 2D? • Motion is important for video understanding • Object Tracking • Action Recognition • Can motion help single image understanding? • Humans learn to recognize using motion cues • Can motion help us recognize better or with less data?

DensePose input image DensePose surface of 3D model Neverova, Slim DensePoseL Thrifty Learning from Sparse Annotations and Motion Cues, CVPR 2019

DensePose: Annotations keypoints full annotations limited dense annotations sparse annotations Neverova, Slim DensePoseL Thrifty Learning from Sparse Annotations and Motion Cues, CVPR 2019

DensePose: Performance wrt #Annotations Neverova, Slim DensePoseL Thrifty Learning from Sparse Annotations and Motion Cues, CVPR 2019

DensePose: Annotation Propagation with Optical Flow Transfer a given label to a new frame Neverova, Slim DensePoseL Thrifty Learning from Sparse Annotations and Motion Cues, CVPR 2019

DensePose: Annotation Propagation with Optical Flow 2 Gains in performance 1.5 1 0.5 0 ground truth propagation equivariance all Neverova, Slim DensePoseL Thrifty Learning from Sparse Annotations and Motion Cues, CVPR 2019

Mesh R-CNN: Objects and Shapes Gkioxari et al., Mesh R-CNN, ArXiv 2019

Mesh R-CNN: Objects and Shapes sofa chair Gkioxari et al., Mesh R-CNN, ArXiv 2019

Mesh R-CNN: Objects and Shapes

Whelan et al., Reconstructing Scenes with Mirror and Glass Surfaces, SIGGRAPH 2018

Thank you

Beyond Object Recognition in 2D Georgia Gkioxari Object Recognition - PowerPoint PPT Presentation

Beyond Object Recognition in 2D Georgia Gkioxari Object Recognition in 2D The World is 3D Whelan et al., Reconstructing Scenes with Mirror and Glass Surfaces, SIGGRAPH 2018 Motion is Important for Recognition Johansson, Biological Motion

Object Oriented Object 3 Programming Object 1 Object 2 Object 4 For : COP 3330. Object

Instance-level Recognition Pingmei Xu Object Recognition Friends SE01EP02 Recognition: Find the

Supervised object recognition, unsupervised object recognition then Perceptual organization Bill

Object-Oriented Databases Object Oriented Databases ODMG Standard Object Model, Object

Object oriented Object oriented Object oriented Object oriented approach and UML approach and

A summary of deep models for face recognition Qianli Liao Face recognition Face recognition:

8-Speech Recognition Speech Recognition Concepts Speech Recognition Approaches

Learning for Action Recognition Yemin Shi shiyemin@pku.edu.cn 2018-03 1 Background Action

Overview Object Recognition Neurobiology of Vision Computational Object Recognition: Whats

Object recognition and hierarchical computation Challenges in object recognition.

Selective Search for Object Recognition Uijlings et al. Schuyler Smith Overview

CS6501: Deep Learning for Visual Recognition Object Detection: RCNN, Fast-RCNN, Faster-RCNN

Object Space Volume Rendering Object Space Volume Rendering Ronald Peikert SciVis 2010 - Object

EMPLOYEE RECOGNITION OBJECTIVES Types of recognition Creating a culture of recognition

License Plate Recognition License Plate Recognition License Plate Recognition License Plate

Face detection and recognition Detection Recognition Sally Face detection &

Traffic analysis and modelling 1 Service classification Services may be classified according

System Buses Chapter 5 S. Dandamudi Outline Introduction Bus arbitration Dynamic

Learning Character-Agnostic Motion for Motion Retargeting in 2D Kfir Aberman, Rundi Wu, Dani

Optimized Core-links for Low-latency NoCs Ryuta Kawano , Seiichi Tade , Ikki

S3VAE: Self-Supervised Sequential VAE for Representation Disentanglement and Data Generation

Human Focused Action Localization in Video Alexander Klaeser 1 , Marcin Marszalek 2 , Cordelia

https://www.tamus.edu/system/total-texas-am-university-system-enrollment 1 Agenda for Tuesday,

Capturing full body motion Antoine Kaufmann antoinek@student.ethz.ch April 9, 2013 Distributed

Sambuz

Useful Links

Newsletter

Mail Us

Beyond Object Recognition in 2D Georgia Gkioxari Object Recognition - PowerPoint PPT Presentation

Beyond Object Recognition in 2D Georgia Gkioxari Object Recognition in 2D The World is 3D Whelan et al., Reconstructing Scenes with Mirror and Glass Surfaces, SIGGRAPH 2018 Motion is Important for Recognition Johansson, Biological Motion

Object Oriented Object 3 Programming Object 1 Object 2 Object 4 For : COP 3330. Object

Instance-level Recognition Pingmei Xu Object Recognition Friends SE01EP02 Recognition: Find the

Supervised object recognition, unsupervised object recognition then Perceptual organization Bill

Object-Oriented Databases Object Oriented Databases ODMG Standard Object Model, Object

Object oriented Object oriented Object oriented Object oriented approach and UML approach and

A summary of deep models for face recognition Qianli Liao Face recognition Face recognition:

8-Speech Recognition Speech Recognition Concepts Speech Recognition Approaches

Learning for Action Recognition Yemin Shi shiyemin@pku.edu.cn 2018-03 1 Background Action

Overview Object Recognition Neurobiology of Vision Computational Object Recognition: Whats

Object recognition and hierarchical computation Challenges in object recognition.

Selective Search for Object Recognition Uijlings et al. Schuyler Smith Overview

CS6501: Deep Learning for Visual Recognition Object Detection: RCNN, Fast-RCNN, Faster-RCNN

Object Space Volume Rendering Object Space Volume Rendering Ronald Peikert SciVis 2010 - Object

EMPLOYEE RECOGNITION OBJECTIVES Types of recognition Creating a culture of recognition

License Plate Recognition License Plate Recognition License Plate Recognition License Plate

Face detection and recognition Detection Recognition Sally Face detection &amp;

Traffic analysis and modelling 1 Service classification Services may be classified according

System Buses Chapter 5 S. Dandamudi Outline Introduction Bus arbitration Dynamic

Learning Character-Agnostic Motion for Motion Retargeting in 2D Kfir Aberman, Rundi Wu, Dani

Optimized Core-links for Low-latency NoCs Ryuta Kawano , Seiichi Tade , Ikki

S3VAE: Self-Supervised Sequential VAE for Representation Disentanglement and Data Generation

Human Focused Action Localization in Video Alexander Klaeser 1 , Marcin Marszalek 2 , Cordelia

https://www.tamus.edu/system/total-texas-am-university-system-enrollment 1 Agenda for Tuesday,

Capturing full body motion Antoine Kaufmann antoinek@student.ethz.ch April 9, 2013 Distributed

Sambuz

Useful Links

Newsletter

Mail Us

Face detection and recognition Detection Recognition Sally Face detection &