1 / 15 Tensor Low-Rank Reconstruction for Semantic Segmentation - PowerPoint PPT Presentation

1 / 15

Tensor Low-Rank Reconstruction for Semantic Segmentation Wanli Chen 1 , Xinge Zhu 1 , Ruoqi Sun 2 , Junjun He 2,3 , Ruiyu Li 4 , Xiaoyong Shen 4 , Bei Yu 1 1 CSE Department, Chinese University of Hong Kong 2 Shanghai Jiao Tong University 3 Shenzhen Institutes of Advanced Technology 4 SmartMore 2 / 15

Introduction Object Object Context Context information plays an indispensable role in the success of semantic segmentation. 3 / 15

<latexit sha1_base64="UfWg9/VZNDpXzhNmFqUKWFy/9u4=">AB+XicbVC7TsMwFL0pr1JeAUaWiBaJqUoqEAwMlVgYi0QfUhtVjuO0Vh07sp1KVdQ/YWEAIVb+hI2/wWkzQMuRLB+dc698fIKEUaVd9sqbWxube+Udyt7+weHR/bxSUeJVGLSxoIJ2QuQIoxy0tZUM9JLJEFxwEg3mNznfndKpKCP+lZQvwYjTiNKEbaSEPbrg0CwUI1i82V9ea1oV16+4CzjrxClKFAq2h/TUIBU5jwjVmSKm+5ybaz5DUFDMyrwxSRKEJ2hE+oZyFBPlZ4vkc+fCKETCWkO185C/b2RoVjl2cxkjPRYrXq5+J/XT3V062eUJ6kmHC8filLmaOHkNTghlQRrNjMEYUlNVgePkURYm7IqpgRv9cvrpNOoe1f168dGtXlX1FGMziHS/DgBprwAC1oA4YpPMrvFmZ9WK9Wx/L0ZJV7JzCH1ifP1nWk3Y=</latexit> <latexit sha1_base64="epKIaEZkBJr3Mq7YkFA0SyOhips=">AB+XicbVC9TsMwGPxS/kr5CzCyWLRITFVSgWBgKGJhLBKldqochynterEke1UqK+CQsDCLHyJmy8DU6bAVpOsny6+z75fH7CmdKO82V1tY3NrfK25Wd3b39A/vw6EmJVBLaJoIL2fWxopzFtK2Z5rSbSIojn9OP7L/c6ESsVE/KinCfUiPIxZyAjWRhrYdq3vCx6oaWSu7HZWG9hVp+7MgVaJW5AqFGgN7K9+IEga0VgTjpXquU6ivQxLzQins0o/VTBZIyHtGdojCOqvGyefIbOjBKgUEhzYo3m6u+NDEcqz2YmI6xHatnLxf+8XqrDay9jcZJqGpPFQ2HKkRYorwEFTFKi+dQTCQzWREZYmJNmVTAnu8pdXyVOj7l7ULx8a1eZNUcZTuAUzsGFK2jCPbSgDQm8Ayv8GZl1ov1bn0sRktWsXMf2B9/gA2zJNf</latexit> <latexit sha1_base64="AyNXgrdWt5vi0vjZRrmjFYqRg=">AB/nicbVDLSgMxFM34rPU1Kq7cBFvBVZkpi5cFNy4rGAf0BlKJpO2oZnMkNwRylDwV9y4UMSt3+HOvzHTzkJbD4QczrmXnJwgEVyD43xbK6tr6xubpa3y9s7u3r59cNjWcaoa9FYxKobEM0El6wFHATrJoqRKBCsE4xvc7/zyJTmsXyAScL8iAwlH3BKwEh9+7jqBbEI9SQyV+bBiAGZVvt2xak5M+Bl4hakgo0+/aXF8Y0jZgEKojWPdJwM+IAk4Fm5a9VLOE0DEZsp6hkRM+9ks/hSfGSXEg1iZIwHP1N8bGYl0HtBMRgRGetHLxf+8XgqDaz/jMkmBSTp/aJAKDHOu8AhV4yCmBhCqOImK6YjogF01jZlOAufnmZtOs196J2eV+vNG6KOkroBJ2ic+SiK9RAd6iJWoiD2jV/RmPVkv1rv1MR9dsYqdI/QH1ucPZ3OVwg=</latexit> <latexit sha1_base64="OEhIYXcD/Vjxh/0XHQfRJ+vL+xM=">AB/HicbVBPS8MwHE3nvzn/VXf0EtwET6Mdih48DLx4nODmYC0jTdMtLE1KkgqlzK/ixYMiXv0g3vw2plsPuvkg5PHe70deXpAwqrTjfFuVtfWNza3qdm1nd2/wD486iuRSkx6WDAhBwFShFOepqRgaJCgOGHkIpjeF/BIpKC3+sIX6MxpxGFCNtpJFdb3qBYKHKYnPlXjKhs+bIbjgtZw64StySNECJ7sj+8kKB05hwjRlSaug6ifZzJDXFjMxqXqpIgvAUjcnQUI5iovx8Hn4GT40SwkhIc7iGc/X3Ro5iVcQzkzHSE7XsFeJ/3jDV0ZWfU56kmnC8eChKGdQCFk3AkEqCNcsMQVhSkxXiCZIa9NXzZTgLn95lfTbLfe8dXHXbnSuyzq4BicgDPgkvQAbegC3oAgw8g1fwZj1ZL9a79bEYrVjlTh38gfX5A8ptlNk=</latexit> <latexit sha1_base64="vnRTWg0P/qShcLxTMhDuSC7ndgM=">AB/nicbVBLSwMxGMz6rPW1Kp68BFvBU9ktih48FLx4rGAf0F1KNpu2oXksSVYoS8G/4sWDIl79Hd78N2bPWjrQMgw831kMlHCqDae9+2srK6tb2yWtsrbO7t7+7BYVvLVGHSwpJ1Y2QJowK0jLUMNJNFE8YqQTjW9zv/NIlKZSPJhJQkKOhoIOKEbGSn3uBpEksV6wu2VBUPEOZpW+27Fq3kzwGXiF6QCjT7lcQS5xyIgxmSOue7yUmzJAyFDMyLQepJgnCYzQkPUsF4kSH2Sz+FJ5ZJYDqewRBs7U3xsZ4joPaCc5MiO96OXif14vNYPrMKMiSQ0ReP7QIGXQSJh3AWOqCDZsYgnCitqsEI+QtjYxsq2BH/xy8ukXa/5F7XL+3qlcVPUQIn4BScAx9cgQa4A03QAhk4Bm8gjfnyXlx3p2P+eiKU+wcgT9wPn8ASkGVrw=</latexit> Introduction θ reshape Softmax φ X A 2D Similarity Matrix γ Non-local attention based methods become the main stream of semantic segmentation. 4 / 15

<latexit sha1_base64="AyNXgrdWt5vi0vjZRrmjFYqRg=">AB/nicbVDLSgMxFM34rPU1Kq7cBFvBVZkpi5cFNy4rGAf0BlKJpO2oZnMkNwRylDwV9y4UMSt3+HOvzHTzkJbD4QczrmXnJwgEVyD43xbK6tr6xubpa3y9s7u3r59cNjWcaoa9FYxKobEM0El6wFHATrJoqRKBCsE4xvc7/zyJTmsXyAScL8iAwlH3BKwEh9+7jqBbEI9SQyV+bBiAGZVvt2xak5M+Bl4hakgo0+/aXF8Y0jZgEKojWPdJwM+IAk4Fm5a9VLOE0DEZsp6hkRM+9ks/hSfGSXEg1iZIwHP1N8bGYl0HtBMRgRGetHLxf+8XgqDaz/jMkmBSTp/aJAKDHOu8AhV4yCmBhCqOImK6YjogF01jZlOAufnmZtOs196J2eV+vNG6KOkroBJ2ic+SiK9RAd6iJWoiD2jV/RmPVkv1rv1MR9dsYqdI/QH1ucPZ3OVwg=</latexit> <latexit sha1_base64="UfWg9/VZNDpXzhNmFqUKWFy/9u4=">AB+XicbVC7TsMwFL0pr1JeAUaWiBaJqUoqEAwMlVgYi0QfUhtVjuO0Vh07sp1KVdQ/YWEAIVb+hI2/wWkzQMuRLB+dc698fIKEUaVd9sqbWxube+Udyt7+weHR/bxSUeJVGLSxoIJ2QuQIoxy0tZUM9JLJEFxwEg3mNznfndKpKCP+lZQvwYjTiNKEbaSEPbrg0CwUI1i82V9ea1oV16+4CzjrxClKFAq2h/TUIBU5jwjVmSKm+5ybaz5DUFDMyrwxSRKEJ2hE+oZyFBPlZ4vkc+fCKETCWkO185C/b2RoVjl2cxkjPRYrXq5+J/XT3V062eUJ6kmHC8filLmaOHkNTghlQRrNjMEYUlNVgePkURYm7IqpgRv9cvrpNOoe1f168dGtXlX1FGMziHS/DgBprwAC1oA4YpPMrvFmZ9WK9Wx/L0ZJV7JzCH1ifP1nWk3Y=</latexit> <latexit sha1_base64="vnRTWg0P/qShcLxTMhDuSC7ndgM=">AB/nicbVBLSwMxGMz6rPW1Kp68BFvBU9ktih48FLx4rGAf0F1KNpu2oXksSVYoS8G/4sWDIl79Hd78N2bPWjrQMgw831kMlHCqDae9+2srK6tb2yWtsrbO7t7+7BYVvLVGHSwpJ1Y2QJowK0jLUMNJNFE8YqQTjW9zv/NIlKZSPJhJQkKOhoIOKEbGSn3uBpEksV6wu2VBUPEOZpW+27Fq3kzwGXiF6QCjT7lcQS5xyIgxmSOue7yUmzJAyFDMyLQepJgnCYzQkPUsF4kSH2Sz+FJ5ZJYDqewRBs7U3xsZ4joPaCc5MiO96OXif14vNYPrMKMiSQ0ReP7QIGXQSJh3AWOqCDZsYgnCitqsEI+QtjYxsq2BH/xy8ukXa/5F7XL+3qlcVPUQIn4BScAx9cgQa4A03QAhk4Bm8gjfnyXlx3p2P+eiKU+wcgT9wPn8ASkGVrw=</latexit> <latexit sha1_base64="OEhIYXcD/Vjxh/0XHQfRJ+vL+xM=">AB/HicbVBPS8MwHE3nvzn/VXf0EtwET6Mdih48DLx4nODmYC0jTdMtLE1KkgqlzK/ixYMiXv0g3vw2plsPuvkg5PHe70deXpAwqrTjfFuVtfWNza3qdm1nd2/wD486iuRSkx6WDAhBwFShFOepqRgaJCgOGHkIpjeF/BIpKC3+sIX6MxpxGFCNtpJFdb3qBYKHKYnPlXjKhs+bIbjgtZw64StySNECJ7sj+8kKB05hwjRlSaug6ifZzJDXFjMxqXqpIgvAUjcnQUI5iovx8Hn4GT40SwkhIc7iGc/X3Ro5iVcQzkzHSE7XsFeJ/3jDV0ZWfU56kmnC8eChKGdQCFk3AkEqCNcsMQVhSkxXiCZIa9NXzZTgLn95lfTbLfe8dXHXbnSuyzq4BicgDPgkvQAbegC3oAgw8g1fwZj1ZL9a79bEYrVjlTh38gfX5A8ptlNk=</latexit> <latexit sha1_base64="epKIaEZkBJr3Mq7YkFA0SyOhips=">AB+XicbVC9TsMwGPxS/kr5CzCyWLRITFVSgWBgKGJhLBKldqochynterEke1UqK+CQsDCLHyJmy8DU6bAVpOsny6+z75fH7CmdKO82V1tY3NrfK25Wd3b39A/vw6EmJVBLaJoIL2fWxopzFtK2Z5rSbSIojn9OP7L/c6ESsVE/KinCfUiPIxZyAjWRhrYdq3vCx6oaWSu7HZWG9hVp+7MgVaJW5AqFGgN7K9+IEga0VgTjpXquU6ivQxLzQins0o/VTBZIyHtGdojCOqvGyefIbOjBKgUEhzYo3m6u+NDEcqz2YmI6xHatnLxf+8XqrDay9jcZJqGpPFQ2HKkRYorwEFTFKi+dQTCQzWREZYmJNmVTAnu8pdXyVOj7l7ULx8a1eZNUcZTuAUzsGFK2jCPbSgDQm8Ayv8GZl1ov1bn0sRktWsXMf2B9/gA2zJNf</latexit> Introduction Spacial Attention Channel Attention θ reshape Softmax φ X A 2D Similarity Matrix γ Spatial or channel attention? A dilemma in Non-local self-attention based approaches. 5 / 15

Introduction Architecture of DANet [1], which contains 2 stream of non-local attentions. 6 / 15

Introduction Can we obtain spatial and channel attention simultaneously ? ◮ Better context representation. ◮ Smaller computational cost. 7 / 15

Our Proposed RecoNet Tensor Reconstruction Network (RecoNet). POOL CONV UPSAMPLE … Generator-C + Channel Feature UPSAMPLE . … CNN Generator-H + Height Feature Reconstructed Concatenation … Feature Generator-W Feature Context Fragment Width Feature (a)Input Image (b)Tensor Generation Module(TGM) (c)Tensor Reconstruction Module(TRM) (d)Final Prediction The pipeline of our framework. Two major components are involved, Tensor Generation Module (TGM) and Tensor Reconstruction Module (TRM). TGM peroforms the low-rank tensor generation while TRM achieves the × … … × × high-rank tensor reconstruction via CP construction theory. × … … × H × × … … × 1 × W 8 / 15

Our Proposed RecoNet Tensor canonical-polyadic decomposition (CP decomposition). Assuming we have 3 r vectors in C/H/W directions v ci ∈ R C × 1 × 1 , v hi ∈ R 1 × H × 1 and v wi ∈ R 1 × 1 × W , where i ∈ r and r is the tensor rank. These vectors are the CP decomposed fragments of A ∈ R C × H × W , then tensor CP rank- r reconstruction is defined as: r � A = λ i v ci ⊗ v hi ⊗ v wi , (1) i = 1 9 / 15

Tensor Generation Module Input Feature Channel Pool Width Pool Height Pool 1 × 1 Conv 1 × 1 Conv 1 × 1 Conv Sigmoid Sigmoid Sigmoid Height Generator Channel Generator Width Generator C × 1 × 1 … … rank r 1 ×H× 1 … 1 × 1 ×W rank r rank r Height Feature Channel Feature Width Feature Tensor Generation Module. Channel Pool, Height Pool and Width Pool are all global average pooling. 10 / 15

1 / 15 Tensor Low-Rank Reconstruction for Semantic Segmentation - PowerPoint PPT Presentation

1 / 15 Tensor Low-Rank Reconstruction for Semantic Segmentation Wanli Chen 1 , Xinge Zhu 1 , Ruoqi Sun 2 , Junjun He 2,3 , Ruiyu Li 4 , Xiaoyong Shen 4 , Bei Yu 1 1 CSE Department, Chinese University of Hong Kong 2 Shanghai Jiao Tong University 3

Computing the Best Rank ( r 1 , r 2 , r 3 ) Approximation of a Tensor Lars Eld en

Tutorial: A brief survey on tensor rank and tensor decomposition, from a geometric perspective.

Low-Rank Tensor Techniques for High-Dimensional Problems Daniel Kressner CADMOS Chair for

Tensor Field Visualization 9-1 Ronald Peikert SciVis 2007 - Tensor Fields Tensors

2 3 4 5 8 9 MINNEAPOLIS MILWAUKEE MSA RANK #16 MSA RANK #39 CHICAGO MSA RANK #3

Low-Rank Tensor Approximation of Multivariate Functions for Quantum Chemistry Applications

Approximating a tensor as a sum of rank-one components Petros Drineas Petros Drineas Rensselaer

Reconstruction of full rank algebraic branching programs Vineet Nair Joint work with: Neeraj

Basics of diffusion-weighted MRI Fiber Mapping from Rank-2 Tensor Model

Convex Methods for Dense Semantic 3D Reconstruction Christian H ane Computer Vision and

Solving High Dimensional Hamilton- Jacobi-Bellman Equations Using Low Rank Tensor Decomposition

Rank-Based Tensor Factorization for Predicting Student Performance Thanh-Nam Doan, Sherry Sahebi

Low-rank tensor methods for high-dimensional eigenvalue problems Daniel Kressner CADMOS Chair of

Tensor estimation with structured priors Clment Luneau, Nicolas Macris June 29, 2020

A message-passing approach to low-rank matrix reconstruction and application to clustering

Decomposing a Third-Order Tensor in Rank-(L,L,1) Terms by Means of Simultaneous Matrix

Word Semantic Representations using Bayesian Probabilistic Tensor Factorization Jingwei Zhang,

3D RECONSTRUCTION Reconstruction method Reconstruction from images Reconstruction from video

Low Rank Approximation Lecture 7 Daniel Kressner Chair for Numerical Algorithms and HPC

A Digital Research Platform for the Semantic Reconstruction of Giacomo Leopardis Zibaldone

Tensor For F , F Sh( X ) we have F F Sh( X ). Since tensor commutes with

8. Tensor Field Visualization Tensor: extension of concept of scalar and vector Tensor data

Outline Morning program Preliminaries Semantic matching Learning to rank Entities Afternoon

Learning with Low Rank Approximations or how to use near separability to extract content from