Regularized Directions of Maximal Outlyingness
Michiel Debruyne
- Dept. of mathematics and computer science, Universiteit Antwerpen
Regularized Directions of Maximal Outlyingness Michiel Debruyne - - PowerPoint PPT Presentation
Regularized Directions of Maximal Outlyingness Michiel Debruyne Dept. of mathematics and computer science , Universiteit Antwerpen COMPSTAT 2010 August 23, 2010 Motivation Nowadays many robust methods are available to detect outliers in a
COMPSTAT2010 – p.1/26
COMPSTAT2010 – p.2/26
COMPSTAT2010 – p.3/26
푤 (풙푖 − ¯
푤 (풙푖 − ¯
풂∈ℝ푝,∥풂∥=1
COMPSTAT2010 – p.4/26
−2 2 4 6 8 10 −6 −4 −2 2 4 6 X1 X2 51 a
Data
COMPSTAT2010 – p.5/26
풂∈ℝ푝,∥풂∥=1
푤 (풙푖 − ¯
푤 (풙푖 − ¯
COMPSTAT2010 – p.6/26
−2 2 4 6 8 10 −6 −4 −2 2 4 6 X1 X2 a 51
Data COMPSTAT2010 – p.7/26
1 − ¯
푤), . . . , 푤푛(풙푡 푛 − ¯
푤))푡.
푤1 with 풆푖 the 푖th canonical basis vector.
풂∈ℝ푝,∥풂∥=1
휷∈ℝ푝 ∥풚푤 − 푋푤휷∥2
휷∈ℝ푝 ∥풚푤 − 푋푤휷∥2
푝
푗=1
COMPSTAT2010 – p.8/26
−2 2 4 6 8 10 −6 −4 −2 2 4 6 X1 X2 51 a
Data
* * * 0.0 0.2 0.4 0.6 0.8 1.0 0e+00 1e−04 2e−04 3e−04 4e−04 5e−04 6e−04 |beta|/max|beta| Standardized Coefficients * * *
LASSO
2 1 1 2
COMPSTAT2010 – p.9/26
−2 2 4 6 8 10 −6 −4 −2 2 4 6 X1 X2 51 a
Data
* * * * * * * * * * * 0.0 0.2 0.4 0.6 0.8 1.0 −4e−04 −2e−04 0e+00 2e−04 4e−04 |beta|/max|beta| Standardized Coefficients * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * *
LASSO
5 7 9 3 6 2 4 8 1 4 6 8 10
COMPSTAT2010 – p.10/26
−2 2 4 6 8 10 −6 −4 −2 2 4 6 X1 X2 51 a
Data
* * * * * * * * * * ** ** ** * ** * * * * * * * * * * * * * * * * * * * * * * * * 0.0 0.2 0.4 0.6 0.8 1.0 −0.004 −0.002 0.000 0.002 0.004 |beta|/max|beta| Standardized Coefficients ** * * * * * * * * ** ** ** * ** * * * * * * * * * * * * * * * * * * * * * * * * ** * * * * * * * * ** ** ** * ** * * * * * * * * * * * * * * * * * * * * * * * * ** * * * * * * * * ** ** ** * ** * * * * * * * * * * * * * * * * * * * * * * * * ** * * * * * * * * ** ** ** * ** * * * * * * * * * * * * * * * * * * * * * * * * ** * * * * * * * * ** ** ** * ** * * * * * * * * * * * * * * * * * * * * * * * * ** * * * * * * * * ** ** ** * ** * * * * * * * * * * * * * * * * * * * * * * * * ** * * * * * * * * ** ** ** * ** * * * * * * * * * * * * * * * * * * * * * * * * ** * * * * * * * * ** ** ** * ** * * * * * * * * * * * * * * * * * * * * * * * * ** * * * * * * * * ** ** ** * ** * * * * * * * * * * * * * * * * * * * * * * * * ** * * * * * * * * ** ** ** * ** * * * * * * * * * * * * * * * * * * * * * * * * ** * * * * * * * * ** ** ** * ** * * * * * * * * * * * * * * * * * * * * * * * * ** * * * * * * * * ** ** ** * ** * * * * * * * * * * * * * * * * * * * * * * * * ** * * * * * * * * ** ** ** * ** * * * * * * * * * * * * * * * * * * * * * * * * ** * * * * * * * * ** ** ** * ** * * * * * * * * * * * * * * * * * * * * * * * * ** * * * * * * * * ** ** ** * ** * * * * * * * * * * * * * * * * * * * * * * * * ** * * * * * * * * ** ** ** * ** * * * * * * * * * * * * * * * * * * * * * * * * ** * * * * * * * * ** ** ** * ** * * * * * * * * * * * * * * * * * * * * * * * * ** * * * * * * * * ** ** ** * ** * * * * * * * * * * * * * * * * * * * * * * * * ** * * * * * * * * ** ** ** * ** * * * * * * * * * * * * * * * * * * * * * * * * ** * * * * * * * * ** ** ** * ** * * * * * * * * * * * * * * * * * * * * * * * * ** * * * * * * * * ** ** ** * ** * * * * * * * * * * * * * * * * * * * * * * * * ** * * * * * * * * ** ** ** * ** * * * * * * * * * * * * * * * * * * * * * * * * ** * * * * * * * * ** ** ** * ** * * * * * * * * * * * * * * * * * * * * * * * * ** * * * * * * * * ** ** ** * ** * * * * * * * * * * * * * * * * * * * * * * * * ** * * * * * * * * ** ** ** * ** * * * * * * * * * * * * * * * * * * * * * * * * ** * * * * * * * * ** ** ** * ** * * * * * * * * * * * * * * * * * * * * * * * * ** * * * * * * * * ** ** ** * ** * * * * * * * * * * * * * * * * * * * * * * * * ** * * * * * * * * ** ** ** * ** * * * * * * * * * * * * * * * * * * * * * * * * ** * * * * * * * * ** ** ** * ** * * * * * * * * * * * * * * * * * * * * * * * *
LASSO
7 13 17 3 16 28 23 20 6 22 18 5 15 25 29 30 36 38 40 41
COMPSTAT2010 – p.11/26
−2 2 4 6 8 10 −6 −4 −2 2 4 6 X1 X2 a 51
Data
* * * 0.0 0.2 0.4 0.6 0.8 1.0 −0.002 −0.001 0.000 0.001 |beta|/max|beta| Standardized Coefficients * * *
LASSO
2 1 1 2
COMPSTAT2010 – p.12/26
−2 2 4 6 8 10 −6 −4 −2 2 4 6 X1 X2 a 51
Data
* * * * * * * * * * * 0.0 0.2 0.4 0.6 0.8 1.0 −0.003 −0.002 −0.001 0.000 0.001 0.002 |beta|/max|beta| Standardized Coefficients * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * *
LASSO
2 5 4 6 8 1 1 2 3 4 5 6 7 8 9 COMPSTAT2010 – p.13/26
−2 2 4 6 8 10 −6 −4 −2 2 4 6 X1 X2 a 51
Data
* * * * * * * * * * * * * * * * * * * * * * * * * *** * ** *** * * * 0.0 0.2 0.4 0.6 0.8 1.0 −0.010 −0.005 0.000 0.005 |beta|/max|beta| Standardized Coefficients * * * * * * * * * * * * * * * * * * * * * * * * * *** * ** *** * * * * * * * * * * * * * * * * * * * * * * * * * * * *** * ** *** * * * * * * * * * * * * * * * * * * * * * * * * * * * *** * ** *** * * * * * * * * * * * * * * * * * * * * * * * * * * * *** * ** *** * * * * * * * * * * * * * * * * * * * * * * * * * * * *** * ** *** * * * * * * * * * * * * * * * * * * * * * * * * * * * *** * ** *** * * * * * * * * * * * * * * * * * * * * * * * * * * * *** * ** *** * * * * * * * * * * * * * * * * * * * * * * * * * * * *** * ** *** * * * * * * * * * * * * * * * * * * * * * * * * * * * *** * ** *** * * * * * * * * * * * * * * * * * * * * * * * * * * * *** * ** *** * * * * * * * * * * * * * * * * * * * * * * * * * * * *** * ** *** * * * * * * * * * * * * * * * * * * * * * * * * * * * *** * ** *** * * * * * * * * * * * * * * * * * * * * * * * * * * * *** * ** *** * * * * * * * * * * * * * * * * * * * * * * * * * * * * *** * ** *** * * * * * * * * * * * * * * * * * * * * * * * * * * * *** * ** *** * * * * * * * * * * * * * * * * * * * * * * * * * * * *** * ** *** * * * * * * * * * * * * * * * * * * * * * * * * * * * *** * ** *** * * * * * * * * * * * * * * * * * * * * * * * * * * * * *** * ** *** * * * * * * * * * * * * * * * * * * * * * * * * * * * *** * ** *** * * * * * * * * * * * * * * * * * * * * * * * * * * * *** * ** *** * * * * * * * * * * * * * * * * * * * * * * * * * * * *** * ** *** * * * * * * * * * * * * * * * * * * * * * * * * * * * *** * ** *** * * * * * * * * * * * * * * * * * * * * * * * * * * * *** * ** *** * * * * * * * * * * * * * * * * * * * * * * * * * * * *** * ** *** * * * * * * * * * * * * * * * * * * * * * * * * * * * *** * ** *** * * * * * * * * * * * * * * * * * * * * * * * * * * * *** * ** *** * * * * * * * * * * * * * * * * * * * * * * * * * * * *** * ** *** * * * * * * * * * * * * * * * * * * * * * * * * * * * *** * ** *** * * * * * * * * * * * * * * * * * * * * * * * * * * * *** * ** *** * * *
LASSO
10 7 2 13 12 14 15 9 21 23 1 21 32 35 36 COMPSTAT2010 – p.14/26
COMPSTAT2010 – p.15/26
−2 2 4 6 8 10 −6 −4 −2 2 4 6 X1 X2 51 a
Data
* * * 0.0 0.2 0.4 0.6 0.8 1.0 −10 −5 5 |beta|/max|beta| Standardized Coefficients * * *
LASSO
2 1 2
COMPSTAT2010 – p.16/26
−2 2 4 6 8 10 −6 −4 −2 2 4 6 X1 X2 51 a
Data
* * * * * ** * * * * 0.0 0.2 0.4 0.6 0.8 1.0 −15 −10 −5 5 |beta|/max|beta| Standardized Coefficients * * * * * ** * * * * * * * * * ** * * * * * * * * * ** * * * * * * * * * ** * * * * * * * * * ** * * * * * * * * * ** * * * * * * * * * ** * * * * * * * * * ** * * * * * * * * * ** * * * *
LASSO
2 6 9 1 4 5 7 8 9 10
COMPSTAT2010 – p.17/26
−2 2 4 6 8 10 −6 −4 −2 2 4 6 X1 X2 51 a
Data
** * *** ** * * * * * * * * * * ** * * * * ** * * ** * * * ** 0.0 0.2 0.4 0.6 0.8 1.0 −5 5 |beta|/max|beta| Standardized Coefficients ** * *** ** * * * * * * * * * * ** * * * * ** * * ** * * * ** ** * *** ** * * * * * * * * * * ** * * * * ** * * ** * * * ** ** * *** ** * * * * * * * * * * ** * * * * ** * * ** * * * ** ** * *** ** * * * * * * * * * * ** * * * * ** * * ** * * * ** ** * *** ** * * * * * * * * * * ** * * * * ** * * ** * * * ** ** * *** ** * * * * * * * * * * ** * * * * ** * * ** * * * ** ** * *** ** * * * * * * * * * * ** * * * * ** * * ** * * * ** ** * *** ** * * * * * * * * * * ** * * * * ** * * ** * * * ** ** * *** ** * * * * * * * * * * ** * * * * ** * * ** * * * ** ** * *** ** * * * * * * * * * * ** * * * * ** * * ** * * * ** ** * *** ** * * * * * * * * * * ** * * * * ** * * ** * * * ** ** * *** ** * * * * * * * * * * ** * * * * ** * * ** * * * ** ** * *** ** * * * * * * * * * * ** * * * * ** * * ** * * * ** ** * *** ** * * * * * * * * * * ** * * * * ** * * ** * * * ** ** * *** ** * * * * * * * * * * ** * * * * ** * * ** * * * ** ** * *** ** * * * * * * * * * * ** * * * * ** * * ** * * * ** * * * *** ** * * * * * * * * * * ** * * * * ** * * ** * * * ** ** * *** ** * * * * * * * * * * ** * * * * ** * * ** * * * ** ** * *** ** * * * * * * * * * * ** * * * * ** * * ** * * * ** ** * *** ** * * * * * * * * * * ** * * * * ** * * ** * * * ** ** * *** ** * * * * * * * * * * ** * * * * ** * * ** * * * ** ** * *** ** * * * * * * * * * * ** * * * * ** * * ** * * * ** ** * *** ** * * * * * * * * * * ** * * * * ** * * ** * * * ** ** * *** ** * * * * * * * * * * ** * * * * ** * * ** * * * ** ** * *** ** * * * * * * * * * * ** * * * * ** * * ** * * * ** ** * *** ** * * * * * * * * * * ** * * * * ** * * ** * * * ** ** * *** ** * * * * * * * * * * ** * * * * ** * * ** * * * ** ** * *** ** * * * * * * * * * * ** * * * * ** * * ** * * * ** ** * *** ** * * * * * * * * * * ** * * * * ** * * ** * * * **
LASSO
2 28 30 13 19 1 7 11 14 19 24 26 28 30 31 32 33
COMPSTAT2010 – p.18/26
COMPSTAT2010 – p.19/26
휷∈ℝ푝 ∥풚푤 − 푋푤휷∥2 + 휆푗∥휷∥2
푝
푗=1
COMPSTAT2010 – p.20/26
COMPSTAT2010 – p.21/26
5 10 15 0e+00 1e+05 2e+05 3e+05 4e+05 5e+05 6e+05 Score distance Orthogonal distance V11 V19 V12 V12 V19 V17
ROBPCA
COMPSTAT2010 – p.22/26
COMPSTAT2010 – p.23/26
COMPSTAT2010 – p.24/26
COMPSTAT2010 – p.25/26
COMPSTAT2010 – p.26/26