Lecture 14 Covariance Functions 3/08/2018 1
More on Covariance Functions 2
Nugget Covariance 3 ๐ท๐๐ค(๐ง ๐ข ๐ , ๐ง ๐ข ๐ ) = ๐ 2 1 {โ=0} where โ = |๐ข ๐ โ ๐ข ๐ | 2 1.00 1 0.75 draw 0 Draw 1 C 0.50 y Draw 2 โ1 0.25 โ2 0.00 0 5 10 15 20 0 5 10 15 20 h x
(- / Power / Square) Exponential Covariance 4 ๐ท๐๐ค(๐ง ๐ข ๐ , ๐ง ๐ข ๐ ) = ๐ 2 exp (โ(โ ๐) ๐ ) where โ = |๐ข ๐ โ ๐ข ๐ | Covariance โ l=12, sigma2=1 Exponential 1.00 Cov 2 0.75 Exp 0 C 0.50 y Pow Exp (p=1.5) 0.25 Sq Exp โ2 0.00 โ4 0.00 0.25 0.50 0.75 1.00 0.00 0.25 0.50 0.75 1.00 h x Powered Exponential (p=1.5) Square Exponential 1 2 0 0 y y โ1 โ2 โ2 โ3 0.00 0.25 0.50 0.75 1.00 0.00 0.25 0.50 0.75 1.00 x x
Matern Covariance โ 2๐ โ โ ๐) where โ = |๐ข ๐ โ๐ข ๐ | 5 2๐ โ โ ๐) โ ๐ ๐ฟ ๐ ( ๐ท๐๐ค(๐ง ๐ข ๐ , ๐ง ๐ข ๐ ) = ๐ 2 2 1โ๐ ฮ(๐) ( Covariance โ l=2, sigma2=1 Matern โ v=1/2 1.00 2 0.75 1 v=1/2 C 0.50 y 0 v=3/2 โ1 v=5/2 0.25 โ2 0.00 0 2 4 6 0 2 4 6 h x Matern โ v=3/2 Matern โ v=5/2 1 2 0 1 y y โ1 0 โ2 โ1 โ3 0 2 4 6 0 2 4 6 x x
Matern Covariance โข A Gaussian process with Matรฉrn covariance has sample functions that are โ๐ โ 1โ times differentiable. (product of an exponential and a polynomial of order ๐ ). โข When ๐ = 1/2 the Matern is equivalent to the exponential covariance. โข As ๐ โ โ the Matern converges to the square exponential covariance. โข A Gaussian process with Matรฉrn covariance has paths that are โ๐โ โ 1 times differentiable. 6 โข ๐ฟ ๐ is the modified Bessel function of the second kind. โข When ๐ = 1/2 + ๐ for ๐ โ N + then the Matern has a simplified form
Rational Quadratic Covariance โ๐ฝ 7 ) ๐ฝ ๐ท๐๐ค(๐ง ๐ข ๐ , ๐ง ๐ข ๐ ) = ๐ 2 (1 + โ 2 ๐ 2 where โ = |๐ข ๐ โ ๐ข ๐ | Covariance โ l=12, sigma2=1 Rational Quadratic โ alpha=1 1.00 1 0.75 0 alpha=1 0.50 y alpha=3 โ1 alpha=10 0.25 โ2 0.00 0.00 0.25 0.50 0.75 1.00 0.00 0.25 0.50 0.75 1.00 h x Rational Quadratic โ alpha=10 Rational Quadratic โ alpha=100 2 1 1 y y 0 0 โ1 โ1 0.00 0.25 0.50 0.75 1.00 0.00 0.25 0.50 0.75 1.00 x x
Rational Quadratic Covariance โข is a scaled mixture of squared exponential covariance functions with different characteristic length-scales ( ๐ ). โข As ๐ฝ โ โ the rational quadratic converges to the square exponential covariance. โข Has sample functions that are infinitely differentiable for any value of ๐ฝ 8
Spherical Covariance 0 where โ = |๐ข ๐ โ๐ข ๐ | otherwise 9 2 (โ โ ๐) 3 )) ๐ท๐๐ค(๐ง ๐ข ๐ , ๐ง ๐ข ๐ ) = {๐ 2 (1 โ 3 2 โ โ ๐ + 1 if 0 < โ < 1/๐ Covariance โ sigma2=1 Spherical โ l=1 1.00 1 0.75 0 l=1 0.50 y l=3 โ1 0.25 l=10 โ2 โ3 0.00 0.0 0.3 0.6 0.9 0.0 0.3 0.6 0.9 h x Spherical โ l=3 Spherical โ l=10 2 2 1 y y 0 0 โ1 โ2 โ2 0.0 0.3 0.6 0.9 0.0 0.3 0.6 0.9 x x
Periodic Covariance 10 ๐ท๐๐ค(๐ง ๐ข ๐ , ๐ง ๐ข ๐ ) = ๐ 2 exp (โ2 ๐ 2 sin 2 (๐โ ๐ )) where โ = |๐ข ๐ โ ๐ข ๐ | Covariance โ l=2, sigma2=1 Periodic โ p=1 1.00 1 forcats::as_factor(Cov) 0.75 p=1 0 0.50 y p=2 0.25 p=3 โ1 0.00 0 1 2 3 4 0 2 4 6 h x Periodic โ p=2 Periodic โ p=3 1 2 1 0 y y 0 โ1 โ1 โ2 โ2 0 2 4 6 0 2 4 6 x x
Linear Covariance ๐ท๐๐ค(๐ง ๐ข ๐ , ๐ง ๐ข ๐ ) = ๐ 2 11 ๐ + ๐ 2 ๐ค (๐ข ๐ โ ๐)(๐ข ๐ โ ๐) 1.0 0.5 0.0 y โ0.5 โ1.0 0.00 0.25 0.50 0.75 1.00 x
Combining Covariances If we definite two valid covariance functions, ๐ท๐๐ค ๐ (๐ง ๐ข ๐ , ๐ง ๐ข ๐ ) and ๐ท๐๐ค ๐ (๐ง ๐ข ๐ , ๐ง ๐ข ๐ ) then the following are also valid covariance functions, ๐ท๐๐ค ๐ (๐ง ๐ข ๐ , ๐ง ๐ข ๐ ) + ๐ท๐๐ค ๐ (๐ง ๐ข ๐ , ๐ง ๐ข ๐ ) ๐ท๐๐ค ๐ (๐ง ๐ข ๐ , ๐ง ๐ข ๐ ) ร ๐ท๐๐ค ๐ (๐ง ๐ข ๐ , ๐ง ๐ข ๐ ) 12
Linear ร Linear โ Quadratic 13 ๐ท๐๐ค ๐ (๐ง ๐ข ๐ , ๐ง ๐ข ๐ ) = 1 + 2 (๐ข ๐ ร ๐ข ๐ ) ๐ท๐๐ค ๐ (๐ง ๐ข ๐ , ๐ง ๐ข ๐ ) = 2 + 1 (๐ข ๐ ร ๐ข ๐ ) Cov_a * Cov_b 5 0 y โ5 โ10 โ2 โ1 0 1 2 x
14 Linear ร Periodic ๐ท๐๐ค ๐ (๐ง ๐ข ๐ , ๐ง ๐ข ๐ ) = 1 + 1 (๐ข ๐ ร ๐ข ๐ ) ๐ท๐๐ค ๐ (๐ง ๐ข ๐ , ๐ง ๐ข ๐ ) = exp (โ2 sin 2 (2๐ โ)) Cov_a * Cov_b 2 0 y โ2 โ4 0 1 2 3 x
Linear + Periodic 15 ๐ท๐๐ค ๐ (๐ง ๐ข ๐ , ๐ง ๐ข ๐ ) = 1 + 1 (๐ข ๐ ร ๐ข ๐ ) ๐ท๐๐ค ๐ (โ = |๐ข ๐ โ ๐ข ๐ |) = exp (โ2 sin 2 (2๐ โ)) Cov_a + Cov_b 0 โ1 draw โ2 Draw 1 y Draw 2 โ3 โ4 โ5 0 1 2 3 x
Sq Exp ร Periodic โ Locally Periodic 16 ๐ท๐๐ค ๐ (โ = |๐ข ๐ โ ๐ข ๐ |) = exp (โ(1/3)โ 2 ) ๐ท๐๐ค ๐ (โ = |๐ข ๐ โ ๐ข ๐ |) = exp (โ2 sin 2 (๐ โ)) Cov_a * Cov_b 2 1 0 y โ1 โ2 0 2 4 6 x
Sq Exp (short) + Sq Exp (long) โ 3/2)โ 2 ) 17 3โ 2 ) โ ๐ท๐๐ค ๐ (โ = |๐ข ๐ โ ๐ข ๐ |) = (1/4) exp (โ4 ๐ท๐๐ค ๐ (โ = |๐ข ๐ โ ๐ข ๐ |) = exp (โ( Cov_a + Cov_b 1 0 y โ1 โ2 0.0 2.5 5.0 7.5 10.0 x
Sq Exp (short) + Sq Exp (long) (Seen another way) 18 Cov_A (short) Cov_B (long) Cov_A + Cov_B 2 1 0 y โ1 โ2 โ3 0.0 2.5 5.0 7.5 10.0 0.0 2.5 5.0 7.5 10.0 0.0 2.5 5.0 7.5 10.0 x
BDA3 example 19
BDA3 http://research.cs.aalto.fi/pml/software/gpstuff/demo_births.shtml 20
Births (one year) 1. Smooth long term trend ( sq exp cov ) 2. Seven day periodic trend with decay ( periodic ร sq exp cov ) 3. Constant mean 21
Component Contributions We can view our GP in the following ways, but with appropriate conditioning we can also think of ๐ณ as being the sum of multipe independent GPs ๐ณ = ๐ + ๐ฅ 1 (๐ฎ) + ๐ฅ 2 (๐ฎ) + ๐ฅ 3 (๐ฎ) where ๐ฅ 1 (๐ฎ) โผ ๐ช(0, ๐ป 1 ) ๐ฅ 2 (๐ฎ) โผ ๐ช(0, ๐ป 2 ) ๐ฅ 3 (๐ฎ) โผ ๐ช(0, ๐ 2 ๐ ) 22 ๐ณ โผ ๐ช(๐, ๐ป 1 + ๐ป 2 + ๐ 2 ๐ )
Decomposition of Covariance Components 0 โฃ ฮฃ 1 ฮฃ 2 ฮฃ 1 ฮฃ 1 0 ฮฃ 2 ฮฃ 2 โฆ โค โฅ โฆ โ โ โ therefore ๐ข โก โข โฅ โ โข โฃ ๐ง ๐ฅ 1 ๐ฅ 2 โค โฅ โฆ 23 โ โก โข โฃ ๐ 0 0 โค ฮฃ 1 + ฮฃ 2 + ๐ 2 ๐ โผ ๐ช โ , โก ๐ฅ 1 | ๐ณ, ๐, ๐พ โผ ๐ช(๐ ๐๐๐๐ , ๐ป ๐๐๐๐ ) ๐ ๐๐๐๐ = 0 + ฮฃ 1 (ฮฃ 1 + ฮฃ 2 + ๐ 2 ๐ฝ) โ1 (๐ณ โ ๐) ๐ป ๐๐๐๐ = ฮฃ 1 โ ฮฃ 1 (ฮฃ 1 + ฮฃ 2 + ๐ 2 ๐) โ1 ฮฃ 1
Births (multiple years) 1. slowly changing trend ( sq exp cov ) 2. small time scale correlating noise ( sq exp cov ) 3. 7 day periodical component capturing day of week effect ( periodic ร sq exp cov ) 4. 365.25 day periodical component capturing day of year effect ( periodic ร sq exp cov ) 5. component to take into account the special days and interaction with weekends ( linear cov ) 6. independent Gaussian noise ( nugget cov ) 7. constant mean 24
Mauna Loa Exampel 25
26 Atmospheric CO 2 390 Source NOAA y 360 Scripps (co2 in R) 330 1960 1980 2000 x
GP Model Based on Rasmussen 5.4.3 (we are using slightly different data and โ๐ฝ ) ๐ฝ 27 ๐ง ฬ parameterization) ๐ณ โผ ๐ช(๐, ๐ป 1 + ๐ป 2 + ๐ป 3 + ๐ป 4 + ๐ 2 I ) {๐} ๐ = {๐ป 1 } ๐๐ = ๐ 2 1 exp (โ(๐ 1 โ ๐ ๐๐ ) 2 ) 2 exp (โ(๐ 2 โ ๐ ๐๐ ) 2 ) exp (โ2 (๐ 3 ) 2 sin 2 (๐ ๐ ๐๐ /๐)) {๐ป 2 } ๐๐ = ๐ 2 3 (1 + (๐ 4 โ ๐ ๐๐ ) 2 {๐ป 3 } ๐๐ = ๐ 2 {๐ป 4 } ๐๐ = ๐ 2 4 exp (โ(๐ 5 โ ๐ ๐๐ ) 2 )
JAGS Model } }โ alpha ~ dt(0, 2.5, 1) T(0,) } l[i] ~ dt(0, 2.5, 1) T(0,) sigma2[i] ~ dt(0, 2.5, 1) T(0,) for(i in 1:5){ } Sigma[i,i] <- sigma2[1] + sigma2[2] + sigma2[3] + sigma2[4] + sigma2[5] for (i in 1:length(y)) { } ml_model = โmodel{ Sigma[j,i] <- Sigma[i,j] Sigma[i,j] <- k1[i,j] + k2[i,j] + k3[i,j] + k4[i,j] k4[i,j] <- sigma2[4] * exp(- pow(l[5] * d[i,j],2)) k3[i,j] <- sigma2[3] * pow(1+pow(l[4] * d[i,j],2)/alpha, -alpha) k2[i,j] <- sigma2[2] * exp(- pow(l[2] * d[i,j],2) - 2 * pow(l[3] * sin(pi*d[i,j] / per), 2)) k1[i,j] <- sigma2[1] * exp(- pow(l[1] * d[i,j],2)) for (j in (i+1):length(y)) { for (i in 1:(length(y)-1)) { y ~ dmnorm(mu, inverse(Sigma)) 28
Diagnostics 29 sigma2[1] sigma2[2] sigma2[3] sigma2[4] sigma2[5] 0.8 40 0.04 2.0 6000 0.6 30 1.5 4000 0.03 0.4 20 1.0 2000 0.2 10 0.5 0.02 0 0.0 0.0 0 l[1] l[2] l[3] l[4] l[5] 0.020 1.2 6 0.06 0.9 estimate 0.015 1.0 0.6 4 0.04 0.010 0.8 0.3 2 0.005 0.02 0.6 0.0 0 250500750 1000 0 250500750 1000 0 250500750 1000 0 250500750 1000 alpha 8 6 4 2 0 0 250500750 1000 .iteration
Recommend
More recommend