Hidden Markov Models Aar$ Singh Slides courtesy: Eric - PowerPoint PPT Presentation

Hidden ¡Markov ¡Models ¡ Aar$ ¡Singh ¡ Slides ¡courtesy: ¡Eric ¡Xing ¡ ¡ ¡ Machine ¡Learning ¡10-‑601 ¡ Nov ¡1, ¡2011 ¡

i.i.d ¡to ¡sequen3al ¡data ¡ • So ¡far ¡we ¡assumed ¡independent, ¡ iden$cally ¡distributed ¡data ¡ • Sequen$al ¡data ¡ – Time-‑series ¡data ¡ ¡ ¡E.g. ¡Speech ¡ ¡ – Characters ¡in ¡a ¡sentence ¡ – Base ¡pairs ¡along ¡a ¡DNA ¡strand ¡

Represen3ng ¡sequen3al ¡data ¡ • How ¡do ¡we ¡represent ¡and ¡learn ¡P(X 1 , ¡X 2 , ¡…, ¡X n )? ¡ X 2 ¡ X 3 ¡ X 4 ¡ X 5 ¡ X 1 ¡ • Every ¡variable ¡depends ¡on ¡past ¡few ¡variables. ¡

Markov ¡Models ¡ • Joint ¡Distribu$on ¡ ¡ Chain ¡rule ¡ i ¡ i ¡ ¡ • Markov ¡Assump$on ¡(m th ¡order) ¡ Current observation only depends on past i ¡ i ¡ m observations n • Special ¡case ¡of ¡Bayes ¡Nets ¡ Y p ( X ) = p ( X i | pa ( X i )) i =1

Markov ¡Models ¡ • Markov ¡Assump$on ¡ ¡ ¡1 st ¡order ¡ ¡ ¡ ¡ ¡2 nd ¡order ¡

Markov ¡Models ¡ # parameters in stationary model • Markov ¡Assump$on ¡ ¡ K-ary variables ¡1 st ¡order ¡ O(K 2 ) ¡ ¡m th ¡order ¡ O(K m+1 ) ¡ ¡n-‑1 th ¡order ¡ O(K n ) ¡≡ ¡no ¡assump$ons ¡– ¡complete ¡(but ¡directed) ¡graph ¡ Homogeneous/stationary Markov model (probabilities don’t depend on n) ¡

Hidden ¡Markov ¡Models ¡ • Distribu$ons ¡that ¡characterize ¡sequen$al ¡data ¡with ¡few ¡ parameters ¡but ¡are ¡not ¡limited ¡by ¡strong ¡Markov ¡assump$ons. ¡ S 1 ¡ S 2 ¡ S T-‑1 ¡ S T ¡ O 2 ¡ O T-‑1 ¡ O T ¡ O 1 ¡ ¡ ¡ ¡ ¡ Observa$on ¡space ¡ ¡ ¡O t ¡ϵ ¡{y 1 , ¡y 2 , ¡…, ¡y K } ¡e.g. ¡pixels ¡in ¡ ¡Hidden ¡states ¡ ¡ ¡S t ¡ϵ ¡{1, ¡…, ¡ I } ¡ ¡e.g. ¡{a,b,c,…z} ¡ ¡ ¡

Hidden ¡Markov ¡Models ¡ S 1 ¡ S 2 ¡ S T-‑1 ¡ S T ¡ O 2 ¡ O T-‑1 ¡ O T ¡ O 1 ¡ 1 st ¡order ¡Markov ¡assump$on ¡on ¡hidden ¡states ¡ ¡{S t } ¡ ¡t ¡= ¡1, ¡…, ¡T ¡ (can ¡be ¡extended ¡to ¡higher ¡order). ¡ ¡ Note: ¡O t ¡depends ¡on ¡all ¡previous ¡observa$ons ¡{O t-‑1 ,…O 1 } ¡

HMM ¡Example ¡ • The ¡Dishonest ¡Casino ¡ A ¡casino ¡has ¡two ¡die: ¡ Fair ¡dice ¡ ¡ Loaded ¡dice ¡ ¡ ¡ Casino ¡player ¡switches ¡back-‑&-‑ forth ¡between ¡fair ¡and ¡loaded ¡die ¡

HMM ¡Example ¡ L ¡ F ¡ F ¡ F ¡ L ¡ L ¡ L ¡ F ¡

Hidden ¡Markov ¡Models ¡ • Parameters ¡– ¡ sta$onary/homogeneous ¡markov ¡model ¡ (independent ¡of ¡$me ¡t) ¡ S 1 ¡ S 2 ¡ S T-‑1 ¡ S T ¡ ¡Ini$al ¡probabili$es ¡ ¡ ¡p(S 1 ¡= ¡i) ¡= ¡π i ¡ O 1 ¡ O 2 ¡ O T-‑1 ¡ O T ¡ ¡ ¡Transi$on ¡probabili$es ¡ ¡ ¡p(S t ¡= ¡j|S t-‑1 ¡= ¡i) ¡= ¡p ij ¡ ¡ ¡Emission ¡probabili$es ¡ ¡ ¡p(O t ¡ = ¡y|S t = ¡i) ¡= ¡ ¡

HMM ¡Example ¡ • The ¡Dishonest ¡Casino ¡ A ¡casino ¡has ¡two ¡die: ¡ Fair ¡dice ¡ P(1) ¡= ¡P(2) ¡= ¡P(3) ¡= ¡P(5) ¡= ¡P(6) ¡= ¡1/6 ¡ Loaded ¡dice ¡ P(1) ¡= ¡P(2) ¡= ¡P(3) ¡= ¡P(5) ¡= ¡1/10 ¡ P(6) ¡= ¡½ ¡ ¡ Casino ¡player ¡switches ¡back-‑&-‑ forth ¡between ¡fair ¡and ¡loaded ¡die ¡ once ¡every ¡20 ¡turns ¡

State ¡Space ¡Representa3on ¡ • Switch ¡between ¡ F ¡and ¡ L ¡once ¡every ¡20 ¡turns ¡(1/20 ¡= ¡0.05) ¡ 0.05 ¡ 0.95 ¡ 0.95 ¡ L ¡ F ¡ 0.05 ¡ • HMM ¡Parameters ¡ ¡Ini$al ¡probs ¡ ¡ ¡ ¡ ¡P(S 1 ¡ = ¡ L ) ¡= ¡0.5 ¡= ¡P(S 1 ¡= ¡ F ) ¡ ¡ ¡Transi$on ¡probs ¡ ¡P(S t ¡= ¡ L / F |S t-‑1 ¡= ¡ L / F ) ¡= ¡0.95 ¡ ¡ ¡ ¡ ¡P(S t ¡= ¡ F / L |S t-‑1 ¡= ¡ L / F ) ¡= ¡0.05 ¡ ¡ ¡ ¡ ¡ ¡Emission ¡probabili$es ¡ ¡ ¡P(O t ¡ = ¡y|S t = ¡ F ) ¡= ¡1/6 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡y ¡= ¡1,2,3,4,5,6 ¡ ¡ ¡ ¡ ¡ ¡P(O t ¡ = ¡y|S t = ¡ L ) ¡= ¡1/10 ¡ ¡ ¡ ¡ ¡ ¡y ¡= ¡1,2,3,4,5 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡= ¡1/2 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡y ¡= ¡6 ¡ ¡

HMM ¡Problems ¡

Three ¡main ¡problems ¡in ¡HMMs ¡ • Evalua$on ¡– ¡ Given ¡HMM ¡parameters ¡& ¡observa$on ¡seqn ¡ ¡ ¡find ¡ ¡ ¡ ¡ ¡ ¡ ¡prob ¡of ¡observed ¡sequence ¡ • Decoding ¡– ¡ Given ¡HMM ¡parameters ¡& ¡observa$on ¡seqn ¡ ¡ ¡find ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡most ¡probable ¡ ¡sequence ¡of ¡hidden ¡states ¡ • Learning ¡– ¡ Given ¡HMM ¡with ¡unknown ¡parameters ¡and ¡ ¡ ¡ ¡observa$on ¡sequence ¡ ¡ ¡find ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡parameters ¡that ¡maximize ¡ ¡likelihood ¡of ¡observed ¡data ¡

HMM ¡Algorithms ¡ • Evalua$on ¡– ¡ What ¡is ¡the ¡probability ¡of ¡the ¡observed ¡ sequence? ¡Forward ¡Algorithm ¡ • Decoding ¡– ¡ What ¡is ¡the ¡probability ¡that ¡the ¡third ¡roll ¡was ¡ loaded ¡given ¡the ¡observed ¡sequence? ¡Forward-‑Backward ¡ Algorithm ¡ ¡– ¡What ¡is ¡the ¡most ¡likely ¡die ¡sequence ¡given ¡the ¡observed ¡ sequence? ¡Viterbi ¡Algorithm ¡ ¡ • Learning ¡– ¡ Under ¡what ¡parameteriza$on ¡is ¡the ¡observed ¡ sequence ¡most ¡probable? ¡Baum-‑Welch ¡Algorithm ¡(EM) ¡

Evalua3on ¡Problem ¡ • Given ¡HMM ¡parameters ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡& ¡observa$on ¡ sequence ¡ S T-‑1 ¡ S 1 ¡ S 2 ¡ S T ¡ ¡find ¡probability ¡of ¡observed ¡sequence ¡ O T-‑1 ¡ O T ¡ O 1 ¡ O 2 ¡ ¡ ¡ ¡ ¡ ¡requires ¡summing ¡over ¡all ¡possible ¡hidden ¡state ¡values ¡at ¡all ¡ $mes ¡– ¡K T ¡exponen$al ¡# ¡terms! ¡ ¡Instead: ¡ k ¡ Compute recursively α T ¡

Forward ¡Probability ¡ ¡ k ¡ Compute ¡forward ¡probability ¡ ¡ ¡ ¡ ¡ ¡ ¡recursively ¡over ¡t ¡ ¡ α t ¡ S t-‑1 ¡ S t ¡ S 1 ¡ O t-‑1 ¡ O t ¡ O 1 ¡ Introduce ¡S t-‑1 ¡ . ¡ Chain ¡rule ¡ . ¡ . ¡ Markov ¡assump$on ¡

Forward ¡Algorithm ¡ Can ¡compute ¡α t k ¡ ¡for ¡all ¡k, ¡t ¡using ¡dynamic ¡programming: ¡ ¡ • Ini$alize: ¡ ¡α 1 k ¡= ¡p(O 1 |S 1 ¡= ¡k) ¡p(S 1 ¡= ¡k) ¡ ¡for ¡all ¡k ¡ • Iterate: ¡for ¡t ¡= ¡2, ¡…, ¡T ¡ i ¡ ¡ ¡ ¡α t k ¡= ¡p(O t |S t ¡= ¡k) ¡∑ ¡α t-‑1 ¡ p(S t ¡= ¡k|S t-‑1 ¡= ¡i) ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡for ¡all ¡k ¡ i ¡ k ¡ • Termina$on: ¡ ¡ ¡ ¡ ¡ ¡= ¡∑ ¡α T ¡ k ¡

Decoding ¡Problem ¡1 ¡ • Given ¡HMM ¡parameters ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡& ¡observa$on ¡ sequence ¡ ¡find ¡probability ¡that ¡hidden ¡state ¡at ¡$me ¡t ¡was ¡k ¡ ¡ ¡ ¡ ¡ k ¡ k ¡ Compute recursively β t ¡ α t ¡ S t-‑1 ¡ S t ¡ S t+1 ¡ S 1 ¡ S T-‑1 ¡ S T ¡ O t-‑1 ¡ O t ¡ O t+1 ¡ O 1 ¡ O T-‑1 ¡ O T ¡

Backward ¡Probability ¡ ¡ k ¡ Compute ¡backward ¡probability ¡ ¡ ¡ ¡ ¡ ¡ ¡recursively ¡over ¡t ¡ ¡ β t ¡ S t ¡ S t+1 ¡ S T-‑1 ¡ S T ¡ O t+1 ¡ O T-‑1 ¡ O T ¡ Introduce ¡S t+1 ¡ . ¡ Chain ¡rule ¡ . ¡ . ¡ Markov ¡assump$on ¡

Backward ¡Algorithm ¡ Can ¡compute ¡β t k ¡ ¡for ¡all ¡k, ¡t ¡using ¡dynamic ¡programming: ¡ ¡ • Ini$alize: ¡ ¡β T k ¡= ¡1 ¡ ¡for ¡all ¡k ¡ • Iterate: ¡for ¡t ¡= ¡T-‑1, ¡…, ¡1 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡for ¡all ¡k ¡ • Termina$on: ¡ ¡ ¡

Hidden Markov Models Aar$ Singh Slides courtesy: Eric - PowerPoint PPT Presentation

Hidden Markov Models Aar$ Singh Slides courtesy: Eric Xing Machine Learning 10-601 Nov 1, 2011 i.i.d to sequen3al data So far we

1 X 1 X 2 X 3 Ghostbusters HMM Chain Rule and HMMs E 1 E 2 E 3 P(X 1 ) = uniform 1/9 1/9

CSE P 590 A Markov Models and Hidden Markov Models

Hidden Markov Models Pratik Lahiri Introduction A hidden Markov model (HMM) is a

CSE 527 " Markov Models and Hidden Markov Models !

CSE 427 Markov Models and Hidden Markov Models 2

CSE P 527 Markov Models and Hidden Markov Models 1 2

1 Real HMM Examples Real HMM Examples Speech recognition HMMs: Machine translation HMMs:

Markov chains and Hidden Markov Models 9000 Markov chains and HMMs We will discuss: Markov

1 Real HMM Examples Real HMM Examples Speech recognition HMMs: Machine translation HMMs:

CSE 527 Lectures 12-13 Markov Models and Hidden Markov Models DNA Methylation CH 3 CpG - 2

CSE 527 Lectures 11-12 Markov Models and Hidden Markov Models DNA Methylation CH 3 CpG - 2

Markov Models Kunsch, H.R., State Space and Hidden Markov Models . ETH- Zurich, Zurich;

Markov Chains and Hidden Markov Models COMP 571 Luay Nakhleh, Rice University Markov Chains and

Markov Chains and Hidden Markov Models COMP 571 Luay Nakhleh, Rice University 2 Markov Chains

A C Standard model has 1-1 correspondence between symbols and states, P(A | T) thus P ( x i

HMM Review Lecture Outline 1. Markov models 2. Hidden Markov

Introduction to Hidden Markov Models Antonio Art es-Rodr guez Unviersidad Carlos III de

A spectral algorithm for learning hidden Markov models . . . h 3 h 2 h 1 x 3 x 2 x 1 Daniel Hsu

CSE 427 Markov Models and Hidden Markov Models How Proteins Read DNA E.g.:

Markov Chains and Hidden Markov Models COMP 571 - Spring 2015 Luay Nakhleh, Rice University

Outline depmixS4: an R-package for hidden Markov models Hidden Markov Models Ingmar Visser 1

Markov Models and Hidden Markov Models Robert Platt Northeastern University Some images and

Markov Models and Hidden Markov Models Robert Platt Northeastern University Some images and

Hidden Markov Models Markov Model (Finite State Machine with Probs) Modeling a sequence of

Hidden Markov Models Aar$ Singh Slides courtesy: Eric - PowerPoint PPT Presentation

Hidden Markov Models Aar$ Singh Slides courtesy: Eric Xing Machine Learning 10-601 Nov 1, 2011 i.i.d to sequen3al data So far we

1 X 1 X 2 X 3 Ghostbusters HMM Chain Rule and HMMs E 1 E 2 E 3 P(X 1 ) = uniform 1/9 1/9

CSE P 590 A Markov Models and Hidden Markov Models

Hidden Markov Models Pratik Lahiri Introduction A hidden Markov model (HMM) is a

CSE 527 &quot; Markov Models and Hidden Markov Models !

CSE 427 Markov Models and Hidden Markov Models 2

CSE P 527 Markov Models and Hidden Markov Models 1 2

1 Real HMM Examples Real HMM Examples Speech recognition HMMs: Machine translation HMMs:

Markov chains and Hidden Markov Models 9000 Markov chains and HMMs We will discuss: Markov

1 Real HMM Examples Real HMM Examples Speech recognition HMMs: Machine translation HMMs:

CSE 527 Lectures 12-13 Markov Models and Hidden Markov Models DNA Methylation CH 3 CpG - 2

CSE 527 Lectures 11-12 Markov Models and Hidden Markov Models DNA Methylation CH 3 CpG - 2

Markov Models Kunsch, H.R., State Space and Hidden Markov Models . ETH- Zurich, Zurich;

Markov Chains and Hidden Markov Models COMP 571 Luay Nakhleh, Rice University Markov Chains and

Markov Chains and Hidden Markov Models COMP 571 Luay Nakhleh, Rice University 2 Markov Chains

A C Standard model has 1-1 correspondence between symbols and states, P(A | T) thus P ( x i

HMM Review Lecture Outline 1. Markov models 2. Hidden Markov

Introduction to Hidden Markov Models Antonio Art es-Rodr guez Unviersidad Carlos III de

A spectral algorithm for learning hidden Markov models . . . h 3 h 2 h 1 x 3 x 2 x 1 Daniel Hsu

CSE 427 Markov Models and Hidden Markov Models How Proteins Read DNA E.g.:

Markov Chains and Hidden Markov Models COMP 571 - Spring 2015 Luay Nakhleh, Rice University

Outline depmixS4: an R-package for hidden Markov models Hidden Markov Models Ingmar Visser 1

Markov Models and Hidden Markov Models Robert Platt Northeastern University Some images and

Markov Models and Hidden Markov Models Robert Platt Northeastern University Some images and

Hidden Markov Models Markov Model (Finite State Machine with Probs) Modeling a sequence of

CSE 527 " Markov Models and Hidden Markov Models !