Evolution and Population Genetics 02-‑715 ¡Advanced ¡Topics ¡in ¡Computa8onal ¡ Genomics ¡
A Human Coalescence ¡at ¡the ¡most ¡recent ¡common ¡ancestor ¡ Genealogy ¡
Coalescence in Population Genetics • Stochas8c ¡model ¡for ¡gene ¡ frequencies ¡in ¡finite ¡popula8ons ¡ • Assump8ons ¡ – The ¡popula8on ¡size ¡N ¡is ¡constant ¡ from ¡genera8on ¡to ¡genera8on ¡ – Organisms ¡are ¡diploid ¡(2N ¡copies ¡of ¡ each ¡gene) ¡ – All ¡members ¡of ¡each ¡genera8on ¡ reproduce ¡simultaneously: ¡ genera8ons ¡do ¡not ¡overlap ¡ – Random ¡ma8ng ¡ – Allele ¡frequencies ¡are ¡not ¡perturbed ¡ by ¡migra8on ¡or ¡selec8on ¡
Coalescence in Population Genetics • The ¡model ¡traces ¡the ¡ancestry ¡ of ¡each ¡individual ¡at ¡the ¡current ¡ genera8on ¡backward ¡ • An ¡individual ¡at ¡genera8on ¡ t ¡ randomly ¡samples ¡two ¡ individuals ¡at ¡genera8on ¡ t-‑1 ¡as ¡ parents ¡ • In ¡finite ¡number ¡of ¡genera8ons, ¡ all ¡individuals ¡will ¡coalesce ¡into ¡ a ¡single ¡individual ¡ ¡
Coalescence • Assume ¡effec8ve ¡popula8on ¡size ¡of ¡N: ¡2N ¡copies ¡in ¡diploid ¡ organisms ¡ • The ¡probability ¡that ¡two ¡genes ¡share ¡a ¡common ¡parent ¡in ¡the ¡ previous ¡genera8on: ¡1/(2N) ¡ • The ¡probability ¡that ¡the ¡two ¡genes ¡do ¡not ¡share ¡a ¡common ¡parent ¡ in ¡the ¡previous ¡genera8on: ¡1-‑1/(2N) ¡ • The ¡probability ¡of ¡coalescence ¡at ¡8me ¡T: ¡ ¡ P ( T ) = (1 − 1 2 N ) T − 1 1 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ 2 N – For ¡large ¡N, ¡we ¡have ¡ − T − 1 P ( T ) = 1 2 N e 2 N
Write-Fisher Model • Looking ¡back ¡in ¡8me, ¡the ¡ stochas8c ¡model ¡defines ¡the ¡ probability ¡ F t ¡that ¡two ¡genes ¡are ¡ iden8cal ¡by ¡descent ¡in ¡ genera8on ¡ t ¡through ¡ F t-1 F t = 1 2 N (1 − µ ) 2 + (1 − 1 2 N )(1 − µ ) 2 F t − 1 Both ¡genes ¡are ¡copies ¡of ¡a ¡ Two ¡genes ¡are ¡nonmutant ¡copies ¡ single ¡gene ¡from ¡ of ¡different ¡genes ¡in ¡the ¡previous ¡ genera8on ¡t-‑1 ¡and ¡neither ¡ genera8on ¡and ¡those ¡two ¡genes ¡ copy ¡is ¡mutant ¡ are ¡iden8cal ¡by ¡descent ¡ – µ : mutation rate – N : population size
Phylogenetics vs. Population Genetics • Phylogene8cs ¡ – Assumes ¡a ¡single ¡correct ¡species ¡phylogeny ¡that ¡holds ¡across ¡genomes ¡ – Ignores ¡varia8ons ¡among ¡individuals ¡of ¡the ¡same ¡species ¡or ¡assumes ¡a ¡ negligible ¡variability ¡within ¡species ¡ – Reduces ¡the ¡en8re ¡popula8on ¡of ¡a ¡species ¡into ¡a ¡single ¡individual ¡ • Popula8on ¡gene8cs ¡ – Usually ¡concerned ¡with ¡within-‑species ¡varia8on ¡in ¡genomes ¡ – Individuals ¡within ¡a ¡species ¡are ¡related ¡by ¡genealogies ¡ Siepel, ¡A. ¡Genome ¡Res. ¡19(11):1929-‑41. ¡2009. ¡ Phylogenomics ¡of ¡primates ¡and ¡their ¡ancestral ¡popula8ons. ¡
Population-aware Phylogenetics • Primate ¡species ¡ – Divergence ¡8me ¡is ¡short ¡rela8ve ¡to ¡ancestral ¡popula8on ¡sizes ¡ – Phylogene8cs ¡assump8ons ¡do ¡not ¡hold ¡ – Non-‑negligible ¡popula8on ¡gene8c ¡effects ¡ • Interspecies ¡comparison, ¡taking ¡into ¡account ¡selec8ve ¡forces ¡ within ¡species, ¡ancestral ¡popula8ons, ¡modes ¡of ¡specia8on ¡
Phylogeny of Primates Siepel, ¡A. ¡Genome ¡Res. ¡19(11):1929-‑41. ¡2009. ¡ Phylogenomics ¡of ¡primates ¡and ¡their ¡ancestral ¡popula8ons. ¡
Darwin’s Phylogeny
Genealogies in Wright-Fisher Model
Population Genetic Interpretation of Speciation • T: ¡coalescent ¡8me ¡ • τ: ¡specia8on ¡8me ¡ ¡
Population Genetic Interpretation of Speciation • τ>>2N e : ¡ ¡ – τ+T ¡is ¡approximately ¡τ ¡ – Divergence ¡between ¡ individual ¡chromosomes ¡ as ¡an ¡es8mate ¡of ¡ specia8on ¡8me ¡ – the ¡phylogene8cs ¡ assump8on ¡holds ¡
Population Genetic Interpretation of Speciation • τ<<N e : ¡ ¡ – τ+T ¡is ¡approximately ¡T ¡ – Coalescent ¡8me ¡ dominates ¡ – Equivalent ¡to ¡the ¡ coalescent ¡in ¡popula8on ¡ gene8cs ¡
Population Genetic Interpretation of Speciation • τ~N e : ¡ ¡ – Both ¡ancestral ¡ popula8on ¡dynamics ¡and ¡ interspecies ¡divergence ¡ must ¡be ¡considered ¡ – Popula8on-‑aware ¡ phylogene8cs ¡
Three-Species Phylogeny Three ¡species ¡X, ¡Y, ¡and ¡Z ¡with ¡ • specia8on ¡8me ¡and ¡coalescent ¡8me ¡ – X: ¡human ¡ Y: ¡chimpanzee ¡ – Z: ¡gorilla ¡ – Ancestral ¡popula8ons: ¡XY ¡and ¡XYZ ¡ • Black ¡phylogeny: ¡discordance ¡with ¡ • the ¡phylogeny ¡among ¡the ¡three ¡ species ¡ Gray ¡phylogeny: ¡concordant ¡with ¡the ¡ • phylogeny ¡among ¡the ¡three ¡species ¡ ILS: ¡incomplete ¡lineage ¡sor8ng ¡with ¡ • deep ¡coalescent ¡ – Gene ¡tree ¡and ¡species ¡tree ¡can ¡differ ¡
Three-Species Phylogeny • Incomplete ¡lineage ¡sor8ng ¡ – The ¡probability ¡that ¡X ¡and ¡Y ¡ will ¡coalesce ¡before ¡the ¡ divergence ¡from ¡Z ¡ ¡ ¡ ¡ ¡where ¡ ¡ ¡Nxy: ¡popula8on ¡size ¡of ¡XY ¡
Three-Species Phylogeny • When ¡N xy , ¡N xyz ¡are ¡ small, ¡τ xy ¡and ¡τ xyz ¡ approximate ¡the ¡ divergence ¡8me ¡well ¡ • Otherwise, ¡the ¡ coalescent ¡8me ¡T xy , ¡T xyz ¡ need ¡to ¡be ¡taken ¡into ¡ account ¡
Ancestral Recombination Graph for Three Individuals • Different ¡genealogies ¡for ¡ different ¡regions ¡of ¡a ¡ chromosome ¡due ¡to ¡ recombina8on ¡ • Ancestral ¡recombina8on ¡graph ¡ represents ¡a ¡marginal ¡ genealogy ¡that ¡summarizes ¡ the ¡genealogies ¡across ¡the ¡ whole ¡chromosome ¡ • Most ¡recent ¡common ¡ancestor ¡ (MRCA): ¡all ¡chromosomes ¡ eventually ¡coalesce ¡to ¡the ¡ Ancestral ¡Recombina8on ¡ common ¡ancestor ¡ Graph ¡
Ancestral Recombination Graph for Three Individuals • Phylogene8c ¡ancestral ¡ recombina8on ¡graph ¡ – Recombina8ons ¡and ¡ coalescence ¡are ¡ constrained ¡by ¡the ¡ phylogene8c ¡tree ¡ Phylogene8c ¡ Ancestral ¡Recombina8on ¡ Graph ¡
What if We Ignore Incomplete Lineage Sorting • Aligned ¡human ¡(Hom), ¡chimpanzee ¡(Pan), ¡gorilla ¡(Gor), ¡ orangutan ¡(Pon) ¡sequences ¡ • Two ¡different ¡es8mated ¡lineages ¡ • Without ¡considera8on ¡of ¡ILS, ¡subs8tu8on ¡rates ¡are ¡ overes8mated ¡
Coal-HMM (Hobolth et al., 2009) • Four ¡states ¡ corresponding ¡to ¡ different ¡ phylogenies ¡with ¡ ILS ¡ • Transi8ons ¡to ¡ other ¡states ¡ correspond ¡to ¡ recombina8ons ¡
Coal-HMM • HC1 ¡state ¡(with ¡no ¡ILS) ¡explains ¡only ¡~50% ¡of ¡sites ¡ • Remaining ¡states ¡explain ¡the ¡other ¡50% ¡propor8oned ¡roughly ¡ equally ¡
Summary • Popula8on ¡gene8cs ¡considers ¡the ¡difference ¡in ¡genome ¡ sequences ¡within ¡a ¡species, ¡whereas ¡phylogenomics ¡considers ¡ the ¡genome ¡sequence ¡difference ¡across ¡species ¡ • For ¡recently ¡diverged ¡species ¡with ¡rela8vely ¡small ¡popula8on ¡ sizes, ¡one ¡needs ¡to ¡consider ¡phylogene8cs ¡and ¡popula8on ¡ gene8cs ¡ideas ¡simultaneously ¡
Recommend
More recommend