Natural Selection 02-‑715 ¡Advanced ¡Topics ¡in ¡Computa8onal ¡ Genomics ¡
Natural Selection • Compara8ve ¡studies ¡across ¡species ¡ – O=en ¡focus ¡on ¡protein-‑coding ¡regions ¡ – Genes ¡under ¡selec8ve ¡pressure ¡ • Immune-‑related ¡func8ons ¡ • Spermatogenesis ¡ • Olfac8on ¡and ¡sensory ¡percep8on ¡ • Studies ¡within ¡species ¡ ¡ – Based ¡on ¡polymorphic ¡loci ¡in ¡genomes ¡
Divergence and Selection • Gene8c ¡dri=: ¡the ¡stochas8c ¡change ¡in ¡popula8on ¡frequency ¡of ¡a ¡ muta8on ¡due ¡to ¡the ¡sampling ¡process ¡that ¡is ¡inherent ¡in ¡ reproduc8on. ¡ ¡ • Selec8ve ¡sweep: ¡The ¡process ¡by ¡which ¡new ¡favourable ¡muta8ons ¡ become ¡fixed ¡so ¡quickly ¡that ¡physically ¡linked ¡alleles ¡also ¡become ¡ either ¡fixed ¡or ¡lost ¡depending ¡on ¡the ¡phase ¡of ¡the ¡linkage ¡ • Fixa8on: ¡the ¡state ¡where ¡a ¡muta8on ¡has ¡achieved ¡a ¡frequency ¡of ¡ 100% ¡in ¡a ¡natural ¡popula8on ¡ • Hitchhiking ¡of ¡neighboring ¡polymorphisms ¡
Complete vs Incomplete Sweep • Complete ¡sweep: ¡the ¡favored ¡allele ¡reaches ¡a ¡fixa8on ¡ – Local ¡varia8on ¡is ¡removed ¡except ¡the ¡ones ¡that ¡arise ¡by ¡muta8on ¡and ¡ recombina8on ¡during ¡the ¡selec8ve ¡sweep ¡ • Incomplete ¡sweep: ¡posi8vely ¡selected ¡alleles ¡are ¡currently ¡on ¡ the ¡rise, ¡but ¡have ¡not ¡reached ¡a ¡frequency ¡of ¡100% ¡
Selective Sweep
Different Types of Natural Selection • Direc8onal ¡selec8on ¡ – Posi8ve ¡selec8on ¡ • Reduces ¡gene8c ¡diversity ¡ • The ¡small ¡region ¡around ¡the ¡selected ¡varia8on ¡is ¡over-‑represented ¡ • Hitch-‑hiking ¡ – Nega8ve ¡selec8on ¡(purifying ¡selec8on) ¡ • Can ¡lead ¡to ¡background ¡selec8on, ¡where ¡linked ¡varia8ons ¡are ¡also ¡ removed ¡ • Reduces ¡gene8c ¡diversity, ¡but ¡no ¡skewing ¡in ¡allele ¡frequencies ¡
Different Types of Natural Selection • Balancing ¡selec8on: ¡a ¡selec8on ¡for ¡the ¡maintenance ¡of ¡two ¡or ¡ more ¡alleles ¡at ¡a ¡single ¡locus ¡in ¡a ¡popula8on ¡ – Heterozygote ¡advantage ¡over ¡homozygotes ¡ • G6PD ¡muta8on ¡ – G6PD ¡enzyme ¡deficiency ¡and ¡sickle-‑cell ¡anemia ¡in ¡homozygote ¡state ¡ – Par8al ¡protec8on ¡against ¡malaria ¡in ¡the ¡heterozygous ¡state ¡ • CFTR ¡muta8on ¡ – Causes ¡cys8c ¡fibrosis ¡in ¡the ¡homozygous ¡state ¡ – Protects ¡against ¡asthma ¡in ¡the ¡heterozygous ¡state ¡ • Disrup8ve ¡(diversifying) ¡selec8on: ¡extreme ¡values ¡of ¡the ¡traits ¡ are ¡favored ¡than ¡intermediate ¡values ¡
Time Scales for the Signatures of Selection
1. Proportion of Functional Changes • Non-‑synonymous ¡muta8ons ¡are ¡likely ¡to ¡induce ¡func8onal ¡ changes ¡ – O=en ¡deleterious ¡and ¡Less ¡likely ¡to ¡become ¡common ¡or ¡reach ¡fixa8on ¡ • Posi8ve ¡selec8on ¡for ¡occasional ¡beneficial ¡muta8on ¡
McDonald-Kreitman Test • Given ¡sequences ¡for ¡a ¡candidate ¡gene ¡for ¡two ¡species ¡ – Count ¡synonymous/nonsynonymous ¡subs8tu8ons ¡ – Count ¡divergent/polymorphic ¡loci ¡ • Divergence: ¡monomorphic ¡sites ¡that ¡differ ¡in ¡the ¡species ¡ • Polymorphism: ¡loci ¡that ¡are ¡polymorphic ¡in ¡one ¡or ¡both ¡species ¡ Divergence ¡ Plymorphism ¡ Synonymous ¡ D s ¡ P s ¡ Nonsynonymous ¡ D n ¡ P n ¡ (Replacement) ¡ • If ¡synonymous ¡sites ¡are ¡at ¡most ¡weakly ¡selected, ¡the ¡excess ¡of ¡ divergent ¡nonsynonymous ¡subs8tu8ons ¡must ¡be ¡the ¡result ¡of ¡ posi8ve ¡selec8on ¡ • Under ¡the ¡null ¡hypothesis ¡of ¡no ¡selec8on, ¡ D n / P n = D s / P s ¡ • Perform Χ 2 test ¡
McDonald-Kreitman Test
McDonald-Kreitman Test • Comparison ¡of ¡sequences ¡between ¡species. ¡ • Focuses ¡on ¡posi8ve ¡selec8on ¡of ¡beneficial ¡muta8ons. ¡ • Limita8on: ¡mul8ple ¡muta8ons ¡are ¡required ¡to ¡be ¡detected ¡as ¡ posi8vely ¡selected. ¡
PRM1 Exon 2
2. Reduction in Genetic Diversity • Hitch-‑hiking ¡of ¡neutral ¡muta8ons ¡near ¡beneficial ¡muta8ons ¡ • Selec8ve ¡sweep ¡lowers ¡the ¡gene8c ¡diversity ¡ • Subsequent ¡muta8ons ¡restores ¡gene8c ¡diversity ¡ ¡ – Rare ¡alleles ¡at ¡low ¡frequency ¡ • ~ ¡1 ¡million ¡years ¡for ¡a ¡rare ¡allele ¡to ¡dri= ¡to ¡a ¡high ¡frequency ¡ allele ¡
Low Diversity and Many Rare Alleles
Low Diversity and Many Rare Alleles • Speed ¡of ¡posi8ve ¡selec8on ¡ – Rapid ¡selec8on ¡ ¡ • larger ¡selected ¡region ¡ • easier ¡detec8on ¡but ¡harder ¡to ¡dis8nguish ¡between ¡hitchhiking ¡and ¡ beneficial ¡varia8ons ¡ • Recombina8on ¡rate ¡ – Lower ¡recombina8on ¡rate ¡leads ¡to ¡a ¡larger ¡selected ¡region ¡
Low Diversity and Many Rare Alleles
Tajima’s D Statistic • Segrega8ng ¡sites ¡( S ): ¡the ¡nucleo8de ¡sites ¡that ¡are ¡ polymorphic ¡in ¡a ¡sample ¡of ¡individuals ¡ • Nucleo8de ¡mismatches ¡(π): ¡the ¡nucleo8de ¡sites ¡in ¡the ¡sample ¡ that ¡differ ¡between ¡individual ¡pairs ¡of ¡sequences ¡
Tajima’s D Statistic • Under ¡neutral ¡evolu8on ¡ n − 1 1 ∑ E ( π ) = θ E ( S ) = θ i i = 1 n − 1 1 ∑ • Test ¡if ¡ S/a = π ¡ ¡where ¡ a = i i = 1 • If ¡the ¡frequency ¡of ¡the ¡polymorphic ¡variants ¡are ¡unequal ¡ (skewed ¡allele ¡frequencies ¡with ¡rare ¡alleles), ¡ π ¡-‑ ¡ S/a ¡will ¡be ¡ nega8ve ¡
3. High-frequency Derived Alleles • Derived ¡vs ¡ancestral ¡alleles ¡ – Use ¡alleles ¡in ¡closely ¡related ¡species ¡for ¡dis8nc8on ¡ • Derived ¡alleles ¡typically ¡have ¡lower ¡frequency, ¡but ¡under ¡ selec8ve ¡pressure, ¡the ¡frequency ¡rises ¡ • Many ¡high-‑frequency ¡derived ¡alleles ¡as ¡a ¡signature ¡for ¡ posi8ve ¡selec8on ¡
High-frequency Derived Alleles • Duffy ¡red ¡cell ¡an8gen ¡in ¡Africans: ¡selec8on ¡for ¡resistance ¡to ¡P. ¡ vivax ¡malaria ¡(red: ¡derived, ¡grey: ¡ancestral) ¡
Rare vs Derived Alleles • Popula8on ¡expansion ¡is ¡a ¡confounder ¡for ¡rare-‑allele ¡test, ¡but ¡ not ¡for ¡derived ¡alleles ¡ • High-‑frequency ¡derived ¡alleles ¡rapidly ¡dri= ¡to ¡near ¡fixa8on, ¡ thus ¡persists ¡for ¡a ¡shorter ¡period ¡8me. ¡ ¡
4. Population Differences • Geographically ¡separate ¡popula8ons ¡and ¡different ¡selec8ve ¡ pressure ¡on ¡different ¡popula8ons. ¡ • Rela8vely ¡large ¡differences ¡in ¡allele ¡frequencies ¡between ¡ popula8ons ¡as ¡a ¡signature ¡for ¡posi8ve ¡selec8on. ¡ • Useful ¡only ¡for ¡posi8ve ¡selec8on ¡a=er ¡popula8on ¡ differen8a8on ¡(e.g., ¡human ¡migra8on ¡out ¡of ¡Africa ¡ 50,000-‑75,000 ¡years ¡ago) ¡ • F ST ¡ can ¡be ¡used ¡as ¡test ¡sta8s8c ¡
Extreme Population Differences • FY*O ¡allele ¡for ¡resistance ¡to ¡P. ¡vivax ¡malaria ¡
5. Long Haplotypes • Alleles ¡under ¡recent ¡posi8ve ¡selec8on, ¡thus ¡liale ¡break-‑downs ¡ by ¡recombina8on ¡ – long ¡haplotypes ¡with ¡high-‑frequency ¡alleles ¡ • This ¡signature ¡persists ¡for ¡a ¡short ¡period ¡of ¡8me ¡before ¡ recombina8on ¡breaks ¡down ¡the ¡chromosome. ¡
Long Haplotypes • LCT ¡allele ¡for ¡lactase ¡persistence ¡(high ¡frequency ¡~77% ¡in ¡ European ¡popula8ons ¡but ¡long ¡haplotypes) ¡
Recommend
More recommend