epistasis
play

Epistasis 02-715 Advanced Topics in Computa8onal Genomics - PowerPoint PPT Presentation

Epistasis 02-715 Advanced Topics in Computa8onal Genomics Epistasis Defini8on: The effect of one locus depends on the genotype of another locus Epista8c


  1. Epistasis 02-­‑715 ¡Advanced ¡Topics ¡in ¡Computa8onal ¡ Genomics ¡

  2. Epistasis • Defini8on: ¡The ¡effect ¡of ¡one ¡locus ¡depends ¡on ¡the ¡genotype ¡ of ¡another ¡locus ¡ – Epista8c ¡effects ¡vs. ¡marginal ¡effects ¡

  3. Epistasis for Mendelian Traits Carlborg ¡& ¡Haley, ¡Nature ¡Reviews ¡Gene8cs ¡2004 ¡

  4. When There is No Epistasis • Two ¡addi8ve ¡ (non-­‑epista8c) ¡ loci ¡ • The ¡three ¡lines ¡ run ¡in ¡parallel ¡

  5. Epistasis Example • Dominant ¡epistasis ¡ • One ¡locus ¡in ¡a ¡ dominant ¡way ¡ suppresses ¡the ¡ allelic ¡effects ¡of ¡a ¡ second ¡locus ¡

  6. Epistasis Example • Co-­‑adap8ve ¡epistasis ¡ • Genotypes ¡that ¡are ¡ homozygous ¡for ¡alleles ¡ of ¡the ¡two ¡loci ¡that ¡ originate ¡from ¡the ¡same ¡ line ¡(JJ ¡with ¡JJ, ¡or ¡LL ¡ with ¡LL) ¡show ¡enhanced ¡ performance. ¡ • Almost ¡no ¡marginal ¡ effects: ¡average ¡effect ¡ of ¡JJ, ¡JL, ¡LL ¡do ¡not ¡differ ¡

  7. Epistasis Example • Dominance-­‑by-­‑ dominance ¡epistasis ¡ • Double ¡heterozygote ¡ (LS, ¡LS) ¡deviates ¡from ¡ the ¡phenotype ¡that ¡is ¡ expected ¡from ¡the ¡ phenotypes ¡of ¡the ¡ other ¡heterozygotes. ¡ • Double ¡heterozygotes ¡ have ¡a ¡lower ¡phenotype ¡ than ¡expected. ¡

  8. Epistasis • Epista8c ¡effects ¡of ¡SNPs ¡can ¡oWen ¡be ¡detected ¡only ¡if ¡the ¡ interac8ng ¡ ¡SNPs ¡are ¡considered ¡jointly ¡ – The ¡number ¡of ¡candidate ¡SNP ¡interac8ons ¡is ¡very ¡large ¡ • For ¡ J ¡SNPs, ¡ J x J ¡SNP ¡pairs ¡need ¡to ¡be ¡considered ¡for ¡epistasis ¡ • In ¡general ¡for ¡ J ¡SNPs ¡and ¡ K -­‑way ¡interac8ons, ¡there ¡are ¡O( J K ) ¡ candidate ¡interac8ons ¡ • Computa8onally ¡expensive ¡to ¡consider ¡all ¡possible ¡groups ¡of ¡ interac8ng ¡SNPs ¡ • For ¡a ¡reliable ¡detec8on ¡of ¡ K -­‑way ¡interac8ons, ¡a ¡large ¡sample ¡size ¡is ¡ required ¡ – Mul8ple ¡tes8ng ¡problem ¡

  9. BEAM Overview (Zhang and Liu, 2007) • Bayesian ¡epistasis ¡associa8on ¡mapping ¡for ¡case/control ¡ studies ¡ • Bayesian ¡par88oning ¡of ¡the ¡gene8c ¡markers ¡to ¡groups ¡of ¡ markers ¡with/without ¡associa8ons ¡ • Use ¡MCMC ¡to ¡learn ¡the ¡par88oning ¡and ¡obtain ¡the ¡posterior ¡ probability ¡of ¡par88ons ¡of ¡markers ¡ • It ¡can ¡handle ¡up ¡to ¡~100,000 ¡markers ¡

  10. BEAM • Assume ¡the ¡markers ¡in ¡the ¡case ¡group ¡belong ¡to ¡Group ¡0, ¡1, ¡ or ¡2. ¡ – Group ¡0: ¡Markers ¡with ¡no ¡effects ¡ D 1 ¡ – Group ¡1: ¡Markers ¡with ¡marginal ¡effects ¡ D 2 ¡ – Group ¡2: ¡Markers ¡with ¡epista8c ¡effects ¡ D 3 ¡ • Markers ¡in ¡the ¡control ¡group ¡ U ¡ belong ¡to ¡Group ¡0. ¡ • Goal: ¡Learn ¡the ¡par88on ¡of ¡markers ¡ I ¡into ¡Groups ¡0, ¡1, ¡2, ¡ given ¡the ¡genotype ¡data. ¡

  11. Bayesian Marker Partition Model • Model ¡for ¡markers ¡in ¡case ¡group ¡with ¡marginal ¡effects ¡ – Assume ¡a ¡Dirichlet(α) ¡for ¡Θ 1 ¡ • Marginal ¡likelihood ¡aWer ¡integra8ng ¡out ¡parameters ¡Θ 1 ¡ ¡

  12. Bayesian Marker Partition Model • Model ¡for ¡markers ¡in ¡case ¡group ¡with ¡epista8c ¡effects ¡ • Markers ¡with ¡no ¡effects ¡in ¡case ¡group, ¡and ¡markers ¡in ¡the ¡ control ¡group ¡

  13. Bayesian Marker Partition Model • The ¡posterior ¡distribu8on ¡of ¡marker ¡assignment ¡to ¡Groups ¡0, ¡ 1, ¡2 ¡is ¡given ¡as ¡ – The ¡prior ¡is ¡given ¡as ¡ ¡

  14. BEAM: MCMC Sampling • Ini8alize ¡I ¡according ¡to ¡P(I) ¡ • Metropolis-­‑Has8ngs ¡(MH) ¡algorithm ¡ ¡ • Propose ¡to ¡change ¡the ¡marker’s ¡group ¡membership ¡ • Propose ¡to ¡randomly ¡exchange ¡two ¡markers ¡between ¡Groups ¡0, ¡1, ¡ 2. ¡

  15. Evaluating Markers for Associations • Use ¡the ¡posterior ¡probability ¡ P ( I | D,U ) ¡ • Use ¡B-­‑sta8s8c ¡ – ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡Bayes ¡factor ¡under ¡null ¡model ¡ ¡ – ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡Bayes ¡factor ¡under ¡the ¡alterna8ve ¡model ¡ ¡

  16. Simulation Study – Model ¡1: ¡two ¡disease ¡ loci ¡with ¡independent ¡ effects ¡ – Model ¡2: ¡disease ¡risk ¡ only ¡when ¡both ¡loci ¡have ¡ at ¡least ¡one ¡disease ¡ allele ¡ – Model ¡3: ¡addi8onal ¡ disease ¡alleles ¡at ¡each ¡ locus ¡do ¡not ¡further ¡ increase ¡the ¡disease ¡risk ¡

  17. Simulation Study • Other ¡scenarios ¡to ¡be ¡considered ¡ – Model ¡4: ¡three ¡disease ¡loci. ¡ – Model ¡5: ¡mul8ple ¡causal ¡epistasis ¡by ¡a ¡mixture ¡of ¡two ¡two-­‑way ¡ interac8ons. ¡Disease ¡risk ¡if ¡at ¡least ¡one ¡epista8c ¡interac8on ¡is ¡present. ¡ – Model ¡6: ¡six-­‑way ¡interac8on ¡

  18. Results for Models 1-3 2000 ¡cases, ¡2000 ¡controls ¡ power ¡ 1000 ¡cases, ¡1000 ¡controls ¡

  19. Results on AMD Dataset • AMD ¡dataset, ¡116,204 ¡SNPs ¡genotyped ¡for ¡96 ¡cases ¡and ¡50 ¡ controls. ¡Posterior ¡probabili8es ¡for ¡having ¡an ¡associa8on ¡

  20. Sensitivity to Prior Distributions p 1 = p 2 ¡ p 1 = p 2 ¡ =0.0033 ¡ =0.001 ¡ p 1 = p 2 ¡ p 1 = p 2 ¡ =0.0001 ¡ =0.00001 ¡ P1: ¡prior ¡probabili8es ¡for ¡marginal ¡effects ¡ P2: ¡prior ¡probabili8es ¡for ¡epista8c ¡effects ¡ ¡

  21. MCMC Trace and Autocorrelation Plot Simulated ¡ data ¡ AMD ¡data ¡

  22. Screen and Clean (Wu et al., 2010) • Mul8variate ¡analysis ¡of ¡all ¡SNPs ¡and ¡SNP ¡interac8ons ¡using ¡ lasso ¡ • Assume ¡that ¡the ¡SNPs ¡with ¡epista8c ¡effects ¡are ¡likely ¡to ¡have ¡ at ¡least ¡small ¡marginal ¡effect ¡ – Select ¡the ¡SNPs ¡with ¡marginal ¡effects. ¡ – Consider ¡only ¡those ¡SNPs ¡with ¡marginal ¡effects ¡for ¡epista8c ¡ interac8on. ¡ – SNPs ¡will ¡be ¡found ¡to ¡have ¡epista8c ¡effects ¡but ¡no ¡marginal ¡effects ¡

  23. Screen: Two-stage Lasso for Detecting Epistasis • Two-­‑stage ¡lasso ¡ – Step ¡1: ¡Apply ¡lasso ¡with ¡no ¡considera8on ¡of ¡epistasis ¡to ¡detect ¡SNPs ¡ with ¡significant ¡individual ¡effects ¡ – Step ¡2: ¡Apply ¡lasso ¡with ¡pairs ¡of ¡only ¡those ¡SNPs ¡selected ¡in ¡Step ¡1 ¡

  24. Clean: Assessing Significance of Results • Split ¡the ¡data ¡into ¡Stage ¡1 ¡and ¡2 ¡datasets ¡ – Using ¡Stage ¡1 ¡data, ¡apply ¡lasso ¡to ¡select ¡SNPs ¡with ¡marginal ¡and ¡ epista8c ¡effects ¡ – Using ¡Stage ¡2 ¡data, ¡assess ¡the ¡significance ¡of ¡SNPs ¡ • Apply ¡the ¡least ¡squared ¡error ¡method ¡and ¡obtain ¡the ¡tradi8onal ¡t-­‑ sta8s8c ¡ • Mul8-­‑split ¡method ¡ – Randomly ¡split ¡the ¡data ¡into ¡Stage ¡1 ¡and ¡Stage ¡2 ¡datasets ¡mul8ple ¡ 8mes ¡ – Perform ¡the ¡two-­‑way ¡split ¡method ¡for ¡each ¡split ¡ – Combine ¡the ¡p-­‑values ¡from ¡each ¡split. ¡

  25. Advantages and Disadvantages • Reduces ¡the ¡computa8onal ¡burden. ¡ • SNPs ¡with ¡epista8c ¡effects ¡oWen ¡do ¡not ¡have ¡detectable ¡ individual ¡(marginal) ¡effects, ¡and ¡many ¡of ¡these ¡associa8on ¡ signals ¡will ¡be ¡missed. ¡ • Need ¡to ¡split ¡the ¡data ¡into ¡two ¡parts ¡for ¡Stage ¡1 ¡and ¡Stage ¡2 ¡ analysis ¡

  26. Screen and Clean

  27. Simulation Results • Solid ¡line: ¡mul8-­‑split, ¡ dojed ¡line: ¡single-­‑ split ¡

  28. Results • WTCCC ¡data ¡ • 1,963 ¡cases ¡with ¡T1D ¡and ¡2,938 ¡controls ¡ • Mul8-­‑split ¡screen ¡and ¡clean ¡with ¡56 ¡random ¡splits ¡

Recommend


More recommend