genome transcriptome phenome structured association
play

Genome-Transcriptome-Phenome Structured Association 02-715 - PowerPoint PPT Presentation

Genome-Transcriptome-Phenome Structured Association 02-715 Advanced Topics in Computa8onal Genomics Regression with Regularization Group lasso (Yuan and Lin, 2006) L1/L2 2 ||


  1. Genome-Transcriptome-Phenome Structured Association 02-­‑715 ¡Advanced ¡Topics ¡in ¡Computa8onal ¡ Genomics ¡

  2. Regression with Regularization • Group ¡lasso ¡ (Yuan ¡and ¡Lin, ¡2006) ¡ L1/L2 ∑ 2 || β j || L 1/ L 2 = β jk k

  3. Regression with Regularization (Group Lasso Penalty) Lasso ¡ Group ¡ L 2 ¡penalty ¡ penalty ¡ lasso ¡ penalty ¡

  4. Lasso (Tibshirani, 1996) Regression ¡Coefficients ¡ Inputs ¡ Outputs ¡

  5. L 1 / L 2 -regularized Multi-task Regression (Obozinski et al., 2008) Regression ¡Coefficients ¡ Inputs ¡ Outputs ¡

  6. Regression ¡Coefficients ¡ Tree-Guided Group Lasso h 2 h 1 Inputs ¡ Tree-­‑guided ¡group ¡lasso ¡penalty ¡ Key ¡idea : ¡use ¡overlapping ¡ ¡ ¡groups ¡in ¡ group ¡lasso ¡ Outputs ¡

  7. Tree-Guided Group Lasso ¡In ¡a ¡simple ¡case ¡of ¡two ¡outputs ¡ • h h ¡Low ¡height ¡ • ¡Large ¡height ¡ • • ¡Tight ¡correla8on ¡ ¡Weak ¡correla8on ¡ • ¡Joint ¡selec8on ¡ • ¡Separate ¡selec8on ¡ • Inputs ¡ Inputs ¡

  8. Tree-Guided Group Lasso ¡In ¡a ¡simple ¡case ¡of ¡two ¡outputs ¡ • Select ¡the ¡child ¡ h nodes ¡jointly ¡or ¡ separately? ¡ Tree-­‑guided ¡group ¡lasso ¡ Inputs ¡ L 1 ¡penalty ¡ L 2 ¡penalty ¡ ¡ ¡ Lasso ¡penalty ¡ ¡Group ¡lasso ¡ • • ¡ Joint ¡selec8on ¡ ¡ Separate ¡selec8on ¡ • • Elas2c ¡net ¡

  9. Tree-Guided Group Lasso ¡For ¡a ¡general ¡tree ¡ • h 2 Select ¡the ¡child ¡ nodes ¡jointly ¡or ¡ separately? ¡ h 1 Tree-­‑guided ¡group ¡lasso ¡ Note ¡that ¡the ¡ groups ¡overlap! ¡ ¡ ¡ ¡ ¡ Joint ¡ Separate ¡ selec2on ¡ selec2on ¡

  10. Overlapping Groups in Tree-guided Group Lasso -­‑ Balanced ¡ penaliza8on ¡

  11. Overlapping ¡Groups ¡ ¡Previously ¡ ¡ • ¡ Arbitrarily ¡overlapping ¡groups ¡ (JenaYon, ¡Audibert, ¡Bach, ¡2009) ¡ • ¡ Overlapping ¡groups ¡over ¡tree-­‑structured ¡inputs ¡ (Zhao, ¡Roach, ¡Yu, ¡2008) ¡ • Unbalanced ¡ penaliza8on ¡

  12. Unit Contour Surface for Various Penalty Functions Lasso ¡ L 1 /L 2 ¡ Tree ¡ Tree ¡ Tree ¡ g 1 =0.5, ¡ g 2 =0.5 ¡ g 1 =0.2, ¡ g 2 =0.7 ¡ g 1 =0.7, ¡ g 2 =0.2 ¡

  13. Illustration with Simulated Data High ¡ associa8on ¡ No ¡ associa8on ¡ Outputs ¡(Genes) ¡ Inputs ¡(SNPs) ¡ True ¡regression ¡ Tree-­‑guided ¡ L 1 /L 2 -­‑regularized ¡ Lasso ¡ ¡ coefficients ¡ group ¡lasso ¡ ¡ mul8-­‑task ¡regression ¡ ¡

  14. Analysis of Yeast Data Hierarchical ¡ clustering ¡tree ¡for ¡ genes ¡(outputs) ¡ Outputs ¡(Genes) ¡ High ¡ Inputs ¡(SNPs) ¡ associa8on ¡ No ¡ associa8on ¡ L 1 / L 2 -­‑regularized ¡ Tree-­‑guided ¡ Lasso ¡ ¡ mul8-­‑task ¡regression ¡ ¡ group ¡lasso ¡ ¡

  15. Dynamic Trait (d-trait) Association Sta8onary ¡Trait ¡ Dynamic ¡Trait ¡ Associa8on ¡ Associa8on ¡ Dynamic ¡Trait ¡ ¡ Sta8onary ¡Trait ¡ ¡ ¡ ¡ (e.g., ¡drug ¡response) ¡ t ¡= ¡1 ¡ t ¡= ¡2 ¡ t ¡= ¡3 ¡ t ¡= ¡T ¡ Associa8on ¡ Associa8on ¡Strengths ¡ Strengths ¡ A ¡T ¡C ¡G ¡A ¡T ¡T ¡C ¡C ¡A ¡T ¡A ¡ A ¡T ¡C ¡G ¡A ¡T ¡T ¡C ¡C ¡A ¡T ¡A ¡ Genotypes ¡ Genotypes ¡ Gene8c ¡effects ¡ac8ve ¡over ¡8me ¡ with ¡possibly ¡varying ¡effect ¡size ¡ One-­‑8me ¡gene8c ¡effect ¡ over ¡8me ¡ 15

  16. Temporally-Smoothed Lasso • Step ¡1: ¡Autoregressive ¡Model ¡ – Captures ¡the ¡shape ¡of ¡the ¡temporal ¡trend ¡in ¡the ¡d-­‑trait ¡data ¡ – Es8mates ¡the ¡model ¡parameters ¡based ¡on ¡the ¡d-­‑trait ¡data ¡only ¡ • Step ¡2: ¡Temporally-­‑Smoothed ¡Lasso ¡ – Penalized ¡regression ¡framework ¡ – Incorporates ¡the ¡es8mated ¡d-­‑trait ¡shape ¡parameters ¡from ¡Step ¡1 ¡ – Detects ¡8me-­‑varying ¡gene8c ¡effects ¡on ¡the ¡d-­‑trait ¡

  17. Step 1: Autoregressive Model Autoregressive ¡Model ¡: ¡ Es2ma2ng ¡Model ¡Parameters: ¡ Es2mates ¡of ¡the ¡Model ¡Parameters: ¡ 17 ¡

  18. Step 2: Temporally-Smoothed Lasso Autoregressive ¡ parameters ¡from ¡ Step ¡1 ¡ Lasso ¡Penalty ¡ Temporally-­‑smoothed ¡ Lasso ¡Penalty ¡ 1 8

  19. Simulation Study – Linear Dynamic Trait ¡data ¡for ¡ ¡ Trait ¡data ¡for ¡ Trait ¡data ¡for ¡ ¡ Trait ¡data ¡for ¡ ¡ individuals ¡with ¡ ¡ individuals ¡with ¡ ¡ individuals ¡with ¡ ¡ all ¡individuals ¡ no ¡associa8on ¡SNPs ¡ 1-­‑2 ¡associa8on ¡SNPs ¡ >3 ¡associa8on ¡SNPs ¡ Es8mated ¡ ¡ Es8mated ¡ ¡ Es8mated ¡ ¡ True ¡associa8on ¡ associa8on ¡strength ¡ associa8on ¡strength ¡ associa8on ¡strength ¡ strength ¡ (single ¡SNP ¡analysis) ¡ (lasso) ¡ (temporally-­‑smoothed ¡ lasso) ¡ 19 ¡

  20. Simulation Study – Cyclic Dynamic Trait ¡data ¡for ¡ ¡ Trait ¡data ¡for ¡ ¡ Trait ¡data ¡for ¡ ¡ Trait ¡data ¡for ¡ individuals ¡with ¡ ¡ individuals ¡with ¡ ¡ individuals ¡with ¡ ¡ all ¡individuals ¡ no ¡associa8on ¡SNPs ¡ 1-­‑2 ¡associa8on ¡SNPs ¡ >3 ¡associa8on ¡SNPs ¡ True ¡associa8on ¡ Es8mated ¡ ¡ Es8mated ¡ ¡ Es8mated ¡ ¡ strength ¡ associa8on ¡strength ¡ associa8on ¡strength ¡ associa8on ¡strength ¡ (single ¡SNP ¡analysis) ¡ (temporally-­‑smoothed ¡ (lasso) ¡ lasso) ¡ 20 ¡

  21. Genome-Transcriptome-Phenome Structured Association • Various ¡regulariza8on ¡func8ons ¡can ¡be ¡used ¡within ¡the ¡sparse ¡ regression ¡framework ¡to ¡enforce ¡a ¡sparsity ¡paYern ¡that ¡ reflects ¡prior ¡knowledge ¡ – Tree-­‑guided ¡group ¡lasso ¡ • Hierarchical ¡clustering ¡tree ¡– ¡prior ¡knowledge ¡on ¡gene ¡clusters ¡ – Temporally ¡smoothed ¡lasso ¡ • Dynamic ¡traits ¡– ¡prior ¡knowledge ¡on ¡temporal ¡correla8on ¡

Recommend


More recommend