Genome-Transcriptome-Phenome Structured Association 02-‑715 ¡Advanced ¡Topics ¡in ¡Computa8onal ¡ Genomics ¡
Regression with Regularization • Group ¡lasso ¡ (Yuan ¡and ¡Lin, ¡2006) ¡ L1/L2 ∑ 2 || β j || L 1/ L 2 = β jk k
Regression with Regularization (Group Lasso Penalty) Lasso ¡ Group ¡ L 2 ¡penalty ¡ penalty ¡ lasso ¡ penalty ¡
Lasso (Tibshirani, 1996) Regression ¡Coefficients ¡ Inputs ¡ Outputs ¡
L 1 / L 2 -regularized Multi-task Regression (Obozinski et al., 2008) Regression ¡Coefficients ¡ Inputs ¡ Outputs ¡
Regression ¡Coefficients ¡ Tree-Guided Group Lasso h 2 h 1 Inputs ¡ Tree-‑guided ¡group ¡lasso ¡penalty ¡ Key ¡idea : ¡use ¡overlapping ¡ ¡ ¡groups ¡in ¡ group ¡lasso ¡ Outputs ¡
Tree-Guided Group Lasso ¡In ¡a ¡simple ¡case ¡of ¡two ¡outputs ¡ • h h ¡Low ¡height ¡ • ¡Large ¡height ¡ • • ¡Tight ¡correla8on ¡ ¡Weak ¡correla8on ¡ • ¡Joint ¡selec8on ¡ • ¡Separate ¡selec8on ¡ • Inputs ¡ Inputs ¡
Tree-Guided Group Lasso ¡In ¡a ¡simple ¡case ¡of ¡two ¡outputs ¡ • Select ¡the ¡child ¡ h nodes ¡jointly ¡or ¡ separately? ¡ Tree-‑guided ¡group ¡lasso ¡ Inputs ¡ L 1 ¡penalty ¡ L 2 ¡penalty ¡ ¡ ¡ Lasso ¡penalty ¡ ¡Group ¡lasso ¡ • • ¡ Joint ¡selec8on ¡ ¡ Separate ¡selec8on ¡ • • Elas2c ¡net ¡
Tree-Guided Group Lasso ¡For ¡a ¡general ¡tree ¡ • h 2 Select ¡the ¡child ¡ nodes ¡jointly ¡or ¡ separately? ¡ h 1 Tree-‑guided ¡group ¡lasso ¡ Note ¡that ¡the ¡ groups ¡overlap! ¡ ¡ ¡ ¡ ¡ Joint ¡ Separate ¡ selec2on ¡ selec2on ¡
Overlapping Groups in Tree-guided Group Lasso -‑ Balanced ¡ penaliza8on ¡
Overlapping ¡Groups ¡ ¡Previously ¡ ¡ • ¡ Arbitrarily ¡overlapping ¡groups ¡ (JenaYon, ¡Audibert, ¡Bach, ¡2009) ¡ • ¡ Overlapping ¡groups ¡over ¡tree-‑structured ¡inputs ¡ (Zhao, ¡Roach, ¡Yu, ¡2008) ¡ • Unbalanced ¡ penaliza8on ¡
Unit Contour Surface for Various Penalty Functions Lasso ¡ L 1 /L 2 ¡ Tree ¡ Tree ¡ Tree ¡ g 1 =0.5, ¡ g 2 =0.5 ¡ g 1 =0.2, ¡ g 2 =0.7 ¡ g 1 =0.7, ¡ g 2 =0.2 ¡
Illustration with Simulated Data High ¡ associa8on ¡ No ¡ associa8on ¡ Outputs ¡(Genes) ¡ Inputs ¡(SNPs) ¡ True ¡regression ¡ Tree-‑guided ¡ L 1 /L 2 -‑regularized ¡ Lasso ¡ ¡ coefficients ¡ group ¡lasso ¡ ¡ mul8-‑task ¡regression ¡ ¡
Analysis of Yeast Data Hierarchical ¡ clustering ¡tree ¡for ¡ genes ¡(outputs) ¡ Outputs ¡(Genes) ¡ High ¡ Inputs ¡(SNPs) ¡ associa8on ¡ No ¡ associa8on ¡ L 1 / L 2 -‑regularized ¡ Tree-‑guided ¡ Lasso ¡ ¡ mul8-‑task ¡regression ¡ ¡ group ¡lasso ¡ ¡
Dynamic Trait (d-trait) Association Sta8onary ¡Trait ¡ Dynamic ¡Trait ¡ Associa8on ¡ Associa8on ¡ Dynamic ¡Trait ¡ ¡ Sta8onary ¡Trait ¡ ¡ ¡ ¡ (e.g., ¡drug ¡response) ¡ t ¡= ¡1 ¡ t ¡= ¡2 ¡ t ¡= ¡3 ¡ t ¡= ¡T ¡ Associa8on ¡ Associa8on ¡Strengths ¡ Strengths ¡ A ¡T ¡C ¡G ¡A ¡T ¡T ¡C ¡C ¡A ¡T ¡A ¡ A ¡T ¡C ¡G ¡A ¡T ¡T ¡C ¡C ¡A ¡T ¡A ¡ Genotypes ¡ Genotypes ¡ Gene8c ¡effects ¡ac8ve ¡over ¡8me ¡ with ¡possibly ¡varying ¡effect ¡size ¡ One-‑8me ¡gene8c ¡effect ¡ over ¡8me ¡ 15
Temporally-Smoothed Lasso • Step ¡1: ¡Autoregressive ¡Model ¡ – Captures ¡the ¡shape ¡of ¡the ¡temporal ¡trend ¡in ¡the ¡d-‑trait ¡data ¡ – Es8mates ¡the ¡model ¡parameters ¡based ¡on ¡the ¡d-‑trait ¡data ¡only ¡ • Step ¡2: ¡Temporally-‑Smoothed ¡Lasso ¡ – Penalized ¡regression ¡framework ¡ – Incorporates ¡the ¡es8mated ¡d-‑trait ¡shape ¡parameters ¡from ¡Step ¡1 ¡ – Detects ¡8me-‑varying ¡gene8c ¡effects ¡on ¡the ¡d-‑trait ¡
Step 1: Autoregressive Model Autoregressive ¡Model ¡: ¡ Es2ma2ng ¡Model ¡Parameters: ¡ Es2mates ¡of ¡the ¡Model ¡Parameters: ¡ 17 ¡
Step 2: Temporally-Smoothed Lasso Autoregressive ¡ parameters ¡from ¡ Step ¡1 ¡ Lasso ¡Penalty ¡ Temporally-‑smoothed ¡ Lasso ¡Penalty ¡ 1 8
Simulation Study – Linear Dynamic Trait ¡data ¡for ¡ ¡ Trait ¡data ¡for ¡ Trait ¡data ¡for ¡ ¡ Trait ¡data ¡for ¡ ¡ individuals ¡with ¡ ¡ individuals ¡with ¡ ¡ individuals ¡with ¡ ¡ all ¡individuals ¡ no ¡associa8on ¡SNPs ¡ 1-‑2 ¡associa8on ¡SNPs ¡ >3 ¡associa8on ¡SNPs ¡ Es8mated ¡ ¡ Es8mated ¡ ¡ Es8mated ¡ ¡ True ¡associa8on ¡ associa8on ¡strength ¡ associa8on ¡strength ¡ associa8on ¡strength ¡ strength ¡ (single ¡SNP ¡analysis) ¡ (lasso) ¡ (temporally-‑smoothed ¡ lasso) ¡ 19 ¡
Simulation Study – Cyclic Dynamic Trait ¡data ¡for ¡ ¡ Trait ¡data ¡for ¡ ¡ Trait ¡data ¡for ¡ ¡ Trait ¡data ¡for ¡ individuals ¡with ¡ ¡ individuals ¡with ¡ ¡ individuals ¡with ¡ ¡ all ¡individuals ¡ no ¡associa8on ¡SNPs ¡ 1-‑2 ¡associa8on ¡SNPs ¡ >3 ¡associa8on ¡SNPs ¡ True ¡associa8on ¡ Es8mated ¡ ¡ Es8mated ¡ ¡ Es8mated ¡ ¡ strength ¡ associa8on ¡strength ¡ associa8on ¡strength ¡ associa8on ¡strength ¡ (single ¡SNP ¡analysis) ¡ (temporally-‑smoothed ¡ (lasso) ¡ lasso) ¡ 20 ¡
Genome-Transcriptome-Phenome Structured Association • Various ¡regulariza8on ¡func8ons ¡can ¡be ¡used ¡within ¡the ¡sparse ¡ regression ¡framework ¡to ¡enforce ¡a ¡sparsity ¡paYern ¡that ¡ reflects ¡prior ¡knowledge ¡ – Tree-‑guided ¡group ¡lasso ¡ • Hierarchical ¡clustering ¡tree ¡– ¡prior ¡knowledge ¡on ¡gene ¡clusters ¡ – Temporally ¡smoothed ¡lasso ¡ • Dynamic ¡traits ¡– ¡prior ¡knowledge ¡on ¡temporal ¡correla8on ¡
Recommend
More recommend