gene expressions and genomes
play

Gene Expressions and Genomes 02-223 Personalized Medicine: - PowerPoint PPT Presentation

Gene Expressions and Genomes 02-223 Personalized Medicine: Understanding Your Own Genome Fall 2014 Why Gene Expression? Genome-wide associaGon mapping


  1. Gene ¡Expressions ¡and ¡Genomes ¡ 02-­‑223 ¡Personalized ¡Medicine: ¡ Understanding ¡Your ¡Own ¡Genome ¡ Fall ¡2014 ¡

  2. Why ¡Gene ¡Expression? ¡ Genome-­‑wide ¡associaGon ¡mapping ¡ DNA ¡sequence ¡ Disease ¡or ¡healthy? ¡ Molecular ¡ mechanism? ¡

  3. Why ¡Gene ¡Expression ¡ • IdenGfying ¡the ¡geneGc ¡variants ¡that ¡confer ¡disease ¡risk ¡is ¡not ¡ enough ¡to ¡decipher ¡the ¡molecular ¡mechanisms ¡of ¡how ¡the ¡ geneGc ¡variaGon ¡influence ¡the ¡disease: ¡ – In ¡medicine ¡ ¡ • We ¡need ¡to ¡determine ¡which ¡biological ¡pathways ¡and ¡genes ¡are ¡ involved ¡in ¡the ¡disease ¡process. ¡ • The ¡idenGfied ¡pathways ¡and ¡genes ¡can ¡be ¡a ¡target ¡for ¡drug. ¡ – In ¡science ¡ • Determining ¡which ¡pathways ¡underlie ¡the ¡associaGon ¡between ¡the ¡ geneGc ¡variaGon ¡and ¡phenotype ¡can ¡provide ¡insights ¡on ¡the ¡ funcGon ¡of ¡genes. ¡

  4. Microarrays ¡for ¡Molecular ¡Biology ¡ TranscripGon ¡factor ¡ Microarray ¡for ¡measuring ¡ DNA ¡ gene ¡expression ¡levels ¡ transcription mRNA ¡ translation Proteins ¡

  5. Microarray ¡Hybridiza=on ¡ • Watson-­‑Crick ¡base ¡pairing ¡of ¡complementary ¡DNA ¡sequences. ¡ • Microarrays ¡have ¡tens ¡of ¡thousands ¡of ¡spots, ¡each ¡represenGng ¡a ¡ piece ¡of ¡one ¡gene, ¡immobilized ¡on ¡a ¡glass ¡slide. ¡ • The ¡intensity ¡(or ¡intensity ¡raGo) ¡of ¡each ¡spot ¡indicates ¡the ¡amount ¡ of ¡labeled ¡cDNA ¡hybridized, ¡thus, ¡represenGng ¡the ¡starGng ¡mRNA ¡ transcript ¡abundance. ¡

  6. Hybridization and Scanning— cDNA arrays � - Prepare Cy3, Cy5- � labeled ss cDNA � - Scan � - Hybridize 600 ng of � labeled ss cDNA to � glass slide array �

  7. Individuals ¡ What ¡is ¡gene ¡ baseline ¡ expression? ¡ expression ¡ Expression ¡= ¡acGvity ¡ 0 10 ¡ 20 ¡ 70 ¡ 80 ¡ gene ¡1 ¡ level ¡of ¡gene ¡in ¡ experiment ¡ genes ¡ Higher ¡ Lower ¡ expression ¡ expression ¡ compared ¡to ¡ compared ¡to ¡ baseline ¡ baseline ¡

  8. Hierarchical ¡Clustering ¡ • Probably ¡the ¡most ¡popular ¡clustering ¡algorithm ¡in ¡ computaGonal ¡biology ¡ • AgglomeraGve ¡( bo^om-­‑up) ¡ • Algorithm: ¡ 1. IniGalize: ¡each ¡item ¡a ¡cluster ¡ 2. Iterate: ¡ • select ¡two ¡most ¡ similar ¡clusters ¡ • merge ¡them ¡ 3. ¡ ¡ ¡Halt: ¡when ¡there ¡is ¡only ¡one ¡cluster ¡le_ ¡ dendrogram

  9. Similarity ¡Criterion: ¡Single ¡Linkage ¡ • cluster ¡similarity ¡= ¡similarity ¡of ¡two ¡most ¡similar ¡ members ¡ - Potentially long and skinny clusters

  10. In ¡most ¡cases ¡(1-­‑ r 2 ), ¡ where ¡ r 2 ¡is ¡the ¡correlaGon ¡ coefficient, ¡is ¡used ¡as ¡ Example: ¡Single ¡Linkage ¡ similarity ¡measure ¡ between ¡samples ¡ 5 4 3 2 1

  11. In ¡most ¡cases ¡(1-­‑ r 2 ), ¡ where ¡ r 2 ¡is ¡the ¡correlaGon ¡ coefficient, ¡is ¡used ¡as ¡ Example: ¡Single ¡Linkage ¡ similarity ¡measure ¡ between ¡samples ¡ 5 4 3 2 1

  12. In ¡most ¡cases ¡(1-­‑ r 2 ), ¡ where ¡ r 2 ¡is ¡the ¡correlaGon ¡ coefficient, ¡is ¡used ¡as ¡ Example: ¡Single ¡Linkage ¡ similarity ¡measure ¡ between ¡samples ¡ (1,2) 3 4 5 (1,2) ⎡ ⎤ ⎢ ⎥ 3 ⎢ ⎥ 4 ⎢ ⎥ ⎢ ⎥ 5 ⎣ ⎦ 5 4 3 2 1

  13. In ¡most ¡cases ¡(1-­‑ r 2 ), ¡ where ¡ r 2 ¡is ¡the ¡correlaGon ¡ coefficient, ¡is ¡used ¡as ¡ Example: ¡Single ¡Linkage ¡ similarity ¡measure ¡ between ¡samples ¡ 5 4 3 2 1

  14. Example: ¡Single ¡Linkage ¡ 5 4 3 2 1

  15. Example: ¡Single ¡Linkage ¡ 5 4 3 2 1

  16. Similarity ¡Criterion: ¡Complete ¡Linkage ¡ • cluster ¡similarity ¡= ¡similarity ¡of ¡two ¡least ¡similar ¡ members ¡ + tight clusters

  17. Similarity ¡Criterion: ¡Average ¡Linkage ¡ • cluster ¡similarity ¡= ¡average ¡similarity ¡of ¡all ¡pairs ¡ the ¡most ¡widely ¡used ¡ similarity ¡measure ¡ Robust ¡against ¡noise ¡

  18. But ¡What ¡Are ¡the ¡Clusters? ¡ In ¡some ¡cases ¡we ¡can ¡determine ¡the ¡“correct” ¡number ¡of ¡clusters. ¡However, ¡things ¡are ¡rarely ¡ this ¡clear ¡cut, ¡unfortunately. ¡

  19. • Nonhierarchical, ¡each ¡object ¡is ¡placed ¡in ¡exactly ¡one ¡of ¡K ¡non-­‑ overlapping ¡clusters. ¡ • the ¡user ¡has ¡to ¡specify ¡the ¡desired ¡number ¡of ¡clusters ¡K. ¡ • In ¡hierarchical ¡clustering, ¡we ¡use ¡similarity ¡measures ¡between ¡ two ¡observed ¡samples, ¡whereas ¡in ¡K-­‑means ¡clustering, ¡we ¡use ¡ the ¡similarity ¡measures ¡between ¡an ¡observed ¡sample ¡and ¡the ¡ cluster ¡center ¡(mean). ¡ ¡

  20. Example: ¡Clustering ¡Genes ¡ • Clustering ¡genes ¡helps ¡determine ¡ new ¡funcGons ¡for ¡unknown ¡genes ¡ • Applying ¡hierarchical ¡clustering ¡ algorithm ¡to ¡gene ¡expression ¡data ¡ was ¡an ¡early ¡“killer ¡applicaGon” ¡in ¡ this ¡area ¡

  21. Gene ¡Expression ¡Data ¡and ¡Personalized ¡ Medicine ¡ (Golub ¡et ¡al., ¡Science, ¡1999) ¡ • One ¡of ¡the ¡earliest ¡work ¡that ¡demonstrated ¡the ¡ feasibility ¡of ¡using ¡only ¡microarray ¡gene ¡expression ¡data ¡ to ¡determine ¡cancer ¡subtypes ¡for ¡paGents ¡ • A ¡staGsGcal ¡model ¡was ¡learned ¡to ¡predict ¡the ¡labels ¡for ¡ acute ¡myeloid ¡leukemia ¡(ALL) ¡and ¡acute ¡lymphoblasGc ¡ leukemia ¡ ¡(AML) ¡for ¡each ¡paGent ¡given ¡gene ¡expression ¡ data ¡ – ¡Dataset ¡used ¡to ¡learn ¡the ¡model ¡consisted ¡of ¡27 ¡ALL ¡and ¡11 ¡ AML ¡paGents ¡ – Tested ¡the ¡learned ¡model ¡on ¡20 ¡ALL ¡and ¡14 ¡AML ¡paGents ¡and ¡ 29 ¡out ¡of ¡34 ¡paGents ¡were ¡predicted ¡to ¡have ¡correct ¡cancer ¡ subtypes ¡

  22. Gene ¡Expression ¡Signature ¡Can ¡Dis=nguish ¡ Cancer ¡Types ¡ PaGents ¡ Genes ¡that ¡are ¡informaGve ¡for ¡predicGng ¡ cancer ¡types ¡

  23. FDA ¡Approves ¡Gene-­‑Based ¡Breast ¡Cancer ¡ Test* ¡ “MammaPrint ¡is ¡a ¡DNA ¡ microarray-­‑based ¡test ¡that ¡ measures ¡the ¡acGvity ¡of ¡70 ¡ genes... ¡The ¡test ¡measures ¡each ¡ of ¡these ¡genes ¡in ¡a ¡sample ¡of ¡a ¡ woman's ¡breast-­‑cancer ¡tumor ¡ and ¡then ¡uses ¡a ¡specific ¡formula ¡ to ¡determine ¡whether ¡the ¡ paGent ¡is ¡deemed ¡low ¡risk ¡or ¡ high ¡risk ¡for ¡the ¡spread ¡of ¡the ¡ cancer ¡to ¡another ¡site.” ¡

  24. Learning ¡Bayesian ¡Networks ¡ • Probability ¡distribuGon ¡over ¡directed ¡graph ¡ ¡ – Model ¡data ¡distribuGon ¡in ¡populaGon ¡ Data – CondiGonal ¡probability ¡distribuGon ¡(CPD) ¡for ¡ each ¡variable/node ¡condiGonal ¡on ¡its ¡parent ¡ nodes ¡ – ProbabilisGc ¡inference: ¡ • PredicGon ¡ • ClassificaGon ¡ MSFT ¡ • Dependency ¡structure ¡ INTL ¡ NVLS ¡ – InteracGons ¡between ¡variables ¡ – Causality ¡ n ∏ P( x 1 ,..., x n ) = P( x i | x i + 1 ,..., x n ) MOT ¡ – ScienGfic ¡discovery ¡ i = 1 n ∏ = P( x i | Pa( x i )) i = 1 Slides ¡from ¡the ¡presentaGon ¡by ¡Segal ¡et ¡al. ¡UAI03 ¡

  25. The ¡Module ¡Network ¡Idea ¡ Bayesian Network Module Network CPD 1 CPD 1 MSFT ¡ MSFT ¡ Module I CPD 2 CPD 2 CPD 3 MOT ¡ MOT ¡ CPD 4 DELL ¡ INTL ¡ DELL ¡ INTL ¡ Module II CPD 6 CPD 5 CPD 3 AMAT ¡ AMAT ¡ HPQ ¡ HPQ ¡ Module III Slides ¡from ¡the ¡presentaGon ¡by ¡Segal ¡et ¡al. ¡UAI03 ¡

  26. • Applying ¡module ¡ network ¡to ¡2355 ¡genes ¡ in ¡the ¡173 ¡arrays ¡of ¡the ¡ yeast ¡stress ¡data ¡set ¡

Recommend


More recommend