making sense of dna methyla4on data
play

Making sense of DNA methyla4on data Peter Hickey - PowerPoint PPT Presentation

Making sense of DNA methyla4on data Peter Hickey @PeteHaitch 15 September 2014 How I spend my 4me Oh, youre a sta/s/cian How I've


  1. Co-­‑methyla4on ¡= ¡co-­‑occurence ¡ “The ¡presence ¡of ¡methyla<on ¡over ¡a ¡stretch ¡of ¡ neighboring ¡CpG ¡posi<ons” ¡ Schatz, ¡Philipp, ¡Dimo ¡Dietrich, ¡and ¡MaEhias ¡Schuster. ¡"Rapid ¡analysis ¡of ¡CpG ¡methyla4on ¡paEerns ¡using ¡RNase ¡T1 ¡cleavage ¡and ¡MALDI-­‑TOF." ¡ Nucleic ¡acids ¡research ¡32.21 ¡(2004): ¡e167-­‑e167. ¡

  2. Co-­‑methyla4on ¡= ¡co-­‑occurence ¡ “The ¡presence ¡of ¡methyla<on ¡over ¡a ¡stretch ¡of ¡ neighboring ¡CpG ¡posi<ons” ¡ Schatz, ¡Philipp, ¡Dimo ¡Dietrich, ¡and ¡MaEhias ¡Schuster. ¡"Rapid ¡analysis ¡of ¡CpG ¡methyla4on ¡paEerns ¡using ¡RNase ¡T1 ¡cleavage ¡and ¡MALDI-­‑TOF." ¡ Nucleic ¡acids ¡research ¡32.21 ¡(2004): ¡e167-­‑e167. ¡

  3. Co-­‑methyla4on ¡= ¡co-­‑occurence ¡ “The ¡presence ¡of ¡methyla<on ¡over ¡a ¡stretch ¡of ¡ neighboring ¡CpG ¡posi<ons” ¡ Schatz, ¡Philipp, ¡Dimo ¡Dietrich, ¡and ¡MaEhias ¡Schuster. ¡"Rapid ¡analysis ¡of ¡CpG ¡methyla4on ¡paEerns ¡using ¡RNase ¡T1 ¡cleavage ¡and ¡MALDI-­‑TOF." ¡ Nucleic ¡acids ¡research ¡32.21 ¡(2004): ¡e167-­‑e167. ¡

  4. Co-­‑methyla4on ¡= ¡correla4on ¡ “The ¡rela<onship ¡between ¡the ¡degree ¡of ¡ methyla<on ¡over ¡distance” ¡ 1. Within-­‑fragment ¡co-­‑methyla4on ¡ 2. Correla4on ¡of ¡β-­‑values ¡ Eckhardt, ¡Florian, ¡et ¡al. ¡"DNA ¡methyla4on ¡profiling ¡of ¡human ¡chromosomes ¡6, ¡20 ¡and ¡22." ¡Nature ¡gene4cs ¡38.12 ¡(2006): ¡1378-­‑1385. ¡

  5. Co-­‑methyla4on ¡= ¡correla4on ¡ “The ¡rela<onship ¡between ¡the ¡degree ¡of ¡ methyla<on ¡over ¡distance” ¡ 1. Within-­‑fragment ¡co-­‑methyla4on ¡ 2. Correla4on ¡of ¡β-­‑values ¡ Eckhardt, ¡Florian, ¡et ¡al. ¡"DNA ¡methyla4on ¡profiling ¡of ¡human ¡chromosomes ¡6, ¡20 ¡and ¡22." ¡Nature ¡gene4cs ¡38.12 ¡(2006): ¡1378-­‑1385. ¡

  6. Co-­‑methyla4on ¡= ¡correla4on ¡ “The ¡rela<onship ¡between ¡the ¡degree ¡of ¡ methyla<on ¡over ¡distance” ¡ 1. Within-­‑fragment ¡co-­‑methyla4on ¡ 2. Correla4on ¡of ¡β-­‑values ¡ Eckhardt, ¡Florian, ¡et ¡al. ¡"DNA ¡methyla4on ¡profiling ¡of ¡human ¡chromosomes ¡6, ¡20 ¡and ¡22." ¡Nature ¡gene4cs ¡38.12 ¡(2006): ¡1378-­‑1385. ¡

  7. Co-­‑methyla4on ¡= ¡correla4on ¡ “The ¡rela<onship ¡between ¡the ¡degree ¡of ¡ methyla<on ¡over ¡distance” ¡ 1. Within-­‑fragment ¡co-­‑methyla/on ¡ 2. Correla4on ¡of ¡β-­‑values ¡ Eckhardt, ¡Florian, ¡et ¡al. ¡"DNA ¡methyla4on ¡profiling ¡of ¡human ¡chromosomes ¡6, ¡20 ¡and ¡22." ¡Nature ¡gene4cs ¡38.12 ¡(2006): ¡1378-­‑1385. ¡

  8. chr4 p16.2 p15.33 p15.31 p15.1 p14 p13 p11 q12 q13.1 q13.2 q21.1 q21.23 q22.2 q23 q24 q25 q26 q27 q28.2 q31.1 q31.22 q31.3 q32.2 q33 q34.2 q35.1 91 bp TYPE 38,721,970 bp 38,721,980 bp 38,721,990 bp 38,722,000 bp 38,722,010 bp 38,722,020 bp 38,722,030 bp 38,722,040 bp 38,722,050 bp [0 - 35] IMR90-iPSC coverage G IMR90-iPSC A A G A G T A G C A A A C A C T A A T C T A C G A A T A A T G A A C A T A G G C A T T A T T T T A A G A A C C A A A A G A A A G C A C G T G G G C A T T T G G T T T A C A C A T C A C T Sequence RefSeq genes CpGs ¡ CpGs CpG islands

  9. chr4 p16.2 p15.33 p15.31 p15.1 p14 p13 p11 q12 q13.1 q13.2 q21.1 q21.23 q22.2 q23 q24 q25 q26 q27 q28.2 q31.1 q31.22 q31.3 q32.2 q33 q34.2 q35.1 91 bp DATA TYPE DATA FILE 38,721,970 bp 38,721,980 bp 38,721,990 bp 38,722,000 bp 38,722,010 bp 38,722,020 bp 38,722,030 bp 38,722,040 bp 38,722,050 bp NAME [0 - 35] IMR90-iPSC coverage G IMR90-iPSC A A G A G T A G C A A A C A C T A A T C T A C G A A T A A T G A A C A T A G G C A T T A T T T T A A G A A C C A A A A G A A A G C A C G T G G G C A T T T G G T T T A C A C A T C A C T Sequence RefSeq genes CpGs ¡ CpGs CpG islands

  10. chr4 p16.2 p15.33 p15.31 p15.1 p14 p13 p11 q12 q13.1 q13.2 q21.1 q21.23 q22.2 q23 q24 q25 q26 q27 q28.2 q31.1 q31.22 q31.3 q32.2 q33 q34.2 q35.1 91 bp DATA TYPE DATA FILE 38,721,970 bp 38,721,980 bp 38,721,990 bp 38,722,000 bp 38,722,010 bp 38,722,020 bp 38,722,030 bp 38,722,040 bp 38,722,050 bp NAME [0 - 35] IMR90-iPSC coverage G Second CpG Methylated Unmethylated Total Methylated 1 2 3 First CpG Unmethylated 0 4 4 Total 1 6 7 IMR90-iPSC A A G A G T A G C A A A C A C T A A T C T A C G A A T A A T G A A C A T A G G C A T T A T T T T A A G A A C C A A A A G A A A G C A C G T G G G C A T T T G G T T T A C A C A T C A C T Sequence RefSeq genes CpGs ¡ CpGs CpG islands

  11. chr4 p16.2 p15.33 p15.31 p15.1 p14 p13 p11 q12 q13.1 q13.2 q21.1 q21.23 q22.2 q23 q24 q25 q26 q27 q28.2 q31.1 q31.22 q31.3 q32.2 q33 q34.2 q35.1 91 bp DATA TYPE DATA FILE 38,721,970 bp 38,721,980 bp 38,721,990 bp 38,722,000 bp 38,722,010 bp 38,722,020 bp 38,722,030 bp 38,722,040 bp 38,722,050 bp NAME [0 - 35] IMR90-iPSC coverage G Second CpG Methylated Unmethylated Total Methylated 1 2 3 First CpG Unmethylated 0 4 4 Total 1 6 7 IMR90-iPSC 1 . 5 × 4 . 5 ( ) =2.4 log-odds ratio = log 2 2 . 5 × 0 . 5 A A G A G T A G C A A A C A C T A A T C T A C G A A T A A T G A A C A T A G G C A T T A T T T T A A G A A C C A A A A G A A A G C A C G T G G G C A T T T G G T T T A C A C A T C A C T Sequence RefSeq genes CpGs ¡ CpGs CpG islands

  12. Do ¡this ¡50 ¡million ¡4mes ¡per ¡sample ¡ chr strand pos1 pos2 MM MU UM UU � chr1 + 469 471 0 5 1 0 � chr1 + 471 484 1 0 4 1 � chr1 + 484 489 3 2 1 0 � chr1 + 489 493 4 2 1 1 � chr1 + 493 497 4 1 3 0 � chr1 + 497 525 6 0 1 0 � chr1 + 525 542 4 0 0 0 � chr1 + 525 563 1 0 0 0 � ... � ... � � ... � � ... � ... ... ... ... � �

  13. Do ¡this ¡50 ¡million ¡4mes ¡per ¡sample ¡

  14. methtuple � www.github.com/PeteHaitch/methtuple ¡

  15. ADS: Distance between CpGs = 10 bp 40000 30000 count 20000 10000 0 − 4 − 2 0 2 4 6 8 log 2 − odds ratio

  16. ADS: Distance = 10 bp 8 6 log 2 − odds ratio 4 2 0 − 2 − 4 40000 30000 20000 10000 0 count

  17. ADS: Distance = 10 bp ADS: Distribution of log 2 − odds ratio 8 8 6 6 90% 75% log 2 − odds ratio 4 log 2 − odds ratio 4 50% 2 25% 2 10% 0 0 − 2 − 2 − 4 − 4 40000 30000 20000 10000 0 0 50 100 150 200 250 count Distance between CpGs (bp)

  18. ADS: Distance = 10 bp ADS: Distribution of log 2 − odds ratio 8 8 6 6 90% 75% log 2 − odds ratio 4 log 2 − odds ratio 4 50% 2 25% 2 10% 0 0 − 2 − 2 − 4 − 4 40000 30000 20000 10000 0 0 50 100 150 200 250 count Distance between CpGs (bp)

  19. ADS: Distance = 10 bp ADS: Distribution of log 2 − odds ratio 8 8 6 6 90% 75% log 2 − odds ratio 4 log 2 − odds ratio 4 50% 2 25% 2 10% 0 0 − 2 − 2 − 4 − 4 40000 30000 20000 10000 0 0 50 100 150 200 250 count Distance between CpGs (bp)

  20. ADS: Distribution of log 2 − odds ratio 8 6 90% 75% 4 log 2 − odds ratio 50% 2 25% 10% 0 − 2 − 4 0 50 100 150 200 250 Distance between CpGs (bp)

  21. ADS: Distribution of log 2 − odds ratio 8 6 90% 75% 4 log 2 − odds ratio 50% quantile 10 25 2 25% 50 75 10% 90 0 − 2 − 4 0 50 100 150 200 Distance between CpGs (bp)

  22. ADS ADS − adipose ADS − iPSC 6 4 log 2 − odds ratio quantile 10 25 50 2 75 90 0 − 2 0 50 100 150 200 0 50 100 150 200 0 50 100 150 200 Distance between CpGs (bp)

  23. CpG island Non CpG island 5.0 ADS 2.5 0.0 CGI CpG island log 2 − odds ratio Non CpG island 5.0 ADS − adipose quantile 2.5 10 25 0.0 50 75 90 5.0 ADS − iPSC 2.5 0.0 0 50 100 150 200 0 50 100 150 200 Distance between CpGs (bp)

  24. Co-­‑methyla4on ¡= ¡correla4on ¡ “The ¡rela<onship ¡between ¡the ¡degree ¡of ¡ methyla<on ¡over ¡distance” ¡ 1. Within-­‑fragment ¡co-­‑methyla4on ¡ 2. Correla/on ¡of ¡β-­‑values ¡ Eckhardt, ¡Florian, ¡et ¡al. ¡"DNA ¡methyla4on ¡profiling ¡of ¡human ¡chromosomes ¡6, ¡20 ¡and ¡22." ¡Nature ¡gene4cs ¡38.12 ¡(2006): ¡1378-­‑1385. ¡

  25. ADS: Correlation of β − values 1.0 0.5 Pearson correlation 0.0 − 0.5 − 1.0 0 500 1000 1500 Distance between CpGs (bp)

  26. ADS ADS − adipose ADS − iPSC 1.0 0.5 Pearson correlation 0.0 − 0.5 − 1.0 0 500 1000 1500 0 500 1000 1500 0 500 1000 1500 Distance between CpGs (bp)

  27. ADS ADS − adipose ADS − iPSC 1.0 0.5 Pearson correlation 0.0 − 0.5 − 1.0 0 100 200 300 400 500 0 100 200 300 400 500 0 100 200 300 400 500 Distance between CpGs (bp)

  28. ADS ADS − adipose ADS − iPSC 1.0 0.5 Pearson correlation 0.0 − 0.5 "Pioneer ¡Factor ¡rearrange ¡the ¡nucleosome" ¡by ¡Wenqiang ¡Shi ¡-­‑ ¡Own ¡work. ¡Licensed ¡under ¡Crea4ve ¡Commons ¡AEribu4on-­‑Share ¡Alike ¡ 3.0 ¡via ¡Wikimedia ¡Commons ¡-­‑ ¡hEp://commons.wikimedia.org/wiki/ − 1.0 File:Pioneer_Factor_rearrange_the_nucleosome.jpg#mediaviewer/File:Pioneer_Factor_rearrange_the_nucleosome.jpg ¡ 0 100 200 300 400 500 0 100 200 300 400 500 0 100 200 300 400 500 Distance between CpGs (bp)

  29. ADS ADS − adipose ADS − iPSC 1.0 0.5 Pearson correlation CpG island 0.0 Non CpG island − 0.5 − 1.0 0 100 200 300 0 100 200 300 0 100 200 300 Distance between CpGs (bp)

  30. Within haplotype co-methylation at neighbouring CpGs methsim � 4 median log odds ratio CGI www.github.com/PeteHaitch/methsim ¡ 0 data 4 Real (ADS) ������� methsim 0 0 50 100 150 200 Distribution of � values Distance between CpGs (bp) CGI ������� Correlations of pairs of � values 4 1 Pearson correlation 3 CGI 0 density data data Real (ADS) methsim 2 Real (ADS) 1 methsim ������� 0 1 0 0 250 500 750 1000 0 1 0 1 Distance between CpGs (bp) � values

  31. Some ¡of ¡these ¡mice ¡are ¡not ¡like ¡the ¡others ¡(we ¡hope…) ¡ Methylome ¡of ¡the ¡agou/ ¡viable ¡yellow ¡ mouse ¡(A vy ) ¡

  32. Unmethylated ¡A vy ¡ Methylated ¡A vy ¡ ¡ ¡ Morgan, ¡Hugh ¡D., ¡et ¡al. ¡"Epigene4c ¡inheritance ¡at ¡the ¡agou4 ¡locus ¡in ¡the ¡mouse." ¡Nature ¡gene4cs ¡23.3 ¡(1999): ¡314-­‑318. ¡

  33. Experimental ¡design ¡ C57BL/6 ¡ Isogenic * ¡

  34. Experimental ¡design ¡ C57BL/6 ¡ Isogenic * ¡ "Liver ¡(transparent)" ¡by ¡Mikael ¡Häggström ¡-­‑ ¡File:Human ¡Hepar.jpg. ¡Licensed ¡under ¡Public ¡domain ¡via ¡Wikimedia ¡Commons ¡– ¡ ¡ hEp://commons.wikimedia.org/wiki/File:Liver_(transparent).png#mediaviewer/File:Liver_(transparent).png ¡

  35. Experimental ¡design ¡ C57BL/6 ¡ Isogenic * ¡

  36. Experimental ¡design ¡ a/a ¡ a/a ¡ A vy /a ¡ a/a ¡ A vy /a ¡ C57BL/6 ¡ Isogenic * ¡

Recommend


More recommend