lectures 13 high throughput sequencing beyond the genome
play

Lectures 13: High throughput sequencing: Beyond the genome - PowerPoint PPT Presentation

Lectures 13: High throughput sequencing: Beyond the genome Spring 2017 March 28, 2017 h@p://www.fejes.ca/2009/06/science-cartoons-5-rna-seq.html Omics


  1. Lectures ¡13: ¡High ¡throughput ¡ sequencing: ¡Beyond ¡the ¡genome ¡ Spring ¡2017 ¡ March ¡28, ¡2017 ¡

  2. h@p://www.fejes.ca/2009/06/science-­‑cartoons-­‑5-­‑rna-­‑seq.html ¡

  3. Omics ¡ • Transcriptome ¡-­‑ ¡the ¡set ¡of ¡all ¡mRNAs ¡present ¡in ¡a ¡cell ¡ • Proteome ¡– ¡proteins ¡ • Metabolome/physiome ¡-­‑ ¡metabolites ¡ • Microbiome ¡– ¡the ¡collecSon ¡of ¡microbes ¡present ¡in ¡an ¡ organism ¡or ¡other ¡locaSon ¡ • Interactome ¡ ¡ “In ¡physics… ¡the ¡ -­‑on ¡ suffix ¡has ¡tended ¡to ¡signify ¡an ¡elementary ¡parScle: ¡the ¡photon, ¡ electron, ¡proton, ¡meson, ¡etc., ¡whereas ¡ -­‑ome ¡ in ¡biology ¡has ¡the ¡opposite ¡intellectual ¡ funcSon, ¡of ¡direcSng ¡a@enSon ¡to ¡a ¡holisSc ¡abstracSon, ¡an ¡eventual ¡goal…” ¡ ¡From: ¡ ‘Ome ¡Sweet ¡‘Omics . ¡The ¡ScienSst ¡15(7), ¡2001 ¡

  4. Omics ¡ • Biologists ¡have ¡high-­‑throughput ¡methods ¡for ¡probing ¡ each ¡ -­‑ome : ¡ • Transcriptome ¡– ¡RNA-­‑Seq ¡ • Proteome ¡– ¡mass ¡spectrometry, ¡protein ¡arrays ¡ • Microbiome ¡– ¡next ¡generaSon ¡sequencing ¡ • Interactome ¡– ¡yeast-­‑two-­‑hybrid ¡ • Regulome ¡– ¡ChIP-­‑Seq ¡ ¡ Lots ¡of ¡data ¡for ¡bioinformaScs ¡people ¡to ¡analyze! ¡

  5. RNA-­‑seq: ¡ ¡profiling ¡the ¡transcriptome ¡ • Technique: ¡ ¡sequence ¡the ¡total ¡RNA ¡produced ¡by ¡the ¡ cell ¡

  6. Read ¡mapping ¡

  7. Pile-­‑ups ¡ From: ¡The ¡ENCODE ¡Project ¡ConsorSum ¡(2011) ¡A ¡User's ¡Guide ¡to ¡the ¡Encyclopedia ¡of ¡DNA ¡ Elements ¡(ENCODE). ¡PLoS ¡Biol ¡9(4): ¡e1001046. ¡ ¡

  8. Pile-­‑ups ¡ gene ¡ model ¡ read ¡ depth ¡ ¡ Most ¡reads ¡fall ¡into ¡coding ¡exons ¡or ¡UTRs ¡

  9. RNA-­‑seq: ¡ ¡profiling ¡the ¡transcriptome ¡ • Technique: ¡ ¡sequence ¡the ¡total ¡RNA ¡produced ¡by ¡the ¡ cell ¡ • What ¡is ¡this ¡good ¡for? ¡

  10. RNA-­‑seq: ¡ ¡profiling ¡the ¡transcriptome ¡ • Genome ¡annotaSon ¡(transcript ¡assembly) ¡ • Detect ¡alternaSve ¡splicing ¡ • Obtain ¡gene/transcript ¡expression ¡levels ¡and ¡detecSon ¡ of ¡differenSal ¡expression ¡ • Allele-­‑specific ¡expression ¡ • Small-­‑RNA ¡transcriptome ¡(different ¡protocol ¡than ¡ regular ¡RNA-­‑seq) ¡ ¡

  11. All ¡the ¡uses ¡of ¡RNA-­‑seq ¡ h@p://www.rna-­‑seqblog.com/news/informaSon/rna-­‑seq-­‑blog-­‑poll-­‑results/ ¡

  12. DifferenSal ¡expression ¡ h@p://www.fejes.ca/labels/figures.html ¡

  13. RNA-­‑seq ¡protocol ¡

  14. Raw ¡and ¡Aligned ¡Reads ¡ • Raw ¡data ¡is ¡a ¡(large) ¡set ¡of ¡sequences ¡ • Typical ¡file ¡format ¡is ¡FASTQ ¡ @HWI-EAS255_4_FC2010Y_1_43_110_790 Read ¡idenSfier ¡ TTAATCTACAGAATAGATAGCTAGCATATATTT Bases ¡called ¡ + hhhhhhhhhhhhhhhdhhhhhhhhhhhdRehdh Base ¡quality ¡codes ¡ • Alignment ¡to ¡genome ¡is ¡done ¡by ¡efficient ¡indexing ¡ • Aligned ¡reads ¡in ¡SAM ¡format ¡ ¡ @HWI-… 163 chr19 9900 10000 16M2I25M ¡ Read ¡ ¡ Where ¡this ¡ ¡ Start ¡and ¡end ¡ ¡ Codes ¡for ¡match: ¡ idenSfier ¡ read ¡matched ¡ posiSons ¡ 16 ¡matches, ¡2 ¡extra,… ¡

  15. Cataloging ¡the ¡transcriptome ¡ • Transcriptomics ¡involves ¡studying ¡expression ¡ at ¡ – SpaSal ¡resoluSon: ¡Sssues, ¡individuals, ¡locaSon ¡ – Temporal ¡resoluSon: ¡circadian, ¡seasonal, ¡lifeSme ¡

  16. Inter-­‑Genic ¡Reads ¡ • Many ¡reads ¡reflect ¡unannotated ¡genes: ¡ ¡ opportunity ¡to ¡discover ¡new ¡genes ¡

  17. RPKM ¡– ¡A ¡Simple ¡NormalizaSon ¡ • Different ¡numbers ¡of ¡counts ¡per ¡sample ¡ (sequencing ¡depth) ¡ • Divide ¡counts ¡in ¡a ¡region ¡of ¡interest ¡(a ¡ genomic ¡region ¡or ¡a ¡gene ¡or ¡an ¡exon) ¡by ¡all ¡ counts ¡(reads ¡per ¡million ¡reads ¡-­‑RPM) ¡ • Genes ¡have ¡different ¡lengths: ¡divide ¡also ¡by ¡ length ¡of ¡gene ¡ ¡ • Obtain ¡RPKM ¡(reads ¡per ¡kilobase ¡of ¡exon ¡per ¡ million ¡reads) ¡ – Some ¡use ¡FPKM ¡(fragments/kb/Mr) ¡

  18. ChIP-­‑seq ¡ h@p://www.fejes.ca/labels/Chip-­‑Seq.html ¡

  19. Comments ¡on ¡ChIP-­‑seq ¡ • Genome-­‑wide ¡mapping ¡of ¡transcripSon ¡factor ¡ binding ¡sites ¡ • ComputaSonal ¡problems: ¡ – Peak ¡calling ¡ – SSll ¡need ¡moSf ¡finders, ¡but ¡makes ¡the ¡problem ¡ easier ¡

  20. Variants ¡ • Apply ¡the ¡methodology ¡to ¡RNA: ¡ ¡map ¡RNA-­‑binding ¡ sites ¡in ¡mRNA ¡that ¡interact ¡with ¡specific ¡RNA-­‑binding ¡ proteins ¡ • CLIP-­‑Seq ¡ (cross-­‑linking ¡immunoprecipitaSon ¡sequencing) ¡ ¡ • RIP-­‑Seq ¡ (RNA ¡immunoprecipitaSon ¡sequencing) ¡

  21. Other ¡sequencing-­‑based ¡techniques ¡ • Methyl-­‑seq, ¡BS-­‑seq: ¡methylaSon ¡ • Chromosome ¡conformaSon ¡capture ¡(3C-­‑4C-­‑5C-­‑HiC): ¡ spaSal ¡organizaSon ¡of ¡chromosomes ¡ h@p://en.wikipedia.org/wiki/Chromosome_conformaSon_capture ¡

  22. Other ¡sequencing-­‑based ¡techniques ¡ • Methyl-­‑seq, ¡BS-­‑seq: ¡methylaSon ¡ • Chromosome ¡conformaSon ¡capture ¡(3C-­‑4C-­‑5C): ¡spaSal ¡ organizaSon ¡of ¡chromosomes ¡ • seqFold: ¡RNA ¡secondary ¡structure ¡ • DNAase-­‑seq ¡ • And ¡many ¡more! ¡ h@p://en.wikipedia.org/wiki/Chromosome_conformaSon_capture ¡

  23. Read ¡mapping ¡ All ¡the ¡sequencing-­‑based ¡techniques ¡require ¡read ¡mapping ¡as ¡a ¡first ¡step. ¡ ¡ ExisSng ¡alignment ¡tools ¡are ¡not ¡fast ¡enough ¡ à ¡need ¡new ¡algorithms! ¡

  24. Read ¡mapping ¡ • How ¡is ¡the ¡problem ¡of ¡read ¡mapping ¡different ¡ than ¡sequence ¡alignment ¡as ¡we ¡have ¡ considered ¡it ¡unSl ¡now? ¡

Recommend


More recommend