rnaseq analysis
play

RNAseq analysis -its complicated Oktober 2016 RNA - PowerPoint PPT Presentation

RNAseq analysis -its complicated Oktober 2016 RNA reads are not enough to iden;fy func;onal RNAs Defining functional DNA elements in the human genome Kellis M et al.


  1. RNAseq ¡analysis ¡ -­‑it’s ¡complicated ¡ Oktober ¡2016 ¡ ¡

  2. RNA ¡reads ¡are ¡not ¡enough ¡to ¡iden;fy ¡ func;onal ¡RNAs ¡ Defining functional DNA elements in the human genome Kellis M et al. PNAS 2014;111:6131-6138

  3. Depending ¡on ¡the ¡steps ¡from ¡sample ¡ to ¡RNA ¡seq ¡will ¡give ¡different ¡results ¡ RNA-­‑> ¡ PolyA ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡(mRNA) ¡ AAAAAAAA ¡ RiboMinus ¡ ¡ ¡ ¡ ¡ ¡(-­‑ ¡rRNA) ¡ enrichments ¡-­‑> ¡ Size ¡ ¡<50 ¡nt ¡ ¡ ¡ ¡ ¡(miRNA ¡) ¡ ….. ¡ ¡ Size ¡of ¡fragment ¡ Strand ¡specific ¡ 5’ ¡end ¡specific ¡ ¡ 3’ ¡end ¡specific ¡ ….. ¡ ¡ library ¡-­‑> ¡ reads ¡-­‑> ¡ Single ¡end ¡(1 ¡read ¡per ¡fragment) ¡ Paired ¡end ¡(2 ¡reads ¡per ¡fragment) ¡

  4. Mapping ¡(Pär ¡Engström) ¡ • Use ¡RNA ¡specific ¡mapper ¡ • Use ¡a ¡two-­‑pass ¡workflow ¡ • STAR ¡or ¡HISAT ¡ ¡ ¡ • If ¡you ¡want ¡to ¡run ¡Cufflinks, ¡use ¡TopHat ¡or ¡ HISAT ¡ • For ¡long ¡(PacBio) ¡reads, ¡STAR, ¡BLAT ¡or ¡GMAP ¡ can ¡be ¡used ¡

  5. RNA-­‑seq ¡analysis ¡workflow ¡ reads.fastq.gz( STAR( mappedReads.bam( Mapped(reads( Reads( Mapping( Gene(annotaCon:( ref.bed(/(ref.ga( Reference( Gene( genome.fa( expression(

  6. Gene ¡and ¡Isoform ¡detec;on ¡

  7. Do ¡a ¡lot ¡of ¡QC ¡ Read(QC( Mapping( Mapping(QC( $(FastQC( staCsCcs( $(RseQC( reads.fastq.gz( STAR( mappedReads.bam( Reads( Mapping( Mapped(reads( Gene(annotaCon:( ref.bed(/(ref.ga( Reference( Gene( genome.fa( expression( Outlier( detecCon,( sample(swaps(

  8. More ¡varia;on ¡when ¡using ¡top ¡hat ¡2 ¡with ¡ default ¡secngs ¡than ¡when ¡using ¡STAR ¡or ¡ Stampy ¡with ¡default ¡secng ¡ Percent properly mapped paired end reads 60 70 80 90 Compare mapping efficacy of different RNA − seq assemblers Cg4a_KS2 ● ● ● Cg88_14_KS3 ● ● ● Cg88_44_KS2 ● ● ● C.grandiflora ¡ Cg89_16_KS2 ● ● ● Cg89_3_KS1 ● ● ● Cg8c_KS2 ● ● ● Cg8f_KS1 ● ● ● Cg94_6_KS1 ● ● ● Cr1GR1_2_KS1 ● ● ● Cr1GR1_2_KS2 ● ● ● Cr1GR1_2_KS3 ● ● ● Cr23_9_KS2 C.rubella ¡ ● ● ● Cr39_1_TS1_KS1 ● ● ● species Cr75_2_3_KS1 ● ● ● Cr79_29_extra1 ● ● ● Cr84_21_KS1 ● ● ● CrN22561_KS2 ● ● ● Inter3_1 ● ● ● Inter4_1_1 ● ● ● Inter4_1_2 hybrid ¡ ● ● ● Inter4_1_3 ● ● ● Inter4_1_4 Inter5_1 ● ● ● Intra6_3 ● ● ● Intra7_2_1 ● ● ● C.grandiflora ¡ Intra7_2_2 ● ● ● Intra7_2_3 ● ● ● Intra8_2 ● ● ● Shape Colour ● ● ● ● Leaf Flower Tophat2 STAR Stampy

  9. RNA ¡QC ¡ ¡Åsa ¡Björklund ¡

  10. Mapped(reads( Reads( Mapping( Mapped(reads( Reads( Mapping( Mapped(reads( Reads( Mapping( Expression(( Reference( Table(with( Expression(( Mapped(reads( Reads( Mapping( per(gene( Reference( Expression(( Mapped(reads( Reads( Mapping( per(gene( Reference( per(gene( Expression(( counts,( Reference( Table(with( Expression(( per(gene( Reference( Expression(( per(gene( Reference( per(gene( rpkms,( counts,( Mapped(reads( Reads( Mapping( Mapped(reads( Reads( Mapping( Mapped(reads( Reads( Mapping( fpkms(or( rpkms,( Mapped(reads( Reads( Mapping( Mapped(reads( Reads( Mapping( Expression(( Mapped(reads( Reads( Mapping( Reference( Expression(( Mapped(reads( Reads( Mapping( per(gene( Reference( fpkms(or( Expression(( similar( Mapped(reads( Reads( Mapping( per(gene( Reference( Expression(( Expression(( per(gene( Reference( Reference( Expression(( per(gene( per(gene( Reference( Expression(( similar( per(gene( Reference( Expression(( per(gene( Reference( per(gene( Sample$swaps$and$outliers$can$be$ Sample$swaps$and$outliers$can$be$ iden0fied$using$PCA$ iden0fied$using$PCA$

  11. RNA ¡QC ¡ PCA(analysis(detected(potenCal( sample(swaps(

  12. Principal ¡component ¡1 ¡separates ¡ samples ¡from ¡flowers ¡and ¡leaves ¡ ¡ Cg4a_KS2_F ● Cg4a_KS2_L ● Cg88_14_KS3_F Cg88_14_KS3_L Cg88_44_KS2_F ● Cg88_44_KS2_L Cg89_16_KS2_F ● ● Cg89_16_KS2_L ● Cg89_3_KS1_F ● Cg89_3_KS1_L ● ● ● Cg8c_KS2_F C. ¡rubella ¡ ¡ Cg8c_KS2_L 50 ● Cg8f_KS1_F ● Cg8f_KS1_L Cg94_6_KS1_F ● Cg94_6_KS1_L ● ● ● Cr1GR1_2_KS1_F Cr1GR1_2_KS1_L Cr1GR1_2_KS2_F ● Cr1GR1_2_KS2_L Cr1GR1_2_KS3_F ● ● ● Cr1GR1_2_KS3_L Cr23_9_KS2_F ● Cr23_9_KS2_L PC2 ● ● Cr39_1_TS1_KS1_F Cr39_1_TS1_KS1_L Cr75_2_3_KS1_F ● 0 Cr75_2_3_KS1_L Cr79_29_extra1_F ● ● Cr79_29_extra1_L ● ● ● Cr84_21_KS1_F ● Cr84_21_KS1_L ● ● CrN22561_KS2_F ● ● CrN22561_KS2_L ● ● Inter3_1_F ● Inter3_1_L ● ● Inter4_1_1_F ● Inter4_1_1_L ● ● Inter4_1_2_F Inter4_1_2_L Inter4_1_3_F ● − 50 ● Inter4_1_4_L ● Inter5_1_F ● Inter5_1_L ● ● Intra6_3_F Intra6_3_L ● Intra7_2_1_F ● Intra7_2_1_L Intra7_2_2_F ● ● Intra7_2_2_L Intra7_2_3_F ● Intra7_2_3_L ● Intra8_2_F Intra8_2_L − 150 − 100 − 50 0 50 100 150 PC1

  13. Principal ¡component ¡2 ¡and ¡3 ¡separates ¡the ¡different ¡species ¡ ¡ 100 C. ¡rubella ¡ ¡ 50 C. ¡rubella ¡ ¡ hybrid ¡ PC3 0 −50 C. ¡grandiflora ¡ −60 −40 −20 0 20 40 60 80 PC2

  14. Differen;al ¡expression ¡analysis ¡ ¡ Mikael ¡Huss ¡ ¡ The ¡iden;fica;on ¡of ¡genes ¡(or ¡other ¡types ¡of ¡genomic ¡features, ¡such ¡as ¡transcripts ¡or ¡ exons) ¡that ¡are ¡expressed ¡in ¡significantly ¡different ¡quan;;es ¡in ¡dis;nct ¡groups ¡of ¡ samples, ¡be ¡it ¡biological ¡condi;ons ¡(drug-­‑treated ¡vs. ¡controls), ¡diseased ¡vs. ¡healthy ¡ individuals, ¡different ¡;ssues, ¡different ¡stages ¡of ¡development, ¡or ¡something ¡else. ¡ Typically ¡univariate ¡analysis ¡(one ¡ gene ¡at ¡a ¡;me) ¡– ¡even ¡though ¡we ¡ know ¡that ¡genes ¡are ¡not ¡ independent ¡

  15. Decision ¡tree ¡for ¡so/ware ¡selec2on ¡(2016) ¡ Sleuth ¡ , ¡Sleuth ¡ ¡ ? ¡

  16. Gene-­‑set ¡analysis ¡(GSA) ¡ ¡ Samples Immune ¡response Genes Pyruvate PPARG GO-­‑terms Gen Gene-­‑s e-­‑set ¡ ¡analy analysis sis Pathways Gene-­‑level ¡data Gene-­‑set ¡data ¡(results) Chromosomal ¡loca?ons Transcrip?on ¡factors Histone ¡modifica?ons We ¡will ¡focus ¡on ¡transcriptomics ¡and ¡differen;al ¡expression ¡analysis ¡ Diseases However, ¡GSA ¡can ¡in ¡principle ¡be ¡used ¡on ¡all ¡types ¡of ¡genome-­‑wide ¡data. ¡ etc…

  17. miRNA ¡seq ¡analysis ¡ (Berezikov ¡et ¡al. ¡Genome ¡Research, ¡2011.) ¡

  18. Single ¡cell ¡sequencing ¡ (Sandberg,$Nature$Methods$2014)$

  19. Allele ¡specific ¡expression ¡ Adding another layer to transcriptome complexity... � � Adopted from Unneberg, 2010 ...and each gene is present on two chromosomes. => it has two alleles

  20. Exercises ¡ Mapping ¡ Introductory ¡ • • STAR ¡ ¡ Introduc;on ¡to ¡the ¡RNA ¡seq ¡data ¡provided ¡ – – HISAT2 ¡ Short ¡introduc;on ¡to ¡R ¡ – – Tutorial ¡for ¡reference ¡guided ¡assembly ¡ Short ¡introduc;on ¡to ¡IGV ¡ • – Beta ¡ labs ¡ • Cufflinks ¡ – String;e ¡ Single ¡cell ¡RNA ¡PCA ¡and ¡clustering ¡ – – Tutorial ¡for ¡de ¡novo ¡assembly ¡ Gene ¡set ¡analysis ¡ • – UPPMAX ¡ • Trinity ¡ – Visualise ¡mapped ¡reads ¡and ¡assembled ¡ sbatch ¡script ¡example ¡ • – transcripts ¡on ¡reference ¡ IGV ¡ – RNA ¡quality ¡controll ¡ • Tutorial ¡for ¡RNA ¡seq ¡Quality ¡Control ¡ – Differen;al ¡expression ¡analysis ¡ • DEseq2 ¡ – Calisto ¡and ¡Sleuth ¡ – mul; ¡variate ¡analysis ¡in ¡SIMCA ¡ – small ¡RNA ¡analysis ¡ • miRNA ¡analysis ¡ –

  21. Need ¡help?? ¡ • We ¡are ¡here ¡for ¡you. ¡Apply ¡for ¡help. ¡

Recommend


More recommend