Specifica(ons ¡of ¡Paper ¡ Presenta(ons ¡ ¡ Winter/Spring ¡2014 ¡
Presenta(on ¡Structure ¡ • Your ¡presenta(on ¡should ¡be ¡between ¡1 ¡hour ¡ and ¡1 ¡hour ¡and ¡15 ¡mins ¡long. ¡ • Your ¡presenta(on ¡should ¡consist ¡of ¡the ¡ following ¡parts: ¡ – Introduc(on ¡and ¡mo(va(on ¡ – Contribu(ons ¡ – Cri(que ¡ – Discussion ¡ ¡
Before ¡you ¡start.. ¡
By ¡this ¡point ¡in ¡graduate ¡school, ¡you ¡should ¡be ¡ able ¡to ¡read ¡a ¡paper ¡and ¡answer ¡the ¡following ¡ ques(ons: ¡ 1. What ¡is ¡the ¡paper ¡about. ¡Summarize ¡the ¡ main ¡points ¡of ¡the ¡paper. ¡ 2. How ¡would ¡you ¡cri(que ¡of ¡the ¡paper? ¡ 3. What ¡is ¡one ¡follow-‑up ¡study ¡of ¡the ¡said ¡ work? ¡
Introduc(on ¡and ¡Mo(va(on ¡
Introduc(on ¡ • Put ¡the ¡paper ¡into ¡context. ¡ ¡ ¡ • Mo(vate ¡the ¡problem(s) ¡the ¡authors ¡are ¡ addressing. ¡ • Give ¡background ¡informa(on ¡that ¡is ¡necessary ¡ to ¡understand ¡the ¡paper; ¡ this ¡implies ¡that ¡you ¡ should ¡not ¡just ¡limit ¡yourself ¡to ¡what ¡is ¡in ¡the ¡ introduc5on ¡of ¡the ¡paper. ¡ • Related ¡work. ¡
8 ¡
Sample ¡Prepara(on ¡ 9 ¡
Sample ¡Prepara(on ¡ Fragments ¡ 10 ¡
Sample ¡Prepara(on ¡ Fragments ¡ Sequencing ¡ Next ¡Genera(on ¡Sequencing ¡(NGS) ¡ ACGTAGAATCGACCATG ACGTAGAATACGTAGAA GGGACGTAGAATACGAC Reads ¡ 11 ¡
Sample ¡Prepara(on ¡ Fragments ¡ Sequencing ¡ Reads ¡ Assembly ¡ Con(gs ¡ Analysis ¡ 12 ¡
Challenges ¡in ¡Fragment ¡Assembly ¡ ¡ • Repeats ¡in ¡the ¡genome. ¡ ¡ ACCAGTT GACTGGGAT CCTTTTTAAA GACTGGGAT TTTAACGCG CAGTT GACTG TGGGAT CC ¡ TGGGAT TT • Sequencing ¡errors, ¡which ¡vary ¡by ¡pla]orm. ¡ ¡ TGGGAATT TGGGA C TT Subs(tu(on ¡ ¡ TGGGA -- T Dele(on ¡ Inser(on ¡ TGGGAA CTTA TT • Size ¡of ¡the ¡data, ¡e.g. ¡1.5 ¡billion ¡reads ¡short ¡reads . ¡ 13 ¡
De ¡Bruijn ¡Graph ¡for ¡Assembly ¡ • Introduced ¡in ¡1989. ¡ ¡ Pevzner. ¡J ¡Biomol ¡Struct ¡Dyn ¡(1989) ¡7:63—73. ¡ ¡ Iduly ¡& ¡Waterman. ¡J. ¡Comput ¡Biol ¡(1995) ¡2:291—306. ¡ ¡ • Adapted ¡for ¡next ¡genera(on ¡sequencing ¡data. ¡ ¡ Euler : ¡Pevzner, ¡Tang ¡& ¡Tesler. ¡Genome ¡Res. ¡(2004) ¡14:1786—96. ¡ Euler-‑SR : ¡Chaisson ¡& ¡Pevzner. ¡Genome ¡Res. ¡(2008) ¡18:324—30. ¡ Velvet : ¡Zerbino ¡& ¡Birney. ¡Genome ¡Res. ¡(2008) ¡18:821—29. ¡ ALLPATHS : ¡Butler ¡et ¡al. ¡Genome ¡Res. ¡(2008) ¡18(5):810—20. ¡ ABySS : ¡Simpson ¡et ¡al. ¡Genome ¡Res ¡(2009) ¡19:1117—1123. ¡ ¡ 14 ¡
De ¡Bruijn ¡Graph ¡Construc(on ¡ Choose ¡a ¡value ¡of ¡ 𝑙 . ¡ I. II. For ¡each ¡ 𝑙 -‑mer ¡that ¡exists ¡in ¡any ¡sequence ¡ create ¡an ¡edge ¡with ¡one ¡vertex ¡ ¡labeled ¡as ¡the ¡ prefix ¡and ¡one ¡vertex ¡labeled ¡as ¡the ¡suffix. ¡ III. Glue ¡all ¡ver(ces ¡that ¡have ¡the ¡same ¡label. ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ (Pevzner, ¡Tang ¡& ¡Tesler, ¡2004) ¡ 15 ¡
De ¡Bruijn ¡Graph ¡Construc(on ¡ GTCT ATTCG CTA ATTCA CTA ATTCG ¡ ATTC ¡ TTCG ¡ ATTCA ¡ TTCA ¡ ATTC ¡ (Pevzner, ¡Tang ¡& ¡Tesler, ¡2004) ¡ 16 ¡
De ¡Bruijn ¡Graph ¡Construc(on ¡ GTCT ATTCG CTA ATTCA CTA ATTCG ¡ ATTC ¡ TTCG ¡ ATTCA ¡ TTCA ¡ ATTC ¡ (Pevzner, ¡Tang ¡& ¡Tesler, ¡2004) ¡ 17 ¡
De ¡Bruijn ¡Graph ¡Construc(on ¡ GTCT ATTCG CTA ATTCA CTA TTCG ¡ ATTCG ¡ ATTC ¡ ATTCA ¡ TTCA ¡ (Pevzner, ¡Tang ¡& ¡Tesler, ¡2004) ¡ 18 ¡
De ¡Bruijn ¡Graph ¡of ¡a ¡Genome ¡ Example ¡Genome: ¡ ¡ ¡ABCDEFGHICDEFGKL ¡ Example ¡Genome: ¡ ¡ ¡ ABCDEFGHICDEFGKL ( 𝑙 ¡−1) -‑mers ¡ 𝑙 -‑mers ¡ ABC HIC ABCD HICD BCD ICD BCDE ICDE CDE FGK CDEF EFGK DEF GKL DEFG FGKL ¡ EFG ¡ EFGH GHI GHIC 19 ¡
De ¡Bruijn ¡Graph ¡of ¡a ¡Genome ¡ Example ¡Genome: ¡ ¡ ¡ABCDEFGHICDEFGKL ¡ Example ¡Genome: ¡ ¡ ¡ ABCDEFGHICDEFGKL GHI HIC ICD FGH CDE ABC BCD DEF EFG FGK GKL 20 ¡
De ¡Bruijn ¡Graph ¡of ¡a ¡Genome ¡ Bulges ¡(undirected ¡cycles) ¡and ¡ whirls ¡(directed ¡cycles) ¡ Example ¡Genome: ¡ ¡ ¡ABCDEFGHICDEFGKL ¡ occur ¡because ¡of ¡sequencing ¡errors ¡or ¡repeats ¡in ¡the ¡ genome. ¡ GHI HIC ICD FGH CDE ABC BCD DEF EFG FGK GKL 21 ¡
De ¡Bruijn ¡Graph ¡of ¡a ¡Genome ¡ Example ¡Genome: ¡ ¡ ¡ABCDEFGHICDEFGKL ¡ Example ¡Genome: ¡ ¡ ¡ ABCDEFGHICDEFGKL GHI HIC 2 ¡ ICD FGH CDE ABC BCD DEF EFG FGK GKL 1 ¡ 3 ¡ 22 ¡
Typical ¡De ¡Bruijn ¡Graph ¡ … ¡ 23 ¡
De ¡Bruijn ¡Graph ¡of ¡a ¡Genome ¡ Example ¡Genome: ¡ ¡ ¡ABCDEFGHICDEFGKL ¡ Example ¡Genome: ¡ ¡ ¡ ABCDEFGHICDEFGKL GHI HIC 2 ¡ ICD FGH CDE ABC BCD DEF EFG FGK GKL 1 ¡ 3 ¡ 24 ¡
De ¡Bruijn ¡Graph ¡of ¡a ¡Genome ¡ Example ¡Genome: ¡ ¡ ¡ABCDEFGHICDEFGKL ¡ Example ¡Genome: ¡ ¡ ¡ ABCDEFGHICDEFGKL CDE ABC BCD DEF EFG FGK GKL 25 ¡
De ¡Bruijn ¡Graph ¡of ¡a ¡Genome ¡ Example ¡Genome: ¡ ¡ ¡ABCDEFGHICDEFGKL ¡ Resul(ng ¡Erroneous ¡Genome: ¡ ¡ ¡ ABCDEFGKL CDE ABC BCD DEF EFG FGK GKL 1 ¡ 26 ¡
Fragment ¡Assembly ¡Errors ¡ • The ¡number ¡of ¡subs(tu(on ¡errors, ¡inser(ons ¡and ¡ dele(ons ¡can ¡be ¡significantly ¡large. ¡ – ~9000 ¡errors ¡in ¡assembly ¡of ¡ E.coli ¡ with ¡Velvet. ¡ ¡ – 20 ¡to ¡30 ¡errors ¡for ¡every ¡100,000 ¡bp ¡with ¡SOAPdenovo. ¡ • Important ¡for ¡dis(nguishing ¡between ¡true ¡varia(on ¡ and ¡ar(facts ¡of ¡the ¡assembly. ¡ • But ¡why ¡do ¡assembly ¡errors ¡occur? ¡ ¡ 27 ¡
Contribu(ons ¡
Contribu(ons ¡ • Explain ¡what ¡the ¡graphs ¡are ¡saying. ¡ – Corollary: ¡Don’t ¡just ¡copy ¡graphs ¡from ¡the ¡paper. ¡ • Give ¡an ¡overview ¡of ¡what ¡the ¡contribu(ons ¡ are. ¡ • Demonstrate ¡how ¡the ¡results ¡are ¡derived; ¡i.e. ¡ the ¡algorithm. ¡ • Make ¡sure ¡you ¡have ¡a ¡solid ¡understanding ¡ about ¡the ¡contribu(ons ¡and ¡algorithms ¡in ¡the ¡ paper ¡ ¡
Sample ¡Prepara(on ¡ Fragments ¡ Sequencing ¡ Reads ¡ Assembly ¡ Con(gs ¡ Analysis ¡ 30 ¡
Sample ¡Prepara(on ¡ Fragments ¡ Reads ¡ Sequencing ¡ SEQuel ¡ Reads ¡ Con(gs ¡ Assembly ¡ Analysis ¡ Refined ¡Con(gs ¡ 31 ¡
Number ¡of ¡inser(ons ¡and ¡dele(ons ¡ 351 ¡ Velvet ¡ 1945 ¡ 47 ¡ Euler-‑SR ¡ 249 ¡ 0 ¡ 200 ¡ 400 ¡ 600 ¡ 800 ¡ 1000 ¡ 1200 ¡ 1400 ¡ 1600 ¡ 1800 ¡ 2000 ¡ Number ¡of ¡subs(tu(on ¡errors ¡ 325 ¡ Velvet ¡ ¡ 8997 ¡ 31 ¡ Euler-‑SR ¡ 141 ¡ 0 ¡ 1000 ¡ 2000 ¡ 3000 ¡ 4000 ¡ 5000 ¡ 6000 ¡ 7000 ¡ 8000 ¡ 9000 ¡ 32 ¡
Sample ¡Prepara(on ¡ Fragments ¡ Reads ¡ Sequencing ¡ SEQrepair ¡ Reads ¡ Con(gs ¡ Assembly ¡ Analysis ¡ Refined ¡Con(gs ¡ 33 ¡
SEQuel ¡Algorithm ¡ I. Align ¡each ¡of ¡the ¡input ¡reads ¡to ¡each ¡of ¡the ¡ini(al ¡ . ¡ con(gs. ¡ ¡ ¡ ¡ ¡ 34 ¡
SEQuel ¡Algorithm ¡ I. Align ¡each ¡of ¡the ¡input ¡reads ¡to ¡each ¡of ¡the ¡ini(al ¡ . ¡ con(gs. ¡ ¡ ¡ ¡ ¡ 35 ¡
SEQuel ¡Algorithm ¡ I. Align ¡each ¡of ¡the ¡input ¡reads ¡to ¡each ¡of ¡the ¡ini(al ¡ . ¡ con(gs. ¡ ¡ ¡ ¡ ¡ 36 ¡
SEQuel ¡Algorithm ¡ I. Align ¡each ¡of ¡the ¡input ¡reads ¡to ¡each ¡of ¡the ¡ini(al ¡ . ¡ con(gs. ¡ ¡ 1 ¡ ¡ 22 ¡ 1 ¡ 24 ¡ 4 ¡ 23 ¡ 5 ¡ 27 ¡ 16 ¡ 1 ¡ 2 ¡ 22 ¡ 2 ¡ 22 ¡ 25 ¡ 4 ¡ ¡ 15 ¡ 7 ¡ 24 ¡ 7 ¡ 17 ¡ 18 ¡ 10 ¡ 10 ¡ 17 ¡ ¡ 18 ¡ 16 ¡ 19 ¡ 37 ¡
Recommend
More recommend