genome sequencing part 1
play

Genome Sequencing (Part 1) Lecture 4: August 30, 2012 - PowerPoint PPT Presentation

Genome Sequencing (Part 1) Lecture 4: August 30, 2012 Review from Last Lecture De novo vs. Re-sequencing De novo assembly (from the


  1. Genome ¡Sequencing ¡(Part ¡1) ¡ Lecture ¡4: ¡August ¡30, ¡2012 ¡ ¡

  2. Review ¡from ¡Last ¡Lecture ¡

  3. De ¡novo ¡vs. ¡Re-­‑sequencing ¡ • De ¡novo ¡ assembly ¡(“from ¡the ¡beginning”) ¡ implies ¡that ¡you ¡have ¡no ¡prior ¡knowledge ¡of ¡ the ¡genome. ¡ ¡No ¡reference, ¡no ¡conNgs, ¡only ¡ reads. ¡ • Re-­‑sequencing ¡assembly ¡assumes ¡you ¡have ¡a ¡ copy ¡of ¡the ¡reference ¡genome ¡(that ¡has ¡been ¡ verified ¡to ¡a ¡certain ¡degree). ¡ • The ¡programs ¡that ¡work ¡for ¡re-­‑sequencing ¡will ¡ not ¡work ¡for ¡de ¡novo ¡and ¡vice ¡versa. ¡However, ¡ both ¡can ¡create ¡copies ¡of ¡the ¡genome. ¡

  4. De ¡novo ¡vs. ¡Re-­‑sequencing ¡

  5. Sample ¡PreparaNon ¡ Re-sequencing (LOCAS, Shrimp) requires 15x to 30x coverage. Anything less and re-sequencing programs will not produce results or produce questionable results. Fragments

  6. Sample ¡PreparaNon ¡ De-novo assembly requires higher coverage. At least 30x but upwards to 100x’s coverage. Most de novo assemblers require paired-end data. Fragments

  7. IntroducNon ¡and ¡History ¡

  8. Sample ¡PreparaNon ¡

  9. Sample ¡PreparaNon ¡ Fragments ¡

  10. Sample ¡PreparaNon ¡ Fragments ¡ Sequencing ¡ Next ¡GeneraNon ¡Sequencing ¡(NGS) ¡ ACGTAGAATCGACCATG ACGTAGAATACGTAGAA GGGACGTAGAATACGAC Reads ¡

  11. Sample ¡PreparaNon ¡ Fragments ¡ Sequencing ¡ Reads ¡ ACGTAGAATACGTAGAA Assembly ¡ ACGTAGAATCGACCATG GGGACGTAGAATACGAC ACGTAGAATACGTAGAAACAGATTAGAGAG… ConNgs ¡

  12. Sample ¡PreparaNon ¡ Fragments ¡ Sequencing ¡ Reads ¡ Assembly ¡ ConNgs ¡ Analysis ¡

  13. Sample ¡PreparaNon ¡ Our ¡focus ¡for ¡today’s ¡lecture: ¡ 1. Comparison ¡of ¡sequencing ¡ Fragments ¡ plaXorms ¡ 2. Details ¡of ¡sample ¡preparaNon ¡ Sequencing ¡ 3. DefiniNons ¡and ¡terminologies ¡ concerning ¡data ¡and ¡ sequencing ¡plaXorms ¡ Reads ¡ Assembly ¡ ConNgs ¡ Analysis ¡

  14. Landmarks ¡in ¡Sequencing ¡ Efficiency ¡ ¡ Year ¡ Event ¡ (bp/person/year) ¡ 1870 ¡ Miescher: ¡ ¡Discovers ¡DNA ¡ 1940 ¡ Avery: ¡ ¡Proposes ¡DNA ¡as ¡“GeneNc ¡Material” ¡ 1953 ¡ Watson ¡& ¡Crick: ¡ ¡Double ¡Helix ¡Structure ¡of ¡DNA ¡ 1 ¡ 1965 ¡ Holley: ¡ ¡Sequenced ¡transfer ¡RNA ¡from ¡Yeast ¡ 1,500 ¡ 1977 ¡ Maxam ¡& ¡Gilbert: ¡"DNA ¡sequencing ¡by ¡chemical ¡degradaNon” ¡ Sanger: ¡“DNA ¡sequencing ¡with ¡chain-­‑terminaNng ¡inhibitors” ¡ 1980 ¡ Messing: ¡DNA ¡cloning ¡ 15,000 ¡ 1981 ¡ Messing: ¡Messing ¡and ¡his ¡colleagues ¡developed ¡“shotgun ¡ sequencing” ¡method ¡ 25,000 ¡ 1986 ¡ Hood ¡et ¡al.: ¡ ¡ParNal ¡AutomaNon ¡ 1987 ¡ ABI ¡markets ¡the ¡first ¡sequencing ¡plaXorm, ¡ABI ¡370 ¡

  15. Landmarks ¡in ¡Sequencing ¡ Efficiency ¡ ¡ Year ¡ Event ¡ (bp/person/year) ¡ 50,000 ¡ 1990 ¡ NIH ¡begins ¡large-­‑scale ¡sequencing ¡trials ¡of ¡bacteria ¡genomes. ¡ 200,000 ¡ 1995 ¡ Craig ¡Venture ¡and ¡Hamilton ¡Smith ¡at ¡the ¡InsNtute ¡for ¡ Genomic ¡Research ¡(TIGR) ¡published ¡the ¡first ¡complete ¡ genome ¡of ¡a ¡free-­‑living ¡organism ¡in ¡Science. ¡ ¡This ¡marks ¡the ¡ first ¡use ¡of ¡whole-­‑genome ¡shotgun ¡sequencing, ¡eliminaNng ¡ the ¡need ¡for ¡iniNal ¡mapping ¡efforts. ¡ ¡ 2001 ¡ A ¡drai ¡of ¡the ¡human ¡genome ¡was ¡published ¡in ¡Science. ¡ 2001 ¡ A ¡drai ¡of ¡the ¡human ¡genome ¡was ¡published ¡in ¡Nature. ¡ 50,000,000 ¡ 2002 ¡ 454 ¡Life ¡Sciences ¡comes ¡out ¡with ¡a ¡pyrosequencing ¡machine. ¡ 100,000,000 ¡ 2008 ¡ Next ¡generaNon ¡sequencing ¡machines ¡arrive. ¡ Huge ¡ 2011 ¡ Oxford ¡Nanopore: ¡600 ¡Million ¡base ¡pairs ¡per ¡hour. ¡ ¡

  16. Robert ¡Holley ¡and ¡team ¡in ¡1965 ¡ Watson ¡and ¡Crick ¡ Messing: ¡World’s ¡most-­‑cited ¡ ¡ scienNst ¡ Francis ¡and ¡Collins: ¡Private ¡Human ¡Genome ¡project. ¡ ¡

  17. Next-­‑Gen ¡Sequencing ¡PlaXorms ¡ 454/Roche ¡GS-­‑20/FLX ¡ (2005) ¡ PacBio ¡RS ¡(2009-­‑2010) ¡ 3 rd ¡generaNon? ¡ Illumina ¡HISeq ¡ ¡ (2007) ¡

  18. Comparison ¡of ¡NGS ¡PlaXorms ¡ Technology ¡ Reads ¡per ¡run ¡ Average ¡Read ¡ bp ¡per ¡run ¡ Types ¡of ¡ Length ¡ errors ¡ 454 ¡(Roche) ¡ 400,000 ¡ 250-­‑1000bp ¡ 70 ¡Million ¡ SubsNtuNon ¡ SoLID ¡(ABI) ¡ 88-­‑132 ¡Million ¡ 35bp ¡ 1 ¡Billion ¡ Illumina ¡HISeq ¡ 150 ¡Million ¡ 100 ¡– ¡200bp ¡ 15 ¡Billion ¡ SubsNtuNon ¡ with ¡ exponenNal ¡ increase ¡ PacBio ¡ 45,000 ¡ 1000-­‑2000bp ¡ 45 ¡Million ¡ InserNons ¡and ¡ deleNons ¡ \ ¡

  19. Sequencing ¡Methods ¡and ¡ Terminology ¡

  20. Sanger ¡Sequencing ¡ • The ¡key ¡principle ¡of ¡the ¡Sanger ¡method ¡was ¡the ¡ dideoxynucleoNde ¡triphosphates ¡(ddNTPs) ¡as ¡ DNA ¡chain ¡terminators. ¡ ¡ • These ¡ddNTPs ¡will ¡also ¡be ¡radioacNvely ¡for ¡ detecNon ¡in ¡automated ¡sequencing ¡machines. ¡ • PosiNves: ¡longer ¡reads ¡(600 ¡to ¡1000 ¡bp). ¡ • NegaNves: ¡poor ¡coverage ¡(6x), ¡expensive, ¡ inaccurate. ¡ ¡ ¡ • SNll ¡commonly ¡used ¡for ¡small ¡scale ¡sequencing. ¡

  21. Sanger ¡Sequencing ¡Video ¡

  22. Sanger ¡Sequencing ¡ DNA target sample SHEAR

  23. Sanger ¡Sequencing ¡ DNA target sample SHEAR Close each fragment many times. T ¡ T ¡ A ¡ A ¡ T ¡ A ¡ A ¡ T ¡ C ¡ G ¡ C ¡ G ¡ C ¡ G ¡ C ¡ G ¡

  24. Sanger ¡Sequencing ¡ DNA target sample SHEAR T T ¡ T ¡ A ¡ A ¡ A T ¡ A ¡ A ¡ T ¡ C C ¡ G ¡ C ¡ G ¡ C ¡ G ¡ C ¡ G ¡ G 28 ¡

  25. Sanger ¡Sequencing ¡ Primer ¡ DNA ¡polymerase ¡ T ¡ A A ¡ C ¡ G ¡

  26. Sanger ¡Sequencing ¡ Primer ¡ DNA ¡polymerase ¡ T ¡ A A ¡ C ¡ G ¡ T ¡ A A ¡ Primer ¡ C ¡ G ¡ DNA ¡polymerase ¡

  27. Sanger ¡Sequencing ¡ A ¡ Primer ¡ G ¡ DNA ¡polymerase ¡ C ¡ C ¡ G ¡ A ¡ T ¡ A A ¡ C ¡ C ¡ G ¡ T ¡ A ¡ C ¡ T ¡ A ¡ C ¡ T ¡

  28. Sanger ¡Sequencing ¡ A ¡ Primer ¡ G ¡ DNA ¡polymerase ¡ C ¡ G ¡ C ¡ G ¡ A ¡ T ¡ A A ¡ C ¡ C ¡ G ¡ T ¡ A ¡ C ¡ T ¡ A ¡ C ¡ T ¡

  29. Sanger ¡Sequencing ¡ A ¡ Primer ¡ G ¡ C ¡ G ¡ C ¡ G ¡ G ¡ A ¡ T ¡ A A ¡ C ¡ C ¡ G ¡ T ¡ A ¡ C ¡ T ¡ A ¡ C ¡ T ¡

  30. Sanger ¡Sequencing ¡ A ¡ Primer ¡ G ¡ C ¡ G ¡ C ¡ G ¡ G ¡ C ¡ A ¡ T ¡ A A ¡ C ¡ C ¡ G ¡ T ¡ A ¡ C ¡ T ¡ A ¡ C ¡ T ¡

  31. Sanger ¡Sequencing ¡ A ¡ Primer ¡ G ¡ C ¡ G ¡ C ¡ G ¡ G ¡ C ¡ A ¡ T ¡ T ¡ A A ¡ C ¡ G ¡ C ¡ G ¡ T ¡ A ¡ A ¡ C ¡ T ¡ A ¡ C ¡ T ¡

  32. Sanger ¡Sequencing ¡ A ¡ Primer ¡ G ¡ C ¡ C ¡ G ¡ A ¡ C ¡ T ¡ A ¡ C ¡ T ¡ A ¡ C ¡ T ¡

  33. Sanger ¡Sequencing ¡ A ¡ Primer ¡ G ¡ C ¡ C ¡ G ¡ A ¡ C ¡ T ¡ A ¡ C ¡ ConNnue ¡unNl ¡all ¡strands ¡of ¡DNA ¡ ¡ T ¡ have ¡undergone ¡this ¡reacNon. ¡ ¡If ¡you ¡ choose ¡the ¡reagents ¡correctly ¡then ¡you ¡ ¡ A ¡ should ¡have ¡all ¡possible ¡A-­‑terminated ¡ ¡ C ¡ strands; ¡resulNng ¡in ¡sequences ¡of ¡varying ¡ T ¡ lengths. ¡

  34. Sanger ¡Sequencing ¡

  35. Sanger ¡Sequencing ¡ In ¡the ¡radioacNve ¡gel, ¡the ¡longer ¡DNA ¡fragments ¡ move ¡to ¡the ¡bopom ¡and ¡the ¡shorter ¡ones ¡move ¡to ¡ ¡ the ¡top. ¡ ¡ ¡ ¡ Aierward ¡the ¡sequence ¡can ¡be ¡read ¡off ¡by ¡going ¡ ¡ from ¡top ¡to ¡bopom. ¡

Recommend


More recommend