CS ¡680: ¡Assembly ¡and ¡Analysis ¡of ¡ Sequencing ¡Data ¡ Fall ¡2012 ¡ August ¡21st, ¡2012 ¡
Logis@cs ¡of ¡the ¡Course ¡
Logis@cs ¡About ¡the ¡Course ¡ • Instructor: ¡Chris@na ¡Boucher ¡ • email: ¡cboucher@cs.colostate.edu ¡ • Office: ¡CSB ¡464 ¡ • Office ¡hours: ¡11 ¡ ¡ • course ¡website: ¡www.cs.colostate.edu/~cs680 ¡ • Weekly ¡readings ¡ • Schedule ¡of ¡paper ¡presenta@ons ¡ • 4 ¡credits ¡(3 ¡lecture, ¡1 ¡lab): ¡lab ¡is ¡the ¡course ¡ project. ¡ ¡ ¡
Goals ¡of ¡the ¡Course ¡ • Working ¡at ¡the ¡interface ¡of ¡computer ¡science ¡ and ¡biology: ¡ – New ¡mo@va@on ¡ – New ¡data ¡and ¡new ¡demands ¡ – Real ¡impact ¡ • Introduc@on ¡to ¡main ¡issues ¡in ¡computa@onal ¡ biology. ¡ • Opportunity ¡to ¡interact ¡with ¡algorithms, ¡tools, ¡ data ¡in ¡current ¡prac@ce. ¡
Course ¡Outline ¡ • Mo@va@on ¡and ¡Introduc@on ¡to ¡biology ¡(week ¡1). ¡ • Challenges ¡in ¡genome ¡assembly ¡(week ¡2 ¡and ¡3): ¡ – Importance ¡and ¡purpose ¡of ¡whole ¡genome ¡sequencing. ¡ – First ¡genera@on ¡sequencing ¡data ¡and ¡computa@onal ¡ approaches ¡to ¡assembly. ¡ – Next ¡genera@on ¡sequencing ¡methods ¡and ¡the ¡de ¡Bruijn ¡ graph ¡approach. ¡ – Specialized ¡sequencing ¡problems: ¡single-‑cell ¡sequencing, ¡ resequencing. ¡
Course ¡Outline ¡ • SNPs ¡and ¡other ¡structural ¡varia@ons ¡(week ¡4): ¡ – Why ¡are ¡structural ¡varia@ons ¡important ¡to ¡detect? ¡ – Calling ¡SNPs ¡with ¡Samtools. ¡ – Detec@on ¡of ¡larger ¡structural ¡varia@ons: ¡current ¡method. ¡ • Short ¡sequence ¡analysis ¡of ¡RNA ¡(week ¡5) ¡ – What ¡is ¡the ¡difference ¡between ¡RNA ¡and ¡DNA? ¡ – RNA-‑seq ¡data ¡analysis: ¡tools ¡and ¡algorithms. ¡ • Paper ¡presenta@ons ¡and ¡project ¡presenta@ons. ¡ ¡
Grading ¡ • Course ¡project: ¡50% ¡ • Presenta@on(s): ¡20% ¡ • Class ¡par@cipa@on: ¡10% ¡ • Paper ¡reviews: ¡20% ¡ ¡ The ¡grading ¡breakdown ¡is ¡found ¡on ¡the ¡website. ¡
Paper ¡Presenta@ons ¡ • Each ¡student ¡or ¡course ¡par@cipant ¡will ¡give ¡ one ¡or ¡two ¡paper ¡presenta@ons. ¡ ¡ ¡ • A ¡list ¡of ¡the ¡papers ¡will ¡be ¡given ¡out ¡in ¡the ¡ next ¡lecture ¡and ¡you ¡can ¡sign ¡up ¡or ¡suggest ¡a ¡ related ¡paper ¡that ¡you ¡would ¡like ¡to ¡present. ¡ ¡ All ¡presented ¡papers ¡have ¡to ¡be ¡approved. ¡ • 50 ¡minute ¡presenta@on ¡+ ¡20 ¡minute ¡ discussion. ¡ ¡
Paper ¡Reviews ¡ Address ¡the ¡following ¡ques@ons: ¡ 1. What ¡is ¡the ¡paper ¡about? ¡ 2. What ¡are ¡the ¡weaknesses ¡of ¡the ¡paper? ¡ 3. What ¡is ¡an ¡extension ¡or ¡follow-‑up ¡study ¡ that ¡could ¡be ¡done? ¡ • Paper ¡reviews ¡have ¡to ¡be ¡emailed ¡to ¡me ¡or ¡ turned ¡in ¡on ¡paper ¡at ¡the ¡beginning ¡of ¡each ¡ class. ¡ • One ¡to ¡two ¡pages ¡in ¡length. ¡
Class ¡Par@cipa@on ¡ • The ¡first ¡5 ¡weeks ¡are ¡lectures ¡and ¡you ¡ will ¡not ¡be ¡graded ¡on ¡class ¡par@cipa@on . ¡ • Each ¡student ¡and ¡par@cipant ¡is ¡expected ¡to ¡ read ¡the ¡paper ¡prior ¡to ¡class ¡and ¡par@cipate ¡in ¡ the ¡paper ¡discussion. ¡ • Reflec@ng ¡upon ¡the ¡paper ¡reviews ¡should ¡ make ¡the ¡class ¡par@cipa@on ¡easy. ¡ ¡
Class ¡Project ¡ • This ¡is ¡the ¡most ¡important ¡aspect ¡about ¡the ¡ course ¡and ¡therefore ¡should ¡involve ¡either ¡ ¡ – Non-‑trivial ¡use ¡of ¡bioinforma@c ¡tools. ¡ – Sofware ¡development ¡and ¡applica@on. ¡ • The ¡best ¡projects ¡can ¡be ¡submiged ¡to ¡a ¡ journal ¡of ¡conference. ¡ • Project ¡will ¡be ¡done ¡in ¡pairs ¡or ¡individually. ¡ ¡I ¡ recommend ¡pairing ¡off ¡with ¡someone ¡that ¡has ¡ a ¡different ¡background ¡than ¡you ¡do. ¡ ¡ ¡
Class ¡Project ¡Schedule ¡ • August ¡30: ¡sample ¡projects ¡will ¡be ¡given ¡out ¡ • September ¡6: ¡Submit ¡your ¡pairings. ¡ • September ¡25: ¡Submit ¡a ¡wrigen ¡project ¡ proposal ¡(3 ¡to ¡4 ¡pages). ¡ • September ¡27: ¡project ¡proposal ¡presenta@ons ¡ (audience ¡should ¡give ¡feedback). ¡ • December ¡6: ¡final ¡wrigen ¡projects ¡due. ¡ • December ¡4&6: ¡project ¡presenta@ons. ¡
Biology ¡Basics ¡
Introduc@on ¡to ¡Biology ¡
Two types of cells: Prokaryotes v.s. Eukaryotes
Prokaryotes ¡and ¡Eukaryotes, ¡con@nued ¡ • Prokaryotes ¡ ¡ – No ¡nucleus ¡(bacteria ¡or ¡archaea) ¡ – Their ¡genomes ¡are ¡circular ¡ – Prokaryotes ¡do ¡not ¡have ¡a ¡nucleus, ¡mitochondria, ¡or ¡ any ¡other ¡membrane-‑bound ¡organelles ¡ – The ¡genome ¡in ¡a ¡prokaryote ¡is ¡held ¡within ¡a ¡DNA/ protein ¡complex ¡in ¡the ¡cytosol ¡called ¡the ¡nucleoid. ¡ • Eukaryotes ¡ ¡ – have ¡nucleus ¡(animal, ¡plants, ¡fungi) ¡ – Linear ¡genomes ¡with ¡mul@ple ¡chromosomes ¡in ¡pairs ¡
Chromosome ¡for ¡E.Coli ¡ ¡ (Prokaryote) ¡ Chromosomes ¡for ¡Human ¡ ¡ (Eukaryote) ¡
Eukaryote ¡(Animal) ¡Cell ¡
Prokaryotes ¡and ¡Eukaryotes, ¡con@nued ¡ Prokaryotes Eukaryotes Single cell Single or multi cell No nucleus Nucleus No organelles Organelles One piece of circular DNA Chromosomes No mRNA post Exons/Introns splicing transcriptional modification
Gene@c ¡Material ¡for ¡Life ¡
DNA: ¡The ¡Code ¡of ¡Life ¡ • The ¡structure ¡and ¡the ¡four ¡genomic ¡legers ¡code ¡for ¡ all ¡living ¡organisms ¡ ¡ • Adenine, ¡Guanine, ¡Thymine, ¡and ¡Cytosine ¡which ¡pair ¡ A-‑T ¡and ¡C-‑G ¡on ¡complimentary ¡strands. ¡
DNA, ¡con@nued ¡ • DNA ¡has ¡a ¡double ¡helix ¡ structure ¡which ¡ composed ¡of ¡ ¡ ¡ – sugar ¡molecule ¡ – phosphate ¡group ¡ – and ¡a ¡base ¡(A,C,G,T) ¡ ¡ • DNA ¡always ¡reads ¡from ¡ 5 ’ ¡end ¡to ¡3 ’ ¡end ¡for ¡ transcrip@on ¡replica@on ¡ ¡ 5 ’ ¡ATTTAGGCC ¡3 ’ ¡ 3 ’ ¡TAAATCCGG ¡5 ’ ¡
DNA ¡Replica@on ¡ • DNA ¡can ¡replicate ¡by ¡ splikng, ¡and ¡rebuilding ¡ each ¡strand. ¡ • Note ¡that ¡the ¡rebuilding ¡ of ¡each ¡strand ¡uses ¡ slightly ¡different ¡ mechanisms ¡due ¡to ¡the ¡ 5 ’ ¡3 ’ ¡asymmetry, ¡but ¡ each ¡daughter ¡strand ¡is ¡ an ¡exact ¡replica ¡of ¡the ¡ original ¡strand. ¡ ¡ http://users.rcn.com/jkimball.ma.ultranet/BiologyPages/D/DNAReplication.html
Genotype/Phenotype ¡ • To ¡prevent ¡confusion ¡between ¡ genes ¡ (which ¡ are ¡inherited) ¡and ¡ developmental ¡outcomes ¡ (which ¡are ¡not), ¡gene@cists ¡make ¡a ¡dis@nc@on ¡ between ¡the ¡ genotype ¡and ¡the ¡ phenotype ¡of ¡ an ¡organism ¡ – Genotype : ¡complete ¡set ¡of ¡genes ¡inherited ¡by ¡an ¡ individual ¡ ¡ – Phenotype : ¡all ¡aspects ¡of ¡the ¡individual’s ¡ physiology, ¡behavior, ¡and ¡ecological ¡rela@onships ¡
DNA ¡the ¡Gene@cs ¡Makeup ¡ • Genes ¡are ¡inherited ¡and ¡are ¡ expressed ¡ – genotype ¡(gene@c ¡makeup) ¡ – phenotype ¡(physical ¡ expression) ¡ • On ¡the ¡lef, ¡is ¡the ¡eye ’ s ¡ phenotypes ¡of ¡green ¡and ¡black ¡ eye ¡genes. ¡
• Two ¡organisms ¡whose ¡genes ¡differ ¡at ¡one ¡ locus ¡are ¡said ¡to ¡have ¡different ¡genotypes. ¡ • A ¡locus ¡(loci ¡for ¡plural) ¡is ¡the ¡specific ¡loca@on ¡ of ¡a ¡gene ¡of ¡a ¡DNA ¡sequence ¡on ¡a ¡ chromosome. ¡ • A ¡variant ¡of ¡the ¡DNA ¡sequence ¡at ¡a ¡given ¡ loca@on ¡is ¡called ¡a ¡ allele . ¡ • The ¡ordered ¡list ¡of ¡loci ¡known ¡for ¡a ¡par@cular ¡ genome ¡is ¡called ¡a ¡ gene4c ¡map . ¡ ¡
Recommend
More recommend