Using ¡GVF ¡for ¡Clinical ¡Annota3on ¡of ¡ Personal ¡Genomes ¡ . ¡ ¡ Barry ¡Moore, ¡Shawn ¡Rynearson, ¡ Fiona ¡Cunningham, ¡Graham ¡Ritchie, ¡ Karen ¡Eilbeck ¡ Ensembl ¡and ¡University ¡of ¡Utah ¡ ¡
Challenges ¡of ¡translaConal ¡genomics ¡ • The ¡size, ¡scope ¡and ¡complexity ¡of ¡genomic ¡ data ¡provides ¡many ¡challenges ¡to ¡efficient ¡use ¡ in ¡medicine. ¡ • How ¡do ¡we ¡describe ¡a ¡personal ¡genome? ¡ • What ¡is ¡needed ¡for ¡inclusion ¡of ¡genomic ¡data ¡ into ¡the ¡EHR. ¡ • What ¡level ¡of ¡complexity ¡is ¡needed ¡for ¡each ¡ kind ¡of ¡user? ¡
Today’s ¡talk ¡ • MoCvaCon: ¡The ¡genomic ¡variant ¡informaCon ¡ boNle ¡neck ¡ • Sequence ¡AnnotaCon ¡– ¡the ¡Sequence ¡ Ontology ¡ • EHR ¡standards ¡ • GVFClin ¡is ¡a ¡variant ¡file ¡with ¡standards ¡
Technical ¡desiderata ¡for ¡the ¡integra3on ¡of ¡genomic ¡data ¡into ¡the ¡ medical ¡record ¡(Masys ¡et ¡al ¡2011) ¡ 1 ¡ Maintain ¡separaCon ¡of ¡primary ¡molecular ¡observaCons ¡from ¡the ¡ clinical ¡interpretaCons ¡of ¡those ¡data ¡ 2 ¡ Support ¡lossless ¡compression ¡from ¡primary ¡molecular ¡observaCons ¡ to ¡clinically ¡manageable ¡subsets ¡ 3 ¡ Maintain ¡linkage ¡of ¡molecular ¡observaCons ¡to ¡the ¡laboratory ¡ methods ¡used ¡to ¡generate ¡them ¡ 4 ¡ Support ¡compact ¡representaCon ¡of ¡clinically ¡acConable ¡subsets ¡for ¡ opCmal ¡performance ¡ 5 ¡ Simultaneously ¡support ¡human ¡viewable ¡formats ¡and ¡machine ¡ readable ¡formats ¡in ¡order ¡to ¡facilitate ¡implementaCon ¡of ¡decision ¡ support ¡rules ¡ 6 ¡ AnCcipate ¡fundamental ¡changes ¡in ¡the ¡understanding ¡of ¡human ¡ molecular ¡variaCon ¡ 7 ¡ Support ¡both ¡individual ¡clinical ¡ ¡care ¡and ¡discovery ¡science ¡
Kinds ¡of ¡genomic ¡test ¡ • Known ¡disease ¡variants ¡ – Single ¡gene ¡sequenced ¡ – Panel ¡of ¡genes ¡sequenced ¡ • Unknown ¡variant ¡sought ¡ – Exome ¡sequenced ¡ – Genome ¡sequence ¡ – Trio ¡family ¡genome/exome ¡sequenced ¡
NG ¡sequencing ¡bioinformaCcs ¡ • Base ¡calling ¡– ¡done ¡by ¡sequencing ¡machine ¡trace ¡ files ¡and ¡fastq ¡files ¡ • Read ¡mapping ¡(mappers ¡and ¡aligners) ¡BWA, ¡Bfast ¡ and ¡BowCe ¡produce ¡SAM/BAM ¡files ¡ • Alignment ¡polishing ¡– ¡remove ¡duplicate ¡reads ¡ and ¡re-‑align ¡around ¡indels ¡ • SNP ¡calling ¡uses ¡BAM ¡files, ¡produces ¡variant ¡files ¡ • Structural ¡variant ¡detecCon ¡– ¡large ¡deleCons ¡etc ¡ • Variant ¡prioriCzaCon ¡– ¡which ¡of ¡these ¡3 ¡million ¡ variants ¡caused ¡the ¡disorder? ¡
HL7 Clinician Orders NGS Exome or Genome Message NGS Exome/Genome Genomics ¡ FASTQ Sequencing Reads Aligned to Reference BAM/SAM Assembly Variant Calling Pipeline VCF/GVF InformaCon ¡ GVFclin boNleneck ¡ Annotate, ¡prioriCze, ¡analyze ¡ Medicine ¡ HL7 Diagnostic Report Message Clinician Counsels and Treats EHR Patient
Current ¡state ¡of ¡the ¡art ¡ • Paper/PDF ¡geneCc ¡reports ¡ • The ¡tesCng ¡laboratory ¡faxes ¡or ¡emails ¡a ¡text ¡ write ¡up ¡of ¡the ¡result ¡and ¡interpretaCon ¡to ¡ the ¡clinic. ¡ • The ¡genomic ¡data ¡does ¡not ¡oden ¡enter ¡the ¡ EHR. ¡ • The ¡HL7 ¡working ¡group ¡is ¡creaCng ¡a ¡drad ¡ geneCc ¡test ¡report. ¡
Inside ¡the ¡EHR ¡ CDS system monitors genomic information: provides alerts Variants in EHR Interpretation Diagnostic Clinician Report Counsels and Treats Patient Patient data archive Discovery Science The ¡variants ¡need ¡to ¡be ¡computaConally ¡amenable ¡to ¡both ¡scienCfic ¡ discovery ¡such ¡as ¡cohort ¡collecCon, ¡and ¡to ¡Clinical ¡Decision ¡Support ¡ Systems ¡
Sequence ¡Ontology ¡provides ¡a ¡ community ¡developed ¡and ¡approved ¡ vocabulary ¡for ¡annotaCon ¡ • GVF ¡heavily ¡relies ¡on ¡the ¡terminology ¡ provided ¡by ¡SO ¡ • www.sequenceontology.org ¡ • SO ¡is ¡used ¡for ¡reference ¡sequence ¡annotaCon ¡ ¡
Sequence ¡Ontology ¡ • Funded ¡by ¡the ¡NHGRI ¡since ¡2003 ¡ • Grew ¡out ¡of ¡the ¡Gene ¡Ontology ¡project ¡ • Describes ¡genomic ¡features ¡such ¡as ¡the ¡parts ¡ of ¡gene ¡models, ¡transposons, ¡assembly ¡ components, ¡ ¡experimental ¡results ¡relaCng ¡to ¡ genome ¡sequence ¡such ¡as ¡alignments ¡ • Describes ¡the ¡kinds ¡of ¡variants, ¡the ¡effect ¡of ¡ variants, ¡and ¡the ¡locaCon ¡of ¡variants ¡within ¡ exisCng ¡features. ¡
3 ¡aspects ¡for ¡variant ¡annotaCon ¡ • The ¡sequence ¡alteraCon ¡ • The ¡affected ¡feature ¡ ¡ • The ¡consequence ¡of ¡the ¡alteraCon ¡on ¡the ¡ feature ¡
Kinds ¡of ¡alteraCon ¡
sequence_variant ¡ structural_variant ¡ funcConal_variant ¡ feature_variant ¡ feature_ablaCon ¡ feature_amplificaCon ¡ feature_translocaCon ¡ feature_fusion ¡ transcript_ablaCon ¡ transcript_amplificaCon ¡ transcript_translocaCon ¡ transcript_fusion ¡ gene_variant ¡ feature_elongaCon ¡ feature_truncaCon ¡ regulatory_region_ablaCon ¡ regulatory_region_amplificaCon ¡ regulatory_region_translocaCon ¡ regulatory_region_variant ¡ regulatory_region_fusion ¡ terminal_elongaCon ¡ internal_elongaCon ¡ TFBS_ablaCon ¡ TFBS_translocaCon ¡ TFBS_amplificaCon ¡ TFBS_fusion ¡
feature_variant ¡ upstream_gene_variant ¡ downstream_gene_variant ¡ 5KB_upstream_variant ¡ regulatory_region_variant ¡ gene_variant ¡ 5KB_downstream_variant ¡ splicing_variant ¡ 500B_downstream_variant ¡ 2KB_upstream_variant ¡ TFBS_variant ¡ splice_region_variant ¡ transcript_variant ¡ complex_change_in_transcript ¡ exon_variant ¡ non_coding_exon_variant ¡ coding_sequence_variant ¡ NMD_transcript_variant ¡ intron_variant ¡ protein_altering_variant ¡ nc_transcript_variant ¡ splice_site_variant ¡ terminator_codon_variant ¡ frameshiG_variant ¡ mature_miRNA_variant ¡ synonymous_variant ¡ inframe_variant ¡ splice_donor_variant ¡ frameshid_ ¡ frameshid_ ¡ splice_acceptor_variant ¡ elongaCon ¡ UTR_variant ¡ truncaCon ¡ incomplete_terminal_codon_variant ¡ 3_prime_UTR_variant ¡ stop_retained_variant ¡ inframe_indel ¡ ini3ator_codon_variant ¡ 5_prime_UTR_variant ¡ stop_lost ¡ stop_gained ¡ missense_variant ¡ inframe_inser3on ¡ inframe_dele3on ¡
ExisCng ¡standards ¡in ¡the ¡EHR ¡ • Especially ¡important ¡now ¡because ¡of ¡the ¡ HITEC ¡act. ¡Providers ¡must ¡reach ¡a ¡set ¡of ¡goals ¡ to ¡get ¡subsidy. ¡ • One ¡of ¡the ¡goals ¡is ¡to ¡use ¡standards ¡such ¡as: ¡ – LOINC ¡-‑ ¡to ¡idenCfy ¡tests ¡ – SNOMED-‑CT ¡-‑ ¡name ¡diseases ¡etc. ¡ – RxNorm ¡-‑ ¡name ¡drugs ¡ • Goes ¡by ¡the ¡name ¡of ¡‘meaningful ¡use’ ¡
TranslaCon ¡to ¡health ¡record ¡ • Integrate ¡research ¡type ¡data ¡with ¡established ¡ EHR ¡ ¡ • Not ¡so ¡easy ¡as ¡EHR ¡uses ¡established ¡non ¡ genomic ¡standards ¡and ¡research ¡is ¡a ¡moving ¡ target. ¡ • Following ¡HL7 ¡clinical ¡genomics ¡ recommendaCons ¡for ¡incorporaCng ¡genomic ¡ data ¡into ¡EHR. ¡
GVFClin ¡is ¡an ¡annotated ¡variant ¡file ¡ • Variant ¡files ¡condense ¡the ¡whole ¡genome ¡into ¡list ¡ of ¡annotated ¡variants ¡(3 ¡billion ¡bases ¡to ¡3 ¡million ¡ changes) ¡ • VCF ¡ hNp://www.1000genomes.org/wiki/Analysis/ Variant%20Call%20Format/vcf-‑variant-‑call-‑ format-‑version-‑41 ¡ • GVF ¡ hNp://www.sequenceontology.org/resources/ gvf.html ¡ ¡
Recommend
More recommend