knowledge representa0on in ac0on comp34512
play

Knowledge Representa0on In Ac0on COMP34512 A look into - PowerPoint PPT Presentation

Knowledge Representa0on In Ac0on COMP34512 A look into the Na-onal Cancer Ins-tute Thesaurus (NCIt) Sebas-an Brandt (brandt@cs.manchester.ac.uk) (Slides


  1. Knowledge ¡Representa0on ¡In ¡Ac0on ¡ COMP34512 ¡ A ¡look ¡into ¡the ¡ ¡ Na-onal ¡Cancer ¡Ins-tute ¡Thesaurus ¡(NCIt) ¡ ¡ Sebas-an ¡Brandt ¡ (brandt@cs.manchester.ac.uk) ¡ (Slides ¡derived ¡from ¡those ¡of ¡Maria ¡Copeland) ¡

  2. Na-onal ¡Cancer ¡Ins-tute ¡ Bethesda, ¡USA ¡

  3. A ¡Case ¡Study ¡ The ¡NCI ¡Thesaurus ¡is ¡a ¡vocabulary ¡designed ¡to ¡meet ¡ the ¡needs ¡of ¡the ¡cancer ¡research ¡community ¡for ¡ consistent, ¡unambiguous ¡codes ¡and ¡defini-ons ¡for ¡ basic ¡and ¡clinical ¡concepts ¡used ¡in ¡cancer ¡research, ¡ and ¡the ¡seman-c ¡links ¡among ¡concepts ¡that ¡enable ¡ traversal ¡of ¡rela-onships. ¡

  4. In ¡A ¡Nutshell ¡ The ¡NCIt ¡is ¡a ¡controlled ¡vocabulary ¡ ¡ • About ¡cancer ¡research ¡ ü basic ¡and ¡clinical ¡concepts ¡ • Unambiguous ¡codes ¡(with ¡defini-ons) ¡ ü human ¡readable ¡ • Arranged ¡hierarchically ¡

  5. ¡ NCIt ¡ • At ¡delivery ¡ • Hierarchical ¡lists ¡of ¡terms ¡+ ¡defini-on ¡comments ¡ • (Akin ¡to ¡our ¡minimal ¡representa-on) ¡ • At ¡development ¡ • Formalized ¡defini-ons ¡ • Why ¡formalize? ¡

  6. Delivery ¡ The ¡NCI ¡Thesaurus ¡is ¡designed, ¡first ¡and ¡foremost, ¡ to ¡be ¡a ¡thesaurus ¡– ¡“a ¡controlled ¡vocabulary ¡ arranged ¡in ¡a ¡known ¡order ¡and ¡structured ¡so ¡that ¡ the ¡various ¡rela-onships ¡among ¡terms ¡are ¡ displayed ¡clearly ¡and ¡iden-fied ¡by ¡ ¡standardized ¡ rela-onship ¡indicators….Its ¡primary ¡role ¡is ¡that ¡of ¡a ¡ bridge ¡for ¡human ¡to ¡human ¡communica-on ¡across ¡ special-es ¡and ¡data ¡resources ¡”* ¡ * ¡hTp://bit.ly/zSxHpK ¡

  7. Delivery ¡ • Data ¡entry ¡ • Tags ¡on ¡images ¡ • Keywords ¡on ¡papers ¡ • Data ¡retrieval ¡ • Query ¡expansion ¡ • Faceted/hierarchical ¡naviga-on ¡

  8. Development ¡Challenges ¡ • Cancer ¡(research) ¡domain ¡ • Complex ¡and ¡diverse ¡ • Different ¡users ¡and ¡user ¡communi-es ¡ • Terms ¡and ¡term ¡sets ¡overlap ¡ • But ¡with ¡different ¡nuances ¡ • Shared ¡or ¡similar ¡concepts ¡with ¡shared, ¡similar, ¡ or ¡quite ¡different ¡terms ¡ • Domain ¡and ¡terminologies ¡always ¡changing ¡

  9. NCIt: ¡Evolu-on ¡ 10 ¡

  10. NCIt: ¡Scope ¡ Contains ¡21 ¡hierarchical ¡trees ¡ ¡ ¡ • Neoplasms ¡ • Anatomy ¡ • Genes ¡ • Proteins ¡ • Drugs ¡ • Treatments ¡ • … ¡ ¡ ¡ 11 ¡

  11. User View

  12. Knowledge Engineer View

  13. ¡ ¡ ¡ How ¡do ¡you ¡get ¡there? ¡ 14 ¡

  14. Data ¡Sources ¡ E mail ¡Requests ¡ B ulk ¡ D ata ¡ I mports ¡ D ata ¡A rchives ¡ R esearch ¡ I ns-tutes ¡ U se ¡ C ases ¡ EVS ¡P artners ¡ U niversi-es ¡ L egacy ¡ D ata ¡

  15. The ¡Cost ¡of ¡Gedng ¡it ¡“Right” ¡ Ontology ¡development ¡is ¡costly ¡ ¡ “Ini-ally ¡we ¡included ¡in ¡the ¡Thesaurus ¡concepts ¡that ¡we ¡ simply ¡believed ¡to ¡be ¡important ¡to ¡NCI” ¡ ¡ ¡ “However, ¡given ¡the ¡costs ¡of ¡ontology ¡development ¡one ¡ cannot ¡go ¡on ¡doing ¡that ¡very ¡long. ¡Since ¡no ¡ontology ¡is ¡ ever ¡complete ¡[27], ¡a ¡yards-ck ¡is ¡needed ¡…“ ¡ ¡ ¡ “We ¡now ¡require ¡that ¡all ¡T-­‑ ¡Box ¡elements ¡be ¡required ¡ either ¡explicitly ¡or ¡by ¡implica-on ¡by ¡the ¡needs ¡of ¡at ¡least ¡ one ¡user ¡community” ¡

  16. NCIt ¡Process ¡for ¡Use ¡Cases ¡ Domain ¡Expert ¡examines ¡use ¡ User ¡submits ¡a ¡Use ¡Case ¡ The ¡collabora-ve ¡process ¡begins: ¡ case ¡to ¡check: ¡ ¡ ¡-­‑ ¡exis-ng ¡coverage ¡ • ¡use ¡the ¡pseudo ¡T-­‑Box ¡ ¡-­‑ ¡expansion ¡of ¡ • ¡use ¡graphical ¡ knowledge ¡ ¡ representa-ons ¡ • ¡use ¡spreadsheets ¡to ¡map ¡ to ¡ontology ¡ ¡ ¡ proto-­‑representa-on ¡ 17 ¡

  17. NCIt ¡Process: ¡In ¡Detail ¡ 18 ¡

  18. Pseudo-­‑TBox ¡Approach ¡ • It ¡is ¡a ¡simplifica-on ¡ – Discussion ¡not ¡on ¡30,000+ ¡terms, ¡ – But ¡on ¡kinds ¡and ¡roles ¡ • Shows ¡coverage ¡ – Hierarchy ¡view: ¡ • They ¡can ¡explore ¡ • Recognize ¡concepts ¡ • Spot ¡gaps ¡ • Posi-oning ¡is ¡hard! ¡ – Seeing ¡structure ¡elicits ¡structure ¡comments ¡

  19. Posi-on ¡Challenge ¡ ¡ Problem! ¡ ¡ ¡ “Not ¡infrequently ¡in ¡biomedicine, ¡there ¡is ¡no ¡ canonical ¡determina-on ¡of ¡a ¡concept's ¡correct ¡ tree ¡posi-on…” ¡ ¡

  20. Posi-on ¡Challenge ¡ Example ¡ ¡ “Meningococcal ¡meningi-s ¡may ¡be ¡classified ¡correctly ¡as ¡ both ¡a ¡disease ¡of ¡the ¡central ¡nervous ¡systems ¡and ¡a ¡ bacterial ¡disease” ¡ ¡ ¡ “There ¡are ¡always ¡things ¡the ¡experts ¡will ¡ques-on.” ¡

  21. Posi-on ¡Challenge ¡ Conflict ¡Resolu-on ¡Tools ¡ ¡ “These ¡discussions ¡of ¡why ¡the ¡hierarchies ¡are ¡ structured ¡as ¡they ¡are ¡offer ¡the ¡opportunity ¡to ¡ introduce ¡the ¡no-ons ¡of ¡roles” ¡ ¡ ”The ¡hierarchy ¡posi-ons ¡of ¡defined ¡concepts ¡are ¡the ¡ result ¡of ¡the ¡concept's ¡role ¡restric-on” ¡

  22. Domain ¡Experts ¡and ¡Users ¡ Major ¡focus ¡is ¡the ¡terminology ¡and ¡defini-ons ¡ • ¡ The ¡hierarchical ¡rela-ons ¡discussions ¡are ¡to ¡support ¡ • defini-ons ¡clarity ¡and ¡not ¡to ¡posi-on ¡the ¡term ¡ ¡ Each ¡term ¡in ¡the ¡pseudo-­‑hierarchy ¡is ¡commented ¡ • with: ¡ Textual ¡descrip-ons ¡of ¡the ¡term ¡ • Full ¡list ¡of ¡synonyms ¡ • Addi-onal ¡clarifica-ons ¡on ¡recommended ¡usage ¡of ¡the ¡term ¡ • 23 ¡

  23. Defini-ons, ¡Not ¡Posi-on ¡ • Defini-ons ¡encode ¡many ¡posi-ons ¡ – meningococcal ¡meningi-s ¡SubClassOf: ¡disease ¡ that ¡locatedIn ¡central ¡nervous ¡systems ¡and ¡ causedBy ¡bacteria ¡ • Including ¡future ¡posi-ons ¡ – We ¡can ¡start ¡with ¡“Disease” ¡and ¡then ¡ • introduce ¡“BacterialDisease” ¡and ¡ ¡ • “CNSDisease” ¡or ¡even ¡ • “BacterialCNSDisease” ¡

  24. ¡ ¡ ¡ ¡ Goal ¡is ¡to ¡reach ¡an ¡agreement ¡on ¡the ¡defini-on ¡ ¡ 25 ¡

  25. NCIt: ¡Proto-­‑representa-on ¡Schema ¡ 26 ¡

  26. Domain ¡Experts ¡and ¡Ontology ¡Designers ¡ ¡ ¡ The ¡proto-­‑representa-on ¡is ¡formalized ¡ ¡ Mapping ¡the ¡proto-­‑representa-on ¡to ¡the ¡NCIt ¡hierarchy ¡ • ¡ ¡ 27 ¡

  27. Domain ¡Experts ¡and ¡Ontology ¡Designers ¡ ¡ ¡ Ontology ¡Designers ¡rely ¡heavily ¡on ¡the ¡defini-ons ¡and ¡comments ¡provided ¡ by ¡the ¡users ¡to ¡create ¡the ¡OWL ¡representa-ons ¡of ¡the ¡defini-ons ¡ ¡ 28 ¡

  28. Domain ¡Experts ¡and ¡Ontology ¡Designers ¡ ¡ ¡ Ontology ¡Designers ¡and ¡Domain ¡Experts ¡decide: ¡ ¡ Desirable ¡posi-ons ¡of ¡the ¡term ¡(class) ¡in ¡the ¡hierarchies ¡ • Is_a ¡ • Part_of ¡ • Located_in ¡ • • These ¡now ¡are ¡tests ¡ Of ¡the ¡representa-onal ¡adequacy ¡of ¡the ¡defini-on ¡ • ¡ 29 ¡

  29. DL ¡Formalism ¡and ¡Reasoner ¡ ¡ The ¡reasoner ¡provides ¡automa-c ¡inference: ¡ ¡ Make ¡implicit ¡links ¡explicit ¡ • Help ¡resolve ¡representa-on ¡conflicts ¡ • Subsump-on ¡checking ¡ • ¡ ¡ 30 ¡

  30. ¡ ¡ ¡ ¡ How ¡was ¡Meningi-s ¡represented? ¡ 31 ¡

  31. 32 ¡

  32. 33 ¡

  33. 34 ¡

Recommend


More recommend