linked data and language

Linked Data and Language Technologies: The LIDER project - PowerPoint PPT Presentation

Linked Data and Language Technologies: The LIDER project A. Gmez-Prez (UPM) CSA Budget: 1.482.000 Starting date: 1. Nov. 2013 Duration: 2 Years

  1. Linked ¡Data ¡and ¡Language ¡ Technologies: ¡The ¡LIDER ¡project ¡ ¡ ¡ A. Gómez-­‑Pérez ¡(UPM) ¡ ¡ CSA ¡ Budget: 1.482.000 € ¡ Starting date: 1. Nov. 2013 ¡ Duration: 2 Years Project ¡Coordinator ¡ 163 PM ¡ ¡ ¡ 2014.05.08 ¡ Presenter ¡name ¡ 1 ¡

  2. The ¡LIDER ¡consorIum ¡ Universidad Politécnica de Madrid (UPM, Spain) [ COORDINATOR ] Trinity College Dublin (Ireland) DFKI (Germany) National University of Ireland, Galway (Ireland) Institut für Angewandte Informatik EV (INFAI, Germany) University of Bielefeld (Germany) Universita degli Studi di Roma La Sapienza (Italy) GEIE ERCIM (France) 2014.05.08 ¡ Asun ¡Gómez-­‑Pérez ¡ 2 ¡ 2

  3. Mo#va#on: ¡ ¡ Linked ¡Data ¡ for ¡ Language ¡Technologies ¡ 2014.05.08 ¡ Presenter ¡name ¡ 3 ¡

  4. An ¡example ¡ hKp:// ¡ hKp:// ¡ “Red” ¡(compu ter ¡network) ¡ hKp:// index.php/Terminesp:red ¡ hKp:// sinonimos/ ¡ hKp:// ¡ 2014.05.08 ¡ Asun ¡Gómez-­‑Pérez ¡ 4 ¡

  5. Complex ¡queries ¡using ¡data ¡from ¡heterogeneous ¡sources ¡ hKp:// ¡ 2014.05.08 ¡ Asun ¡Gómez-­‑Pérez ¡ 5 ¡ 5

  6. hKp:// ¡ hKp:// ¡ 2014.05.08 ¡ Asun ¡Gómez-­‑Pérez ¡ 6 ¡ *Picture ¡a@ribu#on: ¡h@p:// ¡ 6

  7. hKp:// ¡ hKp:// ¡ hKp:// index.php/Terminesp:red ¡ 2014.05.08 ¡ Asun ¡Gómez-­‑Pérez ¡ 7 ¡ *Picture ¡a@ribu#on: ¡h@p:// ¡ 7

  8. hKp:// ¡ hKp:// ¡ hKp:// index.php/Terminesp:red ¡ hKp:// sinonimos/ ¡ 2014.05.08 ¡ Asun ¡Gómez-­‑Pérez ¡ 8 ¡ *Picture ¡a@ribu#on: ¡h@p:// ¡ 8

  9. hKp:// ¡ hKp:// ¡ hKp:// index.php/Terminesp:red ¡ hKp:// sinonimos/ ¡ hKp:// ¡ 2014.05.08 ¡ Asun ¡Gómez-­‑Pérez ¡ 9 ¡ *Picture ¡a@ribu#on: ¡h@p:// ¡ 9

  10. “Red” Pronunciation: [red] Grammar category: sustantivo femenino Singular: “red” Plural: “redes” “Red” Etimologiy Del latin “rete” Gender: “f” Complementary Definition.: “Conjunto de “Red” but not connected ordenadores o de equipos informáticos conectados entre Norm: UNE 21302-131 sí … .” English: network German: Netzwerk “Red” “Red_de_computadores” Sinonyms: “sistema”, “malla”,” distribución” Category: redes informáticas Image 2014.05.08 ¡ Asun ¡Gómez-­‑Pérez ¡ 10 ¡ *Picture ¡a@ribu#on: ¡h@p:// ¡

  11. Heterogeneity ¡of ¡LinguisIc ¡Resources ¡ • Ecosystem ¡of ¡ ¡ – Open ¡and ¡Closed ¡ – Language ¡Resources ¡ resources ¡ available ¡on ¡the ¡web ¡ ¡ • Meta-­‑share, ¡ELDA, ¡ELRA, ¡ – ¡Complementary ¡ Clarin, ¡FLaReNet, ¡ resources ¡ MulIJedi, ¡ • Lexicon ¡ – ProperIes ¡ • Corpora ¡ • Mature ¡ • DicIonaries ¡ • Curated ¡ ¡ • …. ¡ • Clear ¡Liability ¡ ¡ – Heterogeneous ¡formats ¡ ¡ • E.g, ¡for ¡Lexicons: ¡Lexinfo, ¡ LMF, ¡LIR, ¡Lemon, ¡… ¡ 2014.05.08 ¡ Asun ¡Gómez-­‑Pérez ¡ 11 ¡

  12. LimitaIons ¡when ¡using ¡LRs ¡ ¡ ¡ ¡Finding ¡and ¡ reusing ¡LR ¡ ¡in ¡ third ¡party ¡ applicaIons ¡is ¡ manual ¡and ¡Ime ¡ consuming ¡ 2014.05.08 ¡ Asun ¡Gómez-­‑Pérez ¡ 12 ¡

  13. Linked ¡Data ¡allows ¡ linguisIc ¡metadata ¡ and ¡linguisIc ¡data ¡ integraIon ¡ 2014.05.08 ¡ Asun ¡Gómez-­‑Pérez ¡ 13 ¡

  14. LD ¡allows ¡linguisIc ¡data ¡integraIon ¡ femenine [REDES] gender singular plural number Phonetic form Form “red” number written form Form Phonetic form Red [RED] Form Red “red” Sense Red written form Red equivalent “malla” Sense Sense Sense Red written form translation written form written form es - en image “red” “network” 2014.05.08 ¡ Asun ¡Gómez-­‑Pérez ¡ 14 ¡ 14

  15. Linked ¡Open ¡Data ¡and ¡Language ¡ LOD ¡interconnects ¡ resources ¡ ¡ Music On-line activities How many Linguistic Resources are exposed in In ¡many ¡domains ¡ – RDF? in ¡many ¡languages ¡ – Publications E-Gov LOD ¡is ¡increasingly ¡ – Cross-domains mulIlingual ¡ Geographic Life Sciences How many Linguistic Resources are exposed in RDF? 2014.05.08 ¡ Asun ¡Gómez-­‑Pérez ¡ 15 ¡

  16. LinguisIc ¡Linked ¡(Open) ¡Data ¡ q Subset ¡of ¡LOD ¡ q LinguisIc ¡domain ¡ q Open ¡License ¡ ¡ q Resources ¡in ¡RDF ¡ ¡ q Interconnected ¡with ¡ ¡ ¡ ¡ ¡ other ¡LD ¡resources ¡ Requirements: ¡ ¡ Keep ¡track ¡of ¡the ¡License ¡(open ¡or ¡closed) ¡informaIon ¡ Keep ¡track ¡of ¡the ¡Provenance ¡of ¡the ¡resource ¡ Keep ¡track ¡of ¡the ¡use ¡of ¡the ¡resource ¡ 2014.05.08 ¡ Asun ¡Gómez-­‑Pérez ¡ 16 ¡

  17. Linked ¡Data ¡and ¡Language ¡Resources ¡ • Uniform ¡access ¡to ¡Language ¡ Resources ¡ – Agree ¡on ¡vocabularies ¡ for ¡describing ¡ LR ¡ ¡metadata ¡and ¡content ¡ ¡ – Unified ¡ ¡and ¡standardized ¡language ¡ for ¡describing ¡resources ¡( ¡ RDF(S) ) ¡ – Unified ¡and ¡standardized ¡ query ¡ language ¡ (SPARQL) ¡ – Standardized ¡ ¡non-­‑proprietary ¡APIs ¡ • Links ¡to ¡other ¡resources ¡ 2014.05.08 ¡ Asun ¡Gómez-­‑Pérez ¡ 17 ¡

  18. What ¡is ¡3LD? ¡ ¡ ¡ 3LD ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ Linguis#c ¡Linked ¡Licensed ¡Data ¡ Language ¡resources ¡ Using ¡ RDF ¡ and ¡ Published ¡along ¡with ¡ such ¡as: ¡ standard ¡data ¡ a ¡ machine-­‑readable ¡ license . ¡ models ¡ ¡ ¡ ¡ ¡-­‑ ¡Lexica ¡ ¡ (vocabularies): ¡ ¡ ¡ ¡ ¡-­‑ ¡Corpora ¡ ODRL ¡ ¡-­‑ ¡Lexica ¡ ¡ ¡ ¡ ¡ ¡-­‑ ¡DicEonaries ¡.. ¡ Open ¡Digital ¡Rights ¡Language ¡ ¡ ¡ ¡ ¡ ¡-­‑ ¡Corpora ¡ NIF ¡ ¡ NLP ¡Interchange ¡Format ¡ 2014.05.08 ¡ Asun ¡Gómez-­‑Pérez ¡ 18 ¡

  19. LIDER ¡ ¡ project ¡ 2014.05.08 ¡ Presenter ¡name ¡ 19 ¡

  20. 2014.05.08 ¡ Asun ¡Gómez-­‑Pérez ¡ 20 ¡

  21. Community ¡ Industry ¡ building ¡ use ¡cases ¡ networking ¡ ¡ Technical ¡ac#vi#es ¡ 2014.05.08 ¡ Asun ¡Gómez-­‑Pérez ¡ 21 ¡

  22. Technical ¡acIviIes ¡ • Which ¡extensions ¡to ¡the ¡LOD ¡are ¡needed ¡to ¡support ¡a ¡new ¡ generaIon ¡of ¡large-­‑scale ¡content ¡analyIcs ¡applicaIons ¡that ¡will ¡ overcome ¡language ¡barriers. ¡ ¡ – Vocabularies ¡ ¡ – Expose ¡LinguisIc ¡Resources ¡in ¡LD ¡format ¡with ¡license ¡informaIon ¡ • Metadata ¡ ¡ • Content ¡ – Guidelines ¡for ¡LinguisIc ¡Linked ¡Licensed ¡Data ¡(3LD) ¡ – SpecificaIon ¡of ¡a ¡new ¡generaIon ¡of ¡ ¡3LD ¡aware ¡NLP ¡services ¡ – Reference ¡architecture ¡ – Roadmap ¡ 2014.05.08 ¡ Asun ¡Gómez-­‑Pérez ¡ 22 ¡

  23. Vocabularies ¡for ¡describing ¡LinguisIc ¡ Data ¡ 2014.05.08 ¡ Asun ¡Gómez-­‑Pérez ¡ 23 ¡

  24. Community ¡ building ¡ networking ¡ LD4LT ¡ BP-­‑MLOD ¡W3C-­‑CG ¡ OntoLex ¡W3C-­‑CG ¡ Technical ¡ac#vi#es ¡ 1. Roadmap ¡on ¡3LD ¡for ¡ Content ¡Analy#cs ¡ 2. Guidelines ¡for ¡3LD ¡ 3. 3LD ¡Reference ¡ Architecture ¡ 2014.05.08 ¡ Asun ¡Gómez-­‑Pérez ¡ 24 ¡

  25. Community ¡building ¡Networking ¡ • CreaIon ¡of ¡an ¡open ¡and ¡sustainable ¡worldwide ¡ community ¡around ¡LinguisIc ¡Linked ¡Data ¡for ¡ content ¡analyIcs ¡ • Means ¡ ¡ – Community ¡building ¡acIviIes ¡ LD4LT ¡ BP-­‑MLOD ¡ – Open ¡community ¡events ¡ OntoLex ¡ – Community ¡portal ¡ 2014.05.08 ¡ Asun ¡Gómez-­‑Pérez ¡ 25 ¡

More recommend