evalua ng mul lingual
play

Evalua&ng Mul&lingual Humboldt-Universitt zu Berlin - PowerPoint PPT Presentation

Juliane S$ller, Evalua&ng Mul&lingual Humboldt-Universitt zu Berlin Mul$lingualWeb Workshop, Features in Europeana Riga, 29.04.2015 Deriving best


  1. Juliane ¡S$ller, ¡ ¡ Evalua&ng ¡Mul&lingual ¡ Humboldt-­‑Universität ¡zu ¡Berlin ¡ Mul$lingualWeb ¡Workshop, ¡ ¡ Features ¡in ¡Europeana ¡ Riga, ¡29.04.2015 ¡ Deriving ¡best ¡prac/ces ¡for ¡digital ¡cultural ¡ heritage ¡

  2. Europeana ¡facts ¡ Mul$lingual ¡ users, ¡objects, ¡ 42 ¡milions ¡ metadata ¡ objects ¡ ¡ Text, ¡ images, ¡ video ¡ 2300 ¡ sound ¡ ins$tu$ons ¡

  3. Accessing ¡digital ¡cultural ¡heritage ¡ Metadata ¡ Access ¡System ¡ User ¡Query ¡ User ¡Interface ¡

  4. Crossing ¡the ¡language ¡barrier ¡ User ¡Interface ¡ Access ¡System ¡ User ¡Query ¡ Metadata ¡ 1 Mul$lingual ¡Enrichments ¡

  5. 1. ¡Mul$lingual ¡enrichments ¡

  6. Number ¡of ¡enriched ¡objects, ¡their ¡type ¡and ¡ vocabularies ¡ Agents ¡ Loca&ons ¡ Time ¡ Concept ¡ Semium ¡Time ¡ GEMET, ¡DBpedia ¡ GeoNames ¡ DBpedia ¡ 10.2 ¡Millions ¡ 9.2 ¡Millions ¡ 7 ¡Millions ¡ 144,000 ¡

  7. What ¡happens ¡if ¡automa$c ¡solu$ons ¡ fail ? ¡ Devalua$on ¡of ¡curated ¡metadata ¡ Loss ¡of ¡trust ¡ from ¡providers, ¡users ¡& ¡ service ¡re-­‑users ¡ Irrelevant ¡search ¡results ¡ We ¡need ¡to ¡evaluate ¡features ¡to ¡derive ¡ best ¡prac$ces ¡and ¡improve ¡services! ¡

  8. Semantically incorrect enrichment Polen ¡(Dutch) ¡ ¡ ¡ ¡ ¡ ¡ ¡Polen ¡(Basque) ¡

  9. Evalua$on ¡method ¡– ¡enrichments ¡ • 100 ¡queries ¡ Enrich- • 1,121 ¡records ¡ ment • First ¡result ¡page ¡ Query Object

  10. Correct ¡and ¡incorrect ¡enrichments ¡per ¡type ¡ 92% 8% 100% z ¡ 78% 22% Source: ¡S$ller, ¡J., ¡Olensky, ¡M., ¡Petras, ¡V.: ¡ A ¡Framework ¡for ¡the ¡Evalua$on ¡of ¡Automa$c ¡Metadata ¡Enrichments. ¡MTSR ¡2014

  11. Percentage ¡of ¡incorrect ¡enrichments ¡ incorrect ¡ 22% ¡ Example: ¡ ¡ ¡ ¡ Concept-­‑Type ¡ correct ¡ 78% ¡ Source: ¡S$ller, ¡J., ¡Olensky, ¡M., ¡Petras, ¡V.: ¡ A ¡Framework ¡for ¡the ¡Evalua$on ¡of ¡Automa$c ¡Metadata ¡Enrichments. ¡MTSR ¡2014 ¡ ¡

  12. Impact ¡of ¡enrichments ¡on ¡retrieval ¡ incorrect ¡ 7% ¡ 15% ¡ correct ¡ 15% ¡ 61% ¡ 2% ¡ impact ¡ poten$al ¡impact ¡ no ¡impact ¡ Source: ¡S$ller, ¡J., ¡Olensky, ¡M., ¡Petras, ¡V.: ¡ A ¡Framework ¡for ¡the ¡Evalua$on ¡of ¡Automa$c ¡Metadata ¡Enrichments. ¡MTSR ¡2014 ¡ ¡

  13. Method ¡provided: ¡ • Holis$c ¡view ¡on ¡the ¡quality ¡and ¡impact ¡of ¡enrichments ¡ • Query-­‑dependent ¡measures ¡may ¡deliver ¡different ¡results ¡ • Measures ¡are ¡system-­‑focused ¡and ¡independent ¡of ¡the ¡ user’s ¡point ¡of ¡view ¡ • Focus ¡on ¡first ¡result ¡page ¡-­‑> ¡it ¡might ¡be ¡different ¡for ¡long ¡ tail ¡ ¡ Task ¡force ¡on ¡enrichment ¡and ¡evalua$on: ¡ h6p://pro.europeana.eu/europeanatech-­‑task-­‑forces/ evalua/on-­‑and-­‑enrichments ¡ ¡

  14. Crossing ¡the ¡language ¡barrier ¡ Metadata ¡ Access ¡System ¡ User ¡Query ¡ Query ¡transla$on ¡ User ¡Interface ¡ 2

  15. 2. ¡Query ¡transla$on ¡ Wikipedia ¡API ¡ User ¡preferences ¡ Query ¡ construc$on ¡ Mixed ¡language ¡ result ¡list ¡ The ¡detailed ¡and ¡long ¡version ¡of ¡the ¡process ¡is ¡in ¡Péter ¡Király: ¡Query ¡Transla$on ¡in ¡ Europeana. ¡Code4lib, ¡Issue ¡27, ¡hpp://journal.code4lib.org/ar$cles/10285 ¡

  16. Evalua$on ¡method ¡– ¡query ¡transla$on ¡ 250 ¡aligned ¡queries ¡in ¡3 ¡languages ¡ ¡ Manually ¡ Automa$c ¡ Translated ¡baseline ¡ transla$on ¡ API ¡ API ¡ API ¡ Example ¡ Baseline From ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡to ¡ From ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡to From ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡to Stummfilm ¡ -­‑ Stummfilm Stummfilm Silent ¡film ¡ Silent ¡film -­‑ Silent ¡film film ¡muet ¡ ¡ ¡ ¡ ¡ ¡ cinéma ¡muet cinéma ¡muet -­‑

  17. Results ¡ 19% ¡ Query ¡ Transla&on ¡ Incorrect ¡ Unarmed ¡ unarmed ¡– ¡Best ¡of ¡ 25th ¡Anniversary ¡ Bulgaria ¡ Bulgarien ¡ 30% ¡ (Begriffserklärung) ¡ No ¡transla$on ¡ 51% ¡ For ¡over ¡ 80% ¡of ¡the ¡queries, ¡ correct ¡ the ¡automa$c ¡solu$on ¡is ¡ suitable ¡

  18. Evalua$ons ¡help ¡ • revealing ¡workflow ¡problems ¡and ¡issues ¡ • Giving ¡insight ¡on ¡the ¡real ¡impact ¡of ¡automa$c ¡solu$ons ¡ • Targe$ng ¡efforts ¡and ¡adapt ¡algorithms ¡ • Deriving ¡best ¡prac$ces ¡ Best ¡prac$ces ¡ • Should ¡also ¡incorporate ¡evalua$on ¡methodologies ¡

  19. Email: ¡juliane.s$ller@ibi.hu-­‑berlin.de ¡ Acknowledgements: ¡All ¡icons ¡designed ¡by ¡freepik ¡

Recommend


More recommend