quality models linked data and xliff standardisa on
play

Quality Models, Linked Data and XLIFF: Standardisa(on - PowerPoint PPT Presentation

Quality Models, Linked Data and XLIFF: Standardisa(on Efforts for a Mul(lingual and Localized Web David Filip, CNGL at University of Limerick Arle


  1. Quality ¡Models, ¡Linked ¡Data ¡and ¡XLIFF: ¡ Standardisa(on ¡Efforts ¡for ¡a ¡ Mul(lingual ¡and ¡Localized ¡Web ¡ David ¡Filip, ¡CNGL ¡at ¡University ¡of ¡Limerick ¡ Arle ¡Lommel, ¡DFKI ¡ David ¡Lewis, ¡CNGL ¡at ¡Trinity ¡College ¡Dublin ¡ The ¡Mul(lingualWeb-­‑LT ¡Working ¡Group ¡receives ¡funding ¡by ¡the ¡European ¡Commission ¡(project ¡name ¡LT-­‑Web) ¡through ¡the ¡Seventh ¡ Framework ¡Programme ¡(FP7) ¡in ¡the ¡area ¡of ¡Language ¡Technologies. ¡Grant ¡Agreement ¡No. ¡287815. ¡

  2. Updates ¡on ¡Converging ¡Standards ¡ MQM ¡ ITS2.0 ¡ XLIFF ¡ The ¡Mul(lingualWeb-­‑LT ¡Working ¡Group ¡receives ¡funding ¡by ¡the ¡European ¡Commission ¡(project ¡name ¡LT-­‑Web) ¡through ¡the ¡Seventh ¡ Framework ¡Programme ¡(FP7) ¡in ¡the ¡area ¡of ¡Language ¡Technologies. ¡Grant ¡Agreement ¡No. ¡287815. ¡

  3. XLIFF ¡2.0 ¡ • XLIFF ¡2.0 ¡is ¡now ¡Candidate ¡OASIS ¡Standard ¡ h[p://docs.oasis-­‑open.org/xliff/xliff-­‑core/v2.0/cos01/xliff-­‑core-­‑v2.0-­‑cos01.html ¡ • Announced ¡by ¡OASIS ¡here: ¡ h[ps://www.oasis-­‑open.org/news/announcements/60-­‑day-­‑public-­‑review-­‑for-­‑ xliff-­‑version-­‑2-­‑0-­‑candidate-­‑oasis-­‑standard-­‑ends-­‑july-­‑5th ¡ ¡ • Test ¡suite ¡at ¡TC’s ¡public ¡SVN ¡ h[ps://tools.oasis-­‑open.org/version-­‑control/browse/wsvn/xliff/trunk/xliff-­‑20/ test-­‑suite/?rev=521&sc=1#_trunk_xliff-­‑20_test-­‑suite_ ¡ ¡ The ¡Mul(lingualWeb-­‑LT ¡Working ¡Group ¡receives ¡funding ¡by ¡the ¡European ¡Commission ¡(project ¡name ¡LT-­‑Web) ¡through ¡the ¡Seventh ¡ Framework ¡Programme ¡(FP7) ¡in ¡the ¡area ¡of ¡Language ¡Technologies. ¡Grant ¡Agreement ¡No. ¡287815. ¡

  4. 5 th ¡XLIFF ¡Symposium ¡ • @ ¡FEISGILTT ¡2014 ¡@ ¡LocWorld ¡Dublin ¡2014, ¡June ¡ 3-­‑4, ¡2014, ¡Conven(on ¡Centre ¡Dublin ¡ h[p://www.localiza(onworld.com/lwdub2014/feisgil[/ ¡ ¡ • Accepted ¡speakers: ¡ h[p://www.localiza(onworld.com/lwdub2014/feisgil[/accepted.html ¡ ¡ • Registra(on ¡ h[ps://www.localiza(onworld.com/lwdub2014/orderFeisgil[.php ¡ ¡ • Content ¡Analy(cs ¡meets ¡localiza(on ¡ • XLIFF ¡2.1 ¡and ¡XLIFF ¡2.x ¡info ¡session ¡ ¡ The ¡Mul(lingualWeb-­‑LT ¡Working ¡Group ¡receives ¡funding ¡by ¡the ¡European ¡Commission ¡(project ¡name ¡LT-­‑Web) ¡through ¡the ¡Seventh ¡ Framework ¡Programme ¡(FP7) ¡in ¡the ¡area ¡of ¡Language ¡Technologies. ¡Grant ¡Agreement ¡No. ¡287815. ¡

  5. XLIFF ¡2.x ¡ • XLIFF ¡2.0 ¡is ¡modular ¡to ¡allow ¡for ¡rapid ¡release ¡of ¡ 2.x ¡versions ¡ • Core ¡is ¡lightweight ¡(about ¡20% ¡of ¡1.2 ¡features) ¡ • Advanced ¡func(onality ¡in ¡numerous ¡specialized ¡ areas ¡is ¡available ¡through ¡8 ¡modules ¡ h[p://docs.oasis-­‑open.org/xliff/xliff-­‑core/v2.0/cos01/xliff-­‑core-­‑ v2.0-­‑cos01.html#modules ¡ ¡ • In ¡Dublin ¡2.x ¡plans ¡will ¡be ¡discussed ¡with ¡the ¡ wider ¡community ¡of ¡stakeholders ¡ The ¡Mul(lingualWeb-­‑LT ¡Working ¡Group ¡receives ¡funding ¡by ¡the ¡European ¡Commission ¡(project ¡name ¡LT-­‑Web) ¡through ¡the ¡Seventh ¡ Framework ¡Programme ¡(FP7) ¡in ¡the ¡area ¡of ¡Language ¡Technologies. ¡Grant ¡Agreement ¡No. ¡287815. ¡

  6. XLIFF ¡2.1 ¡ • ITS ¡2.0 ¡module ¡ – based ¡on ¡ITS ¡2.0 ¡<-­‑> ¡XLIFF ¡2.0 ¡mapping ¡WIP ¡here: ¡ h[ps://www.w3.org/Interna(onal/its/wiki/XLIFF_2.0_Mapping ¡ ¡ – Yves ¡Savourel ¡will ¡report ¡on ¡this ¡in ¡ Dublin, ¡Wed ¡June ¡4, ¡ a/ernoon ¡ ¡ • Advanced ¡valida(on ¡support ¡ – Constraints ¡beyond ¡xsd ¡expressivity ¡ – Processing ¡requirements ¡express ¡rules ¡for ¡dynamic ¡validity ¡ – Numerous ¡namespaces ¡require ¡NVDL ¡for ¡standardized ¡automated ¡validity ¡ tes(ng ¡ – Felix ¡Sasaki ¡will ¡report ¡on ¡this ¡in ¡ Dublin, ¡Wed ¡June ¡4, ¡a/ernoon ¡ The ¡Mul(lingualWeb-­‑LT ¡Working ¡Group ¡receives ¡funding ¡by ¡the ¡European ¡Commission ¡(project ¡name ¡LT-­‑Web) ¡through ¡the ¡Seventh ¡ Framework ¡Programme ¡(FP7) ¡in ¡the ¡area ¡of ¡Language ¡Technologies. ¡Grant ¡Agreement ¡No. ¡287815. ¡

  7. XLIFF ¡2.x ¡roadmap ¡ • Requirements ¡Gathering ¡for ¡XLIFF ¡2.x ¡ – Bryan ¡Schnabel ¡will ¡chair ¡this ¡in ¡ Dublin, ¡Wed ¡June ¡4, ¡a/ernoon ¡ (a/er ¡coffee ¡break) ¡ ¡ • Yearly ¡release ¡schedule ¡will ¡be ¡proposed ¡by ¡Microsoq ¡Kevin ¡ O’Donnell ¡ – Feasibility ¡will ¡be ¡discussed ¡with ¡TC ¡and ¡stakeholders ¡at ¡large ¡ – Dublin, ¡Wed ¡June ¡4, ¡a/ernoon ¡(a/er ¡coffee ¡break) ¡ ¡ The ¡Mul(lingualWeb-­‑LT ¡Working ¡Group ¡receives ¡funding ¡by ¡the ¡European ¡Commission ¡(project ¡name ¡LT-­‑Web) ¡through ¡the ¡Seventh ¡ Framework ¡Programme ¡(FP7) ¡in ¡the ¡area ¡of ¡Language ¡Technologies. ¡Grant ¡Agreement ¡No. ¡287815. ¡

  8. Funded by the 7th Framework Programme of the European Commission through the contract 296347. 
 Multidimensional Quality Metrics (MQM) A New Framework for Translation Quality Assessment Arle Lommel (DFKI) Funded by the 7th Framework Programme of the European Commission through the contract 296347.

  9. QTLaunchPad is an EU-funded project to lay the ground for systematically identifying and addressing the barriers to high-quality translation .

  10. Many ways of assessing quality = no agreement

  11. The problem with BLEU/ 
 many reference methods Increased BLEU score but 
 no substantial improvement for human use

  12. The problem with BLEU Substantial human improvement but no 
 BLEU increase

  13. MT methods require 
 reference translations : 
 Cannot be used for 
 production purposes

  14. Human quality assessment 
 takes too much time and is not principled

  15. Wait a minute… What do you mean by quality?

  16. Quality: A New Definition A quality translation demonstrates 
 required accuracy and fluency for the audience and purpose and 
 complies with all other negotiated specifications, 
 taking into account end-user needs. Source: Alan Melby

  17. Why not use a 
 single, shared metric ?

  18. Which one? LISA QA Model SAE J2450 SDL TMS Acrocheck ApSIC XBench CheckMate QA Distiller XLIFF:Doc EN15038…

  19. All of them disagree* about what is important to quality *The only thing they agree on is terminology

  20. The solution

  21. Variants/slang Register* Company style Company terminology Terminology* Style* Style guide Normative terminology Unidiomatic Overly literal Abbreviations* False friend Image vs. text Should not have been translated* (Content) Mistranslation Inconsistency Discourse Date/time* Terminological inconsistency Unit conversion* Accuracy Inconsistent link/cross-reference Number* Duplication* Entity (such as name or place)* Normative monolingual terminology Monolingual terminology* Improper exact match Unclear reference Ambiguity Omitted variable Omission* Addition* Capitalization Untranslated graphic Untranslated* Spelling* Diacritics Color Punctuation Global font choice Typography* Unpaired quote marks or brackets Footnote/endnote format Part of speech Overall design (layout) Headers and footers Word form Agreement Margins Fluency Grammar* Tense/mood/aspect Widows/orphans Word order Page break Function words Translation Text alignment Date format Quality Paragraph indentation Time format Bold/italic Measurement format Wrong size Font Local formatting Locale violation* (Mechanical) Number format Single/double-width (CJK only) Quote mark type Design Kerning National language standard (mono- and/or bi-lingual) Leading Character encoding* Inconsistent markup Nonallowed characters* Misplaced Pattern problem* Added Markup* Sorting* Missing Corpus conformance* Questionable Document-internal Whitespace* Link/cross-reference* Document-external Position Page references Missing Graphics and tables Index/TOC* Index/TOC format Call-outs and caption Missing /incorrect item Trunctation/text expansion* Unintelligible Length* End-user suitability Internationalization Lists Completeness Compatibility (deprecated) Verity Procedures Other Legal requirements * = potentially automatable Locale applicability

  22. Are you kidding?

Recommend


More recommend