PREserving ¡Linked ¡DAta: ¡ An ¡introduc7on ¡ Carlo ¡Meghini ¡ ISTI ¡CNR, ¡Pisa ¡
Preserving ¡Linked ¡Data ¡ need ¡ Linked ¡ Digital ¡ Data ¡ Preserva7on ¡ need ¡
PRELIDA ¡ PREserving ¡LInked ¡DAta ¡ • FP7 ¡Coordina7on ¡and ¡support ¡ac7on ¡ • ICT-‑2011.4.3 ¡Digital ¡Preserva7on ¡ • Start ¡date: ¡January ¡1 st , ¡2013 ¡ • Dura7on: ¡24 ¡Months ¡ • Funding: ¡770k ¡
Beneficiaries ¡ • Consiglio ¡Nazionale ¡delle ¡Ricerche ¡(Coord.) ¡ • Alliance ¡for ¡Permanent ¡Access ¡ • University ¡of ¡Huddersfields ¡ • Universitaet ¡Innsbruck ¡ • Europeana ¡ • STI ¡
Context ¡and ¡Mo7va7ons ¡ • Data ¡economy ¡ • Linked ¡Data ¡movement ¡ – need ¡to ¡preserve ¡Linked ¡Data ¡ • Digital ¡preserva7on ¡ – needs ¡Linked ¡Data ¡ – faces ¡new ¡challenges ¡by ¡Linked ¡Data ¡ • So ¡far, ¡liYle ¡or ¡no ¡interac7on ¡between ¡the ¡two ¡ communi7es ¡
General ¡Objec7ves ¡ Bridge ¡the ¡LD ¡and ¡DP ¡communi7es ¡for ¡ • making ¡the ¡LD ¡community ¡aware ¡of ¡the ¡ exis7ng ¡DP ¡results ¡ • making ¡the ¡DP ¡community ¡aware ¡of ¡the ¡ challenges ¡posed ¡by ¡LD ¡ – intrinsic ¡features ¡of ¡Linked ¡Data, ¡including ¡their ¡ structuring, ¡interlinking, ¡dynamicity ¡and ¡ distribu7on. ¡
Specific ¡Objec7ves ¡ • collect, ¡organize ¡and ¡publish ¡use ¡cases ¡related ¡ to ¡the ¡long-‑term ¡access ¡to ¡LD ¡ • create ¡a ¡comprehensive ¡state ¡of ¡the ¡art ¡on ¡LD ¡ and ¡DP ¡technologies ¡ • set ¡up ¡a ¡technology ¡observatory ¡ • bring ¡together ¡scien7sts ¡and ¡stakeholders ¡for ¡ iden7fying ¡relevant ¡challenges ¡and ¡paths ¡for ¡ addressing ¡them ¡in ¡the ¡near ¡future ¡
Specific ¡Objec7ves ¡ • perform ¡a ¡gap ¡analysis ¡between ¡needs ¡and ¡ tools ¡ • create ¡a ¡roadmap ¡making ¡the ¡research ¡agenda ¡ in ¡preserving ¡linked ¡data ¡ • draw ¡aYen7on ¡of ¡standardiza7on ¡bodies ¡
The ¡Working ¡Group ¡ Dis7nguished ¡people ¡from ¡the ¡Linked ¡Data ¡and ¡ the ¡Digital ¡Preserva7on ¡communi7es ¡ – stakeholders ¡ – academia ¡ – companies ¡ – std ¡bodies ¡ to ¡help ¡PRELIDA ¡achieve ¡its ¡goals ¡
Tools ¡ • Workshops ¡ – 3 ¡of ¡them ¡ • On-‑line ¡pla^orm ¡ – Communica7on ¡& ¡Collabora7on ¡ • Dissemina7on ¡ac7vi7es ¡ – portal ¡ – workshop ¡reports ¡or ¡proceedings ¡ – links ¡with ¡relevant ¡projects ¡& ¡organiza7ons ¡ – summer ¡schools ¡
Workshops ¡ • Opening ¡workshop ¡(June ¡25-‑27, ¡2013) ¡ – presenta7ons ¡ – discussions ¡ – final ¡report ¡ • Midterm ¡workshop ¡(April ¡2-‑4, ¡2014) ¡ – Help ¡defining ¡the ¡scien7fic ¡structure ¡ ¡ • Consolida7on ¡& ¡dissemina7on ¡workshop ¡(end ¡ 2014) ¡ – Open ¡
The ¡global ¡picture ¡ Now ¡
Challenges, ¡so ¡far ¡ • LD ¡are ¡a ¡form ¡of ¡ formal ¡knowledge ¡ – formal ¡knowledge ¡is ¡ used ¡for ¡preserving ¡objects ¡ (viz. ¡OAIS ¡informa7on ¡model), ¡but ¡how ¡do ¡we ¡ preserve ¡it? ¡ • the ¡world ¡changes ¡ • our ¡knowledge ¡of ¡the ¡world ¡changes ¡ • the ¡language ¡that ¡we ¡use ¡to ¡express ¡our ¡knowledge ¡of ¡ the ¡world ¡changes ¡ – how ¡do ¡we ¡communicate ¡a ¡message ¡via ¡a ¡ changing ¡language? ¡
Challenges, ¡so ¡far ¡ • LD ¡depend ¡on ¡the ¡ web ¡infrastructure ¡for ¡de-‑ referencing ¡HTTP ¡URIs ¡ – how ¡do ¡we ¡make ¡sure ¡the ¡web ¡will ¡keep ¡going ¡ • LD ¡are ¡ distributed ¡in ¡nature ¡ ¡ – how ¡do ¡we ¡manage ¡the ¡preserva7on ¡of ¡the ¡ interdependencies ¡amongst ¡datasets ¡
Challenges, ¡so ¡far ¡ • LD ¡are ¡ accessible ¡in ¡many ¡ways : ¡ ¡ – SPARQL ¡end-‑points ¡ – RDF ¡dumps ¡ – RDF ¡dumps ¡plus ¡incremental ¡updates ¡ – RDFa ¡ – microdata ¡etc. ¡ Which ¡formats ¡is ¡best ¡to ¡preserve? ¡ ¡
Challenges, ¡so ¡far ¡ • Preserva7on ¡requires ¡the ¡expression ¡and ¡ recording ¡of ¡several ¡kinds ¡of ¡metadata ¡about ¡ the ¡preserved ¡objects. ¡For ¡preserving ¡LD ¡such ¡ metadata ¡should ¡be ¡associated ¡with ¡RDF ¡ triples , ¡and ¡at ¡the ¡moment ¡there ¡is ¡no ¡obvious ¡ way ¡(apart ¡from ¡reifica7on) ¡to ¡express ¡ metadata ¡about ¡RDF ¡triples. ¡ – quadruples ¡ – nested ¡triples ¡
Conclusions ¡ • Many ¡interes7ng ¡problems ¡ • No ¡simple, ¡ready ¡solu7on ¡ • Need ¡major ¡research ¡efforts ¡
Recommend
More recommend