Personal ¡Informa-on ¡ ¡ Management ¡Systems ¡ Serge ¡Abiteboul ¡ Amélie ¡Marian ¡ INRIA ¡& ¡ENS ¡Cachan ¡ Rutgers ¡University ¡ serge.abiteboul@inria.fr ¡ amelie@cs.rutgers.edu ¡
Personal ¡data ¡is ¡everywhere ¡ Amélie ¡& ¡Serge, ¡EDBT, ¡11111011111 ¡ ¡ 2 ¡
Personal ¡data ¡is ¡exploding ¡ ¡ • Ac-vely: ¡Data ¡and ¡metadata ¡we ¡produce ¡ – Pictures, ¡reports, ¡emails, ¡calendars, ¡tweets, ¡annota-ons, ¡ recommenda-on, ¡social ¡network… ¡ ¡ ¡ ¡ ¡ ¡ ¡Ac-vely: ¡Data ¡we ¡like/buy ¡ – Books, ¡music, ¡movies… ¡ • Passively: ¡Data ¡others ¡produce ¡about ¡us ¡ – Public ¡administra-on, ¡schools, ¡insurances, ¡banks… ¡ – Amazon, ¡banks, ¡retailers, ¡applestore… ¡ ¡ • Stealthily: ¡sensors ¡ – GPS, ¡web ¡naviga-on, ¡phone, ¡"quan-fied ¡self" ¡measurements, ¡ contactless ¡card ¡readings, ¡surveillance ¡camera ¡pictures… ¡ • Stealthily: ¡data ¡analysis ¡ – Clicks, ¡Searches, ¡TV ¡viewing ¡habits ¡(e.g., ¡NeYlix) ¡ – NSA ¡inference ¡ Amélie ¡& ¡Serge, ¡EDBT, ¡11111011111 ¡ ¡ 3 ¡
Personal ¡data ¡is ¡heterogeneous ¡ • Structured: ¡rela-onal ¡ • Semistructured: ¡HTML, ¡XML, ¡Jason… ¡ • Not ¡structured: ¡text ¡(pdf), ¡pictures, ¡music, ¡video… ¡ • Metadata: ¡date, ¡loca-on… ¡ ¡ • Seman-c: ¡RDF, ¡RDFS, ¡Owl ¡ • Different ¡languages, ¡terminologies, ¡ontologies, ¡structures ¡ • Different ¡systems, ¡protocols ¡ ¡ • Varying ¡quality ¡ Amélie ¡& ¡Serge, ¡EDBT, ¡11111011111 ¡ ¡ 4 ¡
Bad ¡news ¡ • Loss ¡of ¡func-onali-es ¡because ¡of ¡fragmenta-on ¡ – You ¡don’t ¡know ¡where ¡your ¡data ¡is, ¡how ¡to ¡maintain ¡it ¡up ¡ to ¡date, ¡how ¡to ¡get ¡it ¡some-mes ¡ – Difficult ¡to ¡do ¡global ¡search, ¡maintenance, ¡ synchroniza-on, ¡archiving... ¡ • Loss ¡of ¡control ¡over ¡the ¡data ¡ – Difficult ¡to ¡control ¡privacy ¡ – Difficult ¡to ¡control ¡sharing ¡ ¡ – Leaks ¡of ¡private ¡informa-on ¡ • Loss ¡of ¡freedom ¡ – Vendor ¡lock-‑in ¡ Amélie ¡& ¡Serge, ¡EDBT, ¡11111011111 ¡ ¡ 5 ¡
W h e r e ¡ d k o e ¡ y e o p u ¡ y ¡ o u r ¡ d a t a ? ¡ Alterna-ves ¡ 1. Con-nue ¡with ¡this ¡increasing ¡ ¡ ¡ ¡ ¡ ¡ ¡mess ¡ Use ¡a ¡shrink ¡to ¡overcome ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ – ¡the ¡frustra-on ¡ 2. Regroup ¡all ¡your ¡data ¡on ¡the ¡same ¡plaYorm ¡ Google, ¡Apple, ¡Facebook, ¡…, ¡a ¡new ¡comer ¡ – Use ¡a ¡shrink ¡to ¡overcome ¡resentment ¡ – 3. Study ¡2 ¡years ¡to ¡become ¡a ¡geek ¡ Geeks ¡know ¡how ¡to ¡manage ¡their ¡informa-on ¡ ¡ – Use ¡a ¡shrink ¡to ¡survive ¡the ¡experience ¡ – Amélie ¡& ¡Serge, ¡EDBT, ¡11111011111 ¡ ¡ 6 ¡
The ¡-me ¡for ¡PIMS ¡is ¡now! ¡ A ¡memex ¡is ¡a ¡device ¡in ¡which ¡an ¡individual ¡stores ¡all ¡his ¡books, ¡records, ¡and ¡ communica7ons, ¡and ¡which ¡is ¡mechanized ¡so ¡that ¡it ¡may ¡be ¡consulted ¡with ¡ exceeding ¡speed ¡and ¡flexibility. ¡It ¡is ¡an ¡enlarged ¡in7mate ¡supplement ¡to ¡his ¡ memory . ¡ ¡ ¡ ¡ ¡Vannevar ¡Bush, ¡The ¡Atlan-c ¡Monthly, ¡1945 ¡ ¡ Defini-on ¡for ¡this ¡talk: ¡ a ¡ Personal ¡Informa-on ¡ Management ¡System ¡is ¡a ¡(cloud) ¡system ¡that ¡manages ¡ all ¡the ¡informa7on ¡of ¡a ¡person ¡ Amélie ¡& ¡Serge, ¡EDBT, ¡11111011111 ¡ ¡ 7 ¡
The ¡PIMS: ¡A ¡change ¡in ¡paradigm ¡ Using ¡Web ¡services ¡today ¡ Your ¡PIMS ¡ ¡ • Your ¡data ¡ ¡ • Your ¡data ¡ • Running ¡a ¡local ¡service ¡ • Running ¡with ¡an ¡external ¡ service ¡ • On ¡your ¡machine ¡ • On ¡some ¡unknown ¡ machines ¡ Possibly ¡for ¡external ¡services ¡ ¡ • A ¡replica ¡of ¡the ¡data ¡ • On ¡a ¡wrapper ¡ ¡ • On ¡your ¡machine ¡ Amélie ¡& ¡Serge, ¡EDBT, ¡11111011111 ¡ ¡ 8 ¡
PIMS ¡in ¡the ¡Past ¡
Saving ¡Personal ¡Data ¡– ¡Old ¡School ¡ Amélie ¡& ¡Serge, ¡EDBT, ¡11111011111 ¡ ¡ 10 ¡
Searching ¡Personal ¡Data ¡– ¡Old ¡School… ¡ File ¡cabinet ¡ Amélie ¡& ¡Serge, ¡EDBT, ¡11111011111 ¡ ¡ 11 ¡ around ¡1888 ¡
Personal ¡Informa-on ¡Management ¡– ¡ the ¡Digital ¡Age ¡ % grep PIMS /home/amelie/presentations Amélie ¡& ¡Serge, ¡EDBT, ¡11111011111 ¡ ¡ 12 ¡
First-‑genera-on ¡Personal ¡Informa-on ¡ Management ¡Systems ¡ • Storage ¡ – Archival, ¡safe-‑keeping ¡ • Organiza-on ¡ – Structure ¡ – Different ¡file ¡types ¡ • Finding ¡and ¡re-‑finding ¡informa-on ¡ – Different ¡from ¡tradi-onal ¡IR/Web ¡search ¡systems ¡ – Keyword ¡searches ¡not ¡ideal ¡ Amélie ¡& ¡Serge, ¡EDBT, ¡11111011111 ¡ ¡ 13 ¡
Desktop ¡Search ¡Tools ¡ • Google ¡Desktop ¡Search ¡(defunct) ¡ • Apple ¡Spotlight ¡ • Windows ¡Search ¡ Use ¡IR-‑style ¡keyword ¡searches ¡ ¡ Some ¡metadata ¡filtering ¡ • Lead ¡to ¡frustra-on ¡when ¡users ¡cannot ¡find ¡ informa-on ¡they ¡know ¡they ¡have ¡ Amélie ¡& ¡Serge, ¡EDBT, ¡11111011111 ¡ ¡ 14 ¡
Past ¡PIMS ¡projects ¡ ¡ (late ¡1990’s, ¡2000’s) ¡ ¡ • Lifestreams ¡ ¡ Various ¡use ¡of ¡ ¡ – Time ¡oriented ¡streams ¡ • Haystack ¡ – Context ¡ – Uniform ¡data ¡model ¡ – Time ¡ • Stuff ¡I’ve ¡seen ¡ – Social ¡network ¡ – History ¡of ¡web ¡behavior ¡ • Dataspaces ¡ ¡ – Seman-c ¡connec-ons. ¡Data ¡ integra-on ¡ • Connec-ons, ¡Seetrieve ¡ – Task-‑based ¡organiza-on ¡ • deskWeb ¡ – Looks ¡at ¡the ¡social ¡network ¡ graph ¡ ¡ ¡ Amélie ¡& ¡Serge, ¡EDBT, ¡11111011111 ¡ ¡ 15 ¡
LifeStreams ¡ (Freeman ¡and ¡Gelertner, ¡Yale, ¡1996-‑1997) ¡ Help ¡users ¡ manage ¡their ¡ informa-on ¡ ¡ Time-‑centric ¡view ¡ of ¡documents ¡ Amélie ¡& ¡Serge, ¡EDBT, ¡11111011111 ¡ ¡ 16 ¡
Haystack ¡ ¡ (Karger ¡et ¡al., ¡MIT ¡CSAIL ¡1997-‑2005) ¡ Allows ¡users ¡to ¡store, ¡ examine ¡and ¡manipulate ¡ their ¡informa-on ¡ ¡ Uniform ¡Data ¡Model ¡ • Semi-‑structured ¡Data ¡ • Captures ¡ • rela-onships ¡ Separate ¡Workspaces ¡ • Amélie ¡& ¡Serge, ¡EDBT, ¡11111011111 ¡ ¡ 17 ¡
Stuff ¡I’ve ¡Seen ¡ ¡ (Dumais ¡et ¡al. ¡Microsos, ¡2003-‑2004) ¡ • Unified ¡Index ¡ • Integra-on ¡of ¡ sources ¡ • Re-‑find ¡ informa-on ¡ • Focus ¡on ¡UI ¡ Amélie ¡& ¡Serge, ¡EDBT, ¡11111011111 ¡ ¡ 18 ¡
A ¡changing ¡landscape ¡ ¡ ¡ Cloud-‑based ¡model ¡ ¡ ¡ ¡ Heterogeneous ¡data ¡types ¡and ¡formats ¡ ¡ Need ¡for ¡richer ¡func-onali-es ¡and ¡seman-c ¡analysis ¡ Amélie ¡& ¡Serge, ¡EDBT, ¡11111011111 ¡ ¡ 19 ¡
A ¡vision ¡for ¡the ¡Future ¡of ¡PIMS ¡ ¡ ¡
All ¡the ¡digital ¡life ¡of ¡an ¡individual ¡ From ¡Memex ¡to ¡MyLifeBits ¡ Memex ¡ – Memory ¡index ¡ or ¡ memory ¡extender ¡ – Hypertext ¡system ¡by ¡Vannevar ¡Bush ¡in ¡1945 ¡ ¡ – Compress ¡and ¡store ¡all ¡of ¡their ¡books, ¡records, ¡ and ¡communica-ons… ¡ – Provide ¡an ¡"enlarged ¡in-mate ¡supplement ¡to ¡ one's ¡memory” ¡ MyLifeBits ¡ – Microsos ¡Research ¡project ¡with ¡Gordon ¡Bell ¡ (2006) ¡ – Life-‑logging ¡ ¡ – All ¡documents ¡read ¡or ¡produced ¡by ¡Bell, ¡CDs, ¡ ¡ ¡emails, ¡web ¡pages ¡browsed, ¡phone ¡and ¡ ¡ ¡ ¡instant ¡messaging ¡conversa-ons, ¡etc. ¡ ¡ Amélie ¡& ¡Serge, ¡EDBT, ¡11111011111 ¡ ¡ 21 ¡ ¡
Recommend
More recommend