mega modeling for scien fic big data processing
play

Mega Modeling for Scien/fic Big Data Processing Stefano - PowerPoint PPT Presentation

Mega Modeling for Scien/fic Big Data Processing Stefano Ceri, Emanuele Della Valle (Politecnico di Milano) Dino Pedreschi, Roberto Trasar/


  1. Mega ¡Modeling ¡ ¡ for ¡Scien/fic ¡“Big ¡Data” ¡Processing ¡ Stefano ¡Ceri, ¡Emanuele ¡Della ¡Valle ¡ (Politecnico ¡di ¡Milano) ¡ Dino ¡Pedreschi, ¡Roberto ¡Trasar/ ¡ (ISTI-­‑CNR ¡and ¡University ¡of ¡Pisa) ¡ ER ¡2012 ¡-­‑ ¡Stefano ¡Ceri ¡ 1 ¡

  2. The ¡context ¡ ER ¡2012 ¡-­‑ ¡Stefano ¡Ceri ¡ 2 ¡

  3. Scenario ¡ • BIG ¡DATA: ¡A ¡new ¡data ¡revolu/on. ¡ • Data ¡is ¡reshaping ¡every ¡individual ¡and ¡collec/ve ¡ ac/vity ¡of ¡people’s ¡life. ¡ -­‑ Sensors ¡and ¡people ¡produce ¡huge ¡amounts ¡of ¡data ¡ -­‑ Data ¡is ¡becoming ¡accessible ¡everywhere ¡via ¡the ¡Web ¡ • Scien/fic ¡big ¡data ¡is ¡changing ¡our ¡aVtude ¡towards ¡ science, ¡from ¡specialized ¡to ¡massive ¡experiments ¡ and ¡from ¡focused ¡to ¡broad ¡ques/ons. ¡ ¡ • A ¡data-­‑centric ¡vision ¡goes ¡towards ¡Horizon ¡2020’s ¡ objec/ves. ¡ ¡ ER ¡2012 ¡-­‑ ¡Stefano ¡Ceri ¡ 3 ¡

  4. Examples ¡of ¡Big ¡Data ¡ A. ¡London ¡Traffic ¡ 4 ¡

  5. Challenges ¡of ¡Scien/fic ¡Big ¡Data ¡Processing ¡ Smart ¡Ci/es ¡ • Ci/es ¡are ¡becoming ¡smarter, ¡as ¡governments, ¡ businesses, ¡and ¡communi/es ¡increasingly ¡rely ¡on ¡ technology ¡to ¡overcome ¡the ¡challenges ¡from ¡rapid ¡ urbaniza/on. ¡ ¡ • Typical ¡ques/ons ¡for ¡smart ¡ci/es: ¡ – Where ¡in ¡the ¡city ¡are ¡people ¡converging ¡during ¡a ¡typical ¡ ¡ week ¡day? ¡Or ¡during ¡weekends? ¡ – Is ¡public ¡transporta/on ¡dynamically ¡adap/ng ¡to ¡people’s ¡ ¡ density? ¡ ¡ – Is ¡a ¡traffic ¡jam ¡going ¡to ¡happen ¡on ¡this ¡road? ¡And ¡is ¡it ¡then ¡ convenient ¡to ¡reallocate ¡travellers ¡based ¡upon ¡the ¡ forecast? ¡ – Where ¡are ¡all ¡my ¡friends ¡mee/ng? ¡Can ¡I ¡reach ¡them? ¡ Should ¡I ¡use ¡public ¡transports ¡or ¡go ¡by ¡car? ¡ ER ¡2012 ¡-­‑ ¡Stefano ¡Ceri ¡ 5 ¡

  6. ¡ B. ¡Pulse ¡of ¡the ¡Na/on ¡ inferred ¡from ¡ Twicer ¡ ¡ 6 ¡ [source ¡hcp://www.ccs.neu.edu/home/amislove/twicermood/ ¡] ¡

  7. C. ¡Facebook ¡World’s ¡Geography ¡ The social network behind Facebook � 7 ¡

  8. Challenges ¡of ¡Scien/fic ¡Big ¡Data ¡Processing ¡ Social ¡Mining ¡ • Using ¡user-­‑generated ¡content ¡for ¡discovering ¡and ¡ analyzing ¡emergent ¡social ¡behaviors, ¡by ¡combining ¡ sensing ¡of ¡personal ¡micro-­‑data ¡(tweets, ¡web ¡logs, ¡ mobile ¡ phones ¡traces) ¡and ¡par/cipatory ¡sensing ¡(via ¡ crowdsourcing, ¡GWAP,…). ¡ • Typical ¡ques/ons ¡for ¡social ¡mining: ¡ – Who ¡will ¡win ¡US ¡elec/ons? ¡What’s ¡the ¡elector’s ¡current ¡ inten/on ¡of ¡vote? ¡How ¡reliable ¡is ¡it? ¡ – Which ¡are ¡the ¡indicators ¡of ¡social ¡well-­‑being ¡(beyond ¡GDP) ¡and ¡ how ¡can ¡they ¡be ¡computed ¡and ¡monitored? ¡ – How ¡is ¡the ¡aging ¡popula/on ¡effec/vely ¡helped ¡by ¡the ¡social ¡ par/cipa/on ¡to ¡digital ¡community ¡services? ¡ – What ¡is ¡the ¡link ¡between ¡media ¡ownership ¡and ¡media ¡content? ¡ Is ¡there ¡bias ¡in ¡news ¡repor/ng? ¡And ¡in ¡content ¡reviews? ¡ ¡ – Is ¡an ¡infec/ve ¡disease ¡emerging? ¡How ¡is ¡its ¡diffusion ¡model? ¡ ¡ ER ¡2012 ¡-­‑ ¡Stefano ¡Ceri ¡ 8 ¡

  9. D. ¡Genomic ¡Data ¡ ER ¡2012 ¡-­‑ ¡Stefano ¡Ceri ¡ 9 ¡

  10. Challenges ¡of ¡Scien/fic ¡Big ¡Data ¡Processing ¡ Genomic ¡Compu/ng ¡ • The ¡context: ¡thanks ¡to ¡Fast ¡DNA ¡Sequencing, ¡“personalized ¡ genomic ¡medicine” ¡will ¡become ¡possible: ¡ ¡ – aner ¡ ¡a ¡blood ¡sample, ¡with ¡a ¡cost ¡below ¡100$ ¡and ¡within ¡hours ¡ or ¡minutes ¡of ¡compu/ng ¡/me, ¡have ¡the ¡en/re ¡genome ¡of ¡each ¡ individual ¡available ¡at ¡a ¡genome ¡browser ¡ • New ¡ques/ons ¡and ¡scenarios: ¡ – Am ¡I ¡the ¡carrier ¡of ¡gene/c ¡muta/ons? ¡Will ¡I ¡develop ¡cancer? ¡ ¡ – How ¡obesity ¡correlates ¡with ¡breast ¡cancer? ¡ – Which ¡computa/onal ¡approach ¡can ¡discriminate ¡between ¡ "driver" ¡or ¡"passenger" ¡cancer ¡DNA ¡muta/ons? ¡ ¡ – How ¡can ¡specific ¡target ¡genes ¡be ¡assigned ¡to ¡epigene/cally ¡ defined ¡regulatory ¡regions? ¡ ¡ – How ¡do ¡epigene/c ¡modifica/ons ¡affect ¡DNA ¡synthesis ¡during ¡ the ¡replica/on ¡of ¡genomes? ¡ ¡ ER ¡2012 ¡-­‑ ¡Stefano ¡Ceri ¡ 10 ¡

  11. All ¡the ¡scenarios ¡require… ¡MODELS ¡ MODEL ¡ ¡ • Representa/on ¡of ¡the ¡problem ¡space ¡in ¡the ¡ICT ¡ vocabulary ¡(concepts, ¡data, ¡processes, ¡systems). ¡ • Computa/onal ¡abstrac/ons ¡extrac/ng ¡relevant ¡data ¡ from ¡input ¡data ¡ • Models ¡can: ¡ ¡ – Based ¡upon ¡analy/cal/sta/s/cal ¡laws ¡ – Based ¡upon ¡simula/ons, ¡extrac/ng ¡general ¡behaviors ¡from ¡ many ¡observa/ons ¡of ¡the ¡behavior ¡of ¡individuals ¡ – Based ¡upon ¡induc/ve ¡methods ¡applied ¡to ¡data ¡ • Challenge: ¡ ¡convergence ¡of ¡three ¡types ¡of ¡models ¡ ER ¡2012 ¡-­‑ ¡Stefano ¡Ceri ¡ 11 ¡

  12. Mo/va/ng ¡Context: ¡FutureICT ¡Flagship ¡ • SCIENCE: ¡The ¡ul/mate ¡goal ¡of ¡the ¡FuturICT ¡flagship ¡ project ¡is ¡to ¡understand ¡and ¡manage ¡complex, ¡global, ¡ socially ¡interac/ve ¡systems, ¡with ¡a ¡focus ¡on ¡ sustainability ¡and ¡resilience. ¡ ¡ • POLICY: ¡FuturICT ¡will ¡build ¡a ¡Living ¡Earth ¡Plasorm, ¡a ¡ simula/on, ¡visualiza/on ¡and ¡par/cipa/on ¡plasorm ¡to ¡ support ¡decision-­‑making ¡of ¡policy-­‑makers, ¡business ¡ people ¡and ¡ci/zens. ¡ ¡ • TECHNOLOGY: ¡Integra/ng ¡ICT, ¡Complexity ¡Science ¡and ¡ the ¡Social ¡Sciences ¡will ¡create ¡a ¡paradigm ¡shin, ¡ facilita/ng ¡a ¡symbio/c ¡co-­‑evolu/on ¡of ¡ICT ¡and ¡society. ¡ ¡ ¡ ER ¡2012 ¡-­‑ ¡Stefano ¡Ceri ¡ 12 ¡

  13. FuturICT ¡Vision ¡ ER ¡2012 ¡-­‑ ¡Stefano ¡Ceri ¡ 13 ¡

  14. A ¡s/mulus ¡from ¡FuturICT ¡vision: ¡ World-­‑of-­‑Modeling ¡Plasorm ¡ THEORY ¡ • Classify ¡models ¡by ¡type ¡and ¡describe ¡each ¡type’s ¡ proper/es. ¡ – Define ¡ (type-­‑aware) ¡strong ¡interoperability ¡ within ¡ the ¡elements ¡of ¡the ¡same ¡class ¡ ¡ – Define ¡ model ¡interoperability ¡ among ¡models ¡of ¡ different ¡classes ¡ PRACTICE ¡ • Build ¡language ¡abstrac/ons ¡and ¡sonware ¡ plasorms ¡suppor/ng ¡them ¡ ¡ ER ¡2012 ¡-­‑ ¡Stefano ¡Ceri ¡ 14 ¡

  15. Mega-­‑Modeling ¡Concept ¡ ER ¡2012 ¡-­‑ ¡Stefano ¡Ceri ¡ 15 ¡

  16. Mega-­‑Modeling ¡for ¡Scien/fic ¡Data ¡ • General ¡goal : ¡Building ¡a ¡model ¡of ¡models ¡-­‑ ¡which ¡ describes ¡each ¡model’s ¡proper/es ¡and ¡interac/ons ¡-­‑ ¡ for ¡suppor/ng ¡opera/ons ¡upon ¡models, ¡such ¡as ¡ selec/on, ¡inspec/on, ¡composi/on, ¡subs/tu/on, ¡ reduc/on, ¡extension, ¡and ¡search. ¡ • Keywords : ¡big ¡data, ¡data ¡pacerns, ¡management ¡of ¡ complexity, ¡uncertainty, ¡dynamic ¡composi/on, ¡ adapta/on. ¡ • Chris ¡Welty ¡(Jeopardy): ¡“Increasingly ¡computa/onal ¡ tasks ¡require ¡inexact ¡solu/ons ¡that ¡combine ¡mul/ple ¡ methods ¡in ¡unpredictable ¡ways” ¡(WWW ¡2012, ¡Lyon) ¡ ¡ ER ¡2012 ¡-­‑ ¡Stefano ¡Ceri ¡ 16 ¡

Recommend


More recommend