the algorithmics of
play

The Algorithmics of Information Diffusion Alessandro Panconesi - PowerPoint PPT Presentation

The Algorithmics of Information Diffusion Alessandro Panconesi Dipartimento di Informatica DAY 1 Computer Science is about computers no more than astronomy is about telescopes E.W. Dijkstra


  1. The Algorithmics of Information Diffusion Alessandro Panconesi Dipartimento di Informatica DAY 1

  2. Computer ¡Science ¡is ¡about ¡computers ¡no ¡more ¡ than ¡astronomy ¡is ¡about ¡telescopes ¡ E.W. ¡Dijkstra ¡

  3. THE ¡STARS ¡

  4. PEOPLE ¡

  5. The ¡INTERNET ¡is ¡an ¡observatory ¡on ¡Crowds ¡

  6. No ¡one ¡would ¡have ¡believed ¡in ¡the ¡first ¡years ¡of ¡the ¡XXI ¡century ¡ that ¡this ¡world ¡was ¡being ¡watched ¡keenly ¡and ¡closely ¡by ¡ awesome ¡compuGng ¡and ¡financial ¡powers; ¡that ¡as ¡people ¡busied ¡ themselves ¡about ¡their ¡various ¡concerns ¡they ¡were ¡scruGnised ¡ and ¡studied, ¡perhaps ¡almost ¡as ¡narrowly ¡as ¡a ¡person ¡with ¡a ¡ microscope ¡might ¡scruGnise ¡the ¡transient ¡creatures ¡that ¡swarm ¡ and ¡mulGply ¡in ¡a ¡drop ¡of ¡water. ¡… ¡ Adapted ¡from ¡“The ¡War ¡of ¡the ¡Worlds” ¡by ¡H.G.Wells ¡

  7. A ¡Paradigm ¡ShiO ¡

  8. A ¡Paradigm ¡ShiO ¡

  9. COURSE ¡OUTLINE ¡ • We ¡will ¡use ¡a ¡couple ¡of ¡“case ¡studies” ¡to.. ¡ • ..hopefully ¡show ¡interesDng ¡results ¡ • ..illustrate ¡the ¡main ¡thrust ¡of ¡this ¡research ¡ area ¡ • I ¡will ¡give: ¡ – An ¡overview ¡of ¡results ¡ – But ¡also ¡delve ¡deep ¡into ¡some ¡results, ¡to ¡get ¡the ¡ (mathemaDcal) ¡flavour ¡of ¡the ¡kind ¡of ¡results ¡one ¡ can ¡hope ¡to ¡establish ¡

  10. LECTURE ¡OUTLINE ¡ • We ¡will ¡revisit ¡a ¡classic ¡social ¡psychology ¡ experiment ¡in ¡order ¡to ¡see.. ¡ • …how ¡BIG ¡DATA ¡opens ¡new ¡opportuniDes ¡for ¡ making ¡social ¡science ¡more ¡rigorous ¡ • …and ¡the ¡virtuous ¡interplay ¡between ¡ mathemaDcal ¡models ¡and ¡empirical ¡ observaDons ¡

  11. COMPUTATIONAL ¡SOCIAL ¡SCIENCE? ¡

  12. A ¡CLASSIC ¡REVISITED ¡

  13. Omaha ¡vs ¡Boston ¡

  14. Zeroing ¡in ¡

  15. Outcome ¡ 30% ¡of ¡the ¡leXers ¡reached ¡the ¡target ¡ Average ¡(median) ¡chain ¡length ¡was ¡ roughly ¡six ¡

  16. Outcome ¡ 1. Average ¡path ¡length , ¡5.2 ¡ 2. ¡ Bimodality ¡is ¡not ¡accident : ¡ target ¡reached ¡through ¡ hometown, ¡6.1 ¡ • business ¡contacts, ¡4.6 ¡ • 3. ¡ Role ¡of ¡geography ¡ Boston, ¡4.4 ¡ • Nebraska, ¡5.5 ¡ • 4. ¡ Role ¡of ¡occupaGon ¡ random, ¡5.7 ¡ • stockholders, ¡5.4 ¡ •

  17. Conjectures ¡ Take ¡any ¡two ¡people ¡in ¡ the ¡world, ¡and ¡they ¡will ¡ be ¡connected ¡by ¡a ¡very ¡ short ¡chain ¡of ¡ acquaintances ¡

  18. Milgram’s ¡wonderful ¡conjecture ¡ Given ¡any ¡two ¡people ¡in ¡the ¡world, ¡ ¡ they ¡will ¡always ¡be ¡connected ¡by ¡a ¡short ¡chain ¡of ¡acquaintances ¡

  19. Is ¡Milgram’s ¡conjecture ¡true? ¡

  20. A ¡maXer ¡of ¡scale ¡ 300 ¡

  21. A ¡maXer ¡of ¡scale ¡ 300 ¡ 60,000 ¡

  22. A ¡maXer ¡of ¡scale ¡ 300 ¡ 60,000 ¡ 230,000,000 ¡

  23. A ¡maXer ¡of ¡scale ¡ 300 ¡ 60,000 ¡ 230,000,000 ¡ 750,000,000 ¡

  24. A ¡maXer ¡of ¡scale ¡ 300 ¡ 60,000 ¡ 230,000,000 ¡ 750,000,000 ¡ Six ¡orders ¡of ¡magnitude!! ¡

  25. Salient ¡properDes ¡ • Social ¡networks ¡exhibit ¡ special ¡properDes, ¡eg ¡ they ¡have ¡many ¡ triangles ¡and ¡are ¡ “small ¡worlds” ¡ • …can ¡we ¡come ¡up ¡with ¡ simple ¡mathemaDcal ¡ models ¡(stochasDc ¡ graphs) ¡that ¡reproduce ¡ them? ¡

  26. WaXs ¡& ¡Strogatz ¡

  27. WaXs ¡& ¡Strogatz ¡

  28. WaXs ¡& ¡Strogatz ¡

  29. WaXs ¡& ¡Strogatz ¡

  30. WaXs ¡& ¡Strogatz ¡

  31. WaXs ¡& ¡Strogatz ¡

  32. Chaos ¡out ¡of ¡order ¡

  33. Coexistence ¡

  34. RaDo ¡between ¡ Coexistence ¡ clustering ¡ coefficients ¡ RaDo ¡between ¡ average ¡path ¡lengths ¡

  35. RaDo ¡between ¡ Coexistence ¡ clustering ¡ coefficients ¡ Graphs ¡in ¡this ¡region ¡have ¡ RaDo ¡between ¡ both ¡high ¡clustering ¡ average ¡path ¡lengths ¡ coefficient ¡and ¡small ¡ diameter ¡

  36. NEW ¡INSIGHTS ¡

  37. The true mystery ¡

  38. The true mystery ¡

  39. The true mystery ¡

  40. The true mystery ¡

  41. Rebel ¡King ¡ There ¡is ¡a ¡ unique ¡ distribuDon ¡of ¡ long ¡links ¡ compaDble ¡ with ¡Milgram’s ¡ experiment ¡

  42. Kleinberg’s ¡Model ¡

  43. Kleinberg’s ¡Model ¡

  44. Long ¡Links ¡ • A ¡long ¡link ¡uv ¡is ¡inserted ¡with ¡probability ¡ (proporDonal ¡to) ¡ 1 d ( u, v ) α

  45. Long ¡Links ¡ • A ¡long ¡link ¡uv ¡is ¡inserted ¡with ¡probability ¡ (proporDonal ¡to) ¡ Later ¡we ¡will ¡ 1 analyze ¡Kleinberg’s ¡ result ¡in ¡some ¡ detail ¡ d ( u, v ) α

  46. Disappointments ¡ The ¡networks ¡of ¡WaXs&Strogatz ¡do ¡have ¡small ¡diameter ¡ (every ¡pair ¡of ¡nodes ¡is ¡connected ¡by ¡a ¡short ¡path) ¡but ¡ Milgram’s ¡experiment ¡cannot ¡succeed ¡in ¡them! ¡

  47. PREDICTIONS ¡

  48. Non-­‑uniform ¡density ¡

  49. Non-­‑uniform ¡density ¡ [Liben-­‑Nowell ¡et ¡ al] ¡  Dot ¡for ¡every ¡ inhabited ¡ locaDon ¡  Each ¡circle ¡ represents ¡ 50,000 ¡nodes ¡  Centered ¡at ¡ Ithaca, ¡NY ¡

  50. Rank ¡ RANK=7 ¡ v ¡ For ¡homegenous ¡densiDes ¡we ¡recover ¡ Kleinberg’s ¡distribuDon ¡

  51. Test ¡with ¡LIVE ¡JOURNAL ¡

  52. Test ¡with ¡LIVE ¡JOURNAL ¡

  53. Test ¡with ¡FACEBOOK ¡

  54. Recap ¡ • We ¡have ¡seen ¡how ¡BIG ¡DATA ¡has ¡th ¡epotenDal ¡ to ¡change ¡dramaDcally ¡the ¡social ¡sciences ¡ • Social ¡processes ¡can ¡be ¡observed ¡with ¡a ¡ wealth ¡of ¡data ¡and ¡mathemaDcal ¡models ¡can ¡ be ¡developed ¡to ¡capture ¡and ¡predict ¡(to ¡some ¡ extent) ¡their ¡evoluDon ¡

  55. Recap ¡ • There ¡is ¡a ¡virtuous ¡interplay ¡between ¡ empirical ¡observaDons ¡and ¡mathemaDcal ¡ modelling ¡ • Some ¡of ¡the ¡problems ¡are ¡inherently ¡ algorithmic ¡ ¡

  56. PARADOXES ¡

  57. Digital ¡Traces ¡

  58. The ¡Grand ¡Challenge ¡

  59. The Grand Challenge What can we reconstruct the original diffusion process from the huge, and yet scanty, digital traces?

  60. A ¡nice ¡example ¡ Internet ¡AcDvism ¡

  61. FINAL ¡REMARKS ¡ • Paradigm ¡ship ¡in ¡the ¡social ¡sciences? ¡ • InteresDng ¡algorithmic ¡quesDons ¡ ¡ • Interplay ¡between ¡data ¡mining ¡(observaDons) ¡ and ¡modelling: ¡ – ObservaDons ¡inspire ¡models ¡ – Models ¡guide ¡observaDons ¡ – RelaDvely ¡good ¡quanDtaDve ¡predicDons ¡are ¡ possible ¡

  62. THANKS ¡

Recommend


More recommend