The Algorithmics of Information Diffusion Alessandro Panconesi - - PowerPoint PPT Presentation

the algorithmics of
SMART_READER_LITE
LIVE PREVIEW

The Algorithmics of Information Diffusion Alessandro Panconesi - - PowerPoint PPT Presentation

The Algorithmics of Information Diffusion Alessandro Panconesi Dipartimento di Informatica DAY 1 Computer Science is about computers no more than astronomy is about telescopes E.W. Dijkstra


slide-1
SLIDE 1

The Algorithmics of Information Diffusion

Alessandro Panconesi

Dipartimento di Informatica DAY 1

slide-2
SLIDE 2

Computer ¡Science ¡is ¡about ¡computers ¡no ¡more ¡ than ¡astronomy ¡is ¡about ¡telescopes ¡

E.W. ¡Dijkstra ¡

slide-3
SLIDE 3

THE ¡STARS ¡

slide-4
SLIDE 4

PEOPLE ¡

slide-5
SLIDE 5

The ¡INTERNET ¡is ¡an ¡observatory ¡on ¡Crowds ¡

slide-6
SLIDE 6

No ¡one ¡would ¡have ¡believed ¡in ¡the ¡first ¡years ¡of ¡the ¡XXI ¡century ¡ that ¡this ¡world ¡was ¡being ¡watched ¡keenly ¡and ¡closely ¡by ¡ awesome ¡compuGng ¡and ¡financial ¡powers; ¡that ¡as ¡people ¡busied ¡ themselves ¡about ¡their ¡various ¡concerns ¡they ¡were ¡scruGnised ¡ and ¡studied, ¡perhaps ¡almost ¡as ¡narrowly ¡as ¡a ¡person ¡with ¡a ¡ microscope ¡might ¡scruGnise ¡the ¡transient ¡creatures ¡that ¡swarm ¡ and ¡mulGply ¡in ¡a ¡drop ¡of ¡water. ¡… ¡ Adapted ¡from ¡“The ¡War ¡of ¡the ¡Worlds” ¡by ¡H.G.Wells ¡

slide-7
SLIDE 7

A ¡Paradigm ¡ShiO ¡

slide-8
SLIDE 8

A ¡Paradigm ¡ShiO ¡

slide-9
SLIDE 9

COURSE ¡OUTLINE ¡

  • We ¡will ¡use ¡a ¡couple ¡of ¡“case ¡studies” ¡to.. ¡
  • ..hopefully ¡show ¡interesDng ¡results ¡
  • ..illustrate ¡the ¡main ¡thrust ¡of ¡this ¡research ¡

area ¡

  • I ¡will ¡give: ¡

– An ¡overview ¡of ¡results ¡ – But ¡also ¡delve ¡deep ¡into ¡some ¡results, ¡to ¡get ¡the ¡ (mathemaDcal) ¡flavour ¡of ¡the ¡kind ¡of ¡results ¡one ¡ can ¡hope ¡to ¡establish ¡

slide-10
SLIDE 10

LECTURE ¡OUTLINE ¡

  • We ¡will ¡revisit ¡a ¡classic ¡social ¡psychology ¡

experiment ¡in ¡order ¡to ¡see.. ¡

  • …how ¡BIG ¡DATA ¡opens ¡new ¡opportuniDes ¡for ¡

making ¡social ¡science ¡more ¡rigorous ¡

  • …and ¡the ¡virtuous ¡interplay ¡between ¡

mathemaDcal ¡models ¡and ¡empirical ¡

  • bservaDons ¡
slide-11
SLIDE 11

COMPUTATIONAL ¡SOCIAL ¡SCIENCE? ¡

slide-12
SLIDE 12

A ¡CLASSIC ¡REVISITED ¡

slide-13
SLIDE 13

Omaha ¡vs ¡Boston ¡

slide-14
SLIDE 14
slide-15
SLIDE 15
slide-16
SLIDE 16
slide-17
SLIDE 17
slide-18
SLIDE 18
slide-19
SLIDE 19
slide-20
SLIDE 20
slide-21
SLIDE 21

Zeroing ¡in ¡

slide-22
SLIDE 22

Outcome ¡

30% ¡of ¡the ¡leXers ¡reached ¡the ¡target ¡ Average ¡(median) ¡chain ¡length ¡was ¡ roughly ¡six ¡

slide-23
SLIDE 23

Outcome ¡

  • 1. Average ¡path ¡length, ¡5.2 ¡
  • 2. ¡Bimodality ¡is ¡not ¡accident: ¡

target ¡reached ¡through ¡

  • hometown, ¡6.1 ¡
  • business ¡contacts, ¡4.6 ¡
  • 3. ¡Role ¡of ¡geography ¡
  • Boston, ¡4.4 ¡
  • Nebraska, ¡5.5 ¡
  • 4. ¡Role ¡of ¡occupaGon ¡
  • random, ¡5.7 ¡
  • stockholders, ¡5.4 ¡
slide-24
SLIDE 24

Conjectures ¡

Take ¡any ¡two ¡people ¡in ¡ the ¡world, ¡and ¡they ¡will ¡ be ¡connected ¡by ¡a ¡very ¡ short ¡chain ¡of ¡ acquaintances ¡

slide-25
SLIDE 25

Milgram’s ¡wonderful ¡conjecture ¡

Given ¡any ¡two ¡people ¡in ¡the ¡world, ¡ ¡ they ¡will ¡always ¡be ¡connected ¡by ¡a ¡short ¡chain ¡of ¡acquaintances ¡

slide-26
SLIDE 26

Is ¡Milgram’s ¡conjecture ¡true? ¡

slide-27
SLIDE 27

A ¡maXer ¡of ¡scale ¡

300 ¡

slide-28
SLIDE 28

A ¡maXer ¡of ¡scale ¡

300 ¡ 60,000 ¡

slide-29
SLIDE 29

A ¡maXer ¡of ¡scale ¡

300 ¡ 60,000 ¡ 230,000,000 ¡

slide-30
SLIDE 30

A ¡maXer ¡of ¡scale ¡

300 ¡ 60,000 ¡ 750,000,000 ¡ 230,000,000 ¡

slide-31
SLIDE 31

A ¡maXer ¡of ¡scale ¡

300 ¡ 60,000 ¡ 750,000,000 ¡ 230,000,000 ¡

Six ¡orders ¡of ¡magnitude!! ¡

slide-32
SLIDE 32
slide-33
SLIDE 33

Salient ¡properDes ¡

  • Social ¡networks ¡exhibit ¡

special ¡properDes, ¡eg ¡ they ¡have ¡many ¡ triangles ¡and ¡are ¡ “small ¡worlds” ¡

  • …can ¡we ¡come ¡up ¡with ¡

simple ¡mathemaDcal ¡ models ¡(stochasDc ¡ graphs) ¡that ¡reproduce ¡ them? ¡

slide-34
SLIDE 34

WaXs ¡& ¡Strogatz ¡

slide-35
SLIDE 35

WaXs ¡& ¡Strogatz ¡

slide-36
SLIDE 36

WaXs ¡& ¡Strogatz ¡

slide-37
SLIDE 37

WaXs ¡& ¡Strogatz ¡

slide-38
SLIDE 38

WaXs ¡& ¡Strogatz ¡

slide-39
SLIDE 39

WaXs ¡& ¡Strogatz ¡

slide-40
SLIDE 40

Chaos ¡out ¡of ¡order ¡

slide-41
SLIDE 41

Coexistence ¡

slide-42
SLIDE 42

Coexistence ¡

RaDo ¡between ¡ average ¡path ¡lengths ¡ RaDo ¡between ¡ clustering ¡ coefficients ¡

slide-43
SLIDE 43

Coexistence ¡

RaDo ¡between ¡ average ¡path ¡lengths ¡ RaDo ¡between ¡ clustering ¡ coefficients ¡ Graphs ¡in ¡this ¡region ¡have ¡ both ¡high ¡clustering ¡ coefficient ¡and ¡small ¡ diameter ¡

slide-44
SLIDE 44

NEW ¡INSIGHTS ¡

slide-45
SLIDE 45

The true mystery ¡

slide-46
SLIDE 46

The true mystery ¡

slide-47
SLIDE 47

The true mystery ¡

slide-48
SLIDE 48

The true mystery ¡

slide-49
SLIDE 49

Rebel ¡King ¡

There ¡is ¡a ¡ unique ¡ distribuDon ¡of ¡ long ¡links ¡ compaDble ¡ with ¡Milgram’s ¡ experiment ¡

slide-50
SLIDE 50

Kleinberg’s ¡Model ¡

slide-51
SLIDE 51

Kleinberg’s ¡Model ¡

slide-52
SLIDE 52

Long ¡Links ¡

  • A ¡long ¡link ¡uv ¡is ¡inserted ¡with ¡probability ¡

(proporDonal ¡to) ¡

1 d(u, v)α

slide-53
SLIDE 53

Long ¡Links ¡

  • A ¡long ¡link ¡uv ¡is ¡inserted ¡with ¡probability ¡

(proporDonal ¡to) ¡

1 d(u, v)α

Later ¡we ¡will ¡ analyze ¡Kleinberg’s ¡ result ¡in ¡some ¡ detail ¡

slide-54
SLIDE 54

Disappointments ¡

The ¡networks ¡of ¡WaXs&Strogatz ¡do ¡have ¡small ¡diameter ¡ (every ¡pair ¡of ¡nodes ¡is ¡connected ¡by ¡a ¡short ¡path) ¡but ¡ Milgram’s ¡experiment ¡cannot ¡succeed ¡in ¡them! ¡

slide-55
SLIDE 55

PREDICTIONS ¡

slide-56
SLIDE 56

Non-­‑uniform ¡density ¡

slide-57
SLIDE 57

Non-­‑uniform ¡density ¡

[Liben-­‑Nowell ¡et ¡ al] ¡

 Dot ¡for ¡every ¡

inhabited ¡ locaDon ¡

 Each ¡circle ¡

represents ¡ 50,000 ¡nodes ¡

 Centered ¡at ¡

Ithaca, ¡NY ¡

slide-58
SLIDE 58

Rank ¡

RANK=7 ¡ For ¡homegenous ¡densiDes ¡we ¡recover ¡ Kleinberg’s ¡distribuDon ¡ v ¡

slide-59
SLIDE 59

Test ¡with ¡LIVE ¡JOURNAL ¡

slide-60
SLIDE 60

Test ¡with ¡LIVE ¡JOURNAL ¡

slide-61
SLIDE 61

Test ¡with ¡FACEBOOK ¡

slide-62
SLIDE 62

Recap ¡

  • We ¡have ¡seen ¡how ¡BIG ¡DATA ¡has ¡th ¡epotenDal ¡

to ¡change ¡dramaDcally ¡the ¡social ¡sciences ¡

  • Social ¡processes ¡can ¡be ¡observed ¡with ¡a ¡

wealth ¡of ¡data ¡and ¡mathemaDcal ¡models ¡can ¡ be ¡developed ¡to ¡capture ¡and ¡predict ¡(to ¡some ¡ extent) ¡their ¡evoluDon ¡

slide-63
SLIDE 63

Recap ¡

  • There ¡is ¡a ¡virtuous ¡interplay ¡between ¡

empirical ¡observaDons ¡and ¡mathemaDcal ¡ modelling ¡

  • Some ¡of ¡the ¡problems ¡are ¡inherently ¡

algorithmic ¡ ¡

slide-64
SLIDE 64

PARADOXES ¡

slide-65
SLIDE 65

Digital ¡Traces ¡

slide-66
SLIDE 66

The ¡Grand ¡Challenge ¡

slide-67
SLIDE 67

The Grand Challenge

What can we reconstruct the

  • riginal diffusion

process from the huge, and yet scanty, digital traces?

slide-68
SLIDE 68

A ¡nice ¡example ¡

Internet ¡AcDvism ¡

slide-69
SLIDE 69

FINAL ¡REMARKS ¡

  • Paradigm ¡ship ¡in ¡the ¡social ¡sciences? ¡
  • InteresDng ¡algorithmic ¡quesDons ¡ ¡
  • Interplay ¡between ¡data ¡mining ¡(observaDons) ¡

and ¡modelling: ¡

– ObservaDons ¡inspire ¡models ¡ – Models ¡guide ¡observaDons ¡ – RelaDvely ¡good ¡quanDtaDve ¡predicDons ¡are ¡ possible ¡

slide-70
SLIDE 70

THANKS ¡