The Algorithmics of Information Diffusion
Alessandro Panconesi
Dipartimento di Informatica DAY 1
The Algorithmics of Information Diffusion Alessandro Panconesi - - PowerPoint PPT Presentation
The Algorithmics of Information Diffusion Alessandro Panconesi Dipartimento di Informatica DAY 1 Computer Science is about computers no more than astronomy is about telescopes E.W. Dijkstra
Alessandro Panconesi
Dipartimento di Informatica DAY 1
Computer ¡Science ¡is ¡about ¡computers ¡no ¡more ¡ than ¡astronomy ¡is ¡about ¡telescopes ¡
E.W. ¡Dijkstra ¡
The ¡INTERNET ¡is ¡an ¡observatory ¡on ¡Crowds ¡
No ¡one ¡would ¡have ¡believed ¡in ¡the ¡first ¡years ¡of ¡the ¡XXI ¡century ¡ that ¡this ¡world ¡was ¡being ¡watched ¡keenly ¡and ¡closely ¡by ¡ awesome ¡compuGng ¡and ¡financial ¡powers; ¡that ¡as ¡people ¡busied ¡ themselves ¡about ¡their ¡various ¡concerns ¡they ¡were ¡scruGnised ¡ and ¡studied, ¡perhaps ¡almost ¡as ¡narrowly ¡as ¡a ¡person ¡with ¡a ¡ microscope ¡might ¡scruGnise ¡the ¡transient ¡creatures ¡that ¡swarm ¡ and ¡mulGply ¡in ¡a ¡drop ¡of ¡water. ¡… ¡ Adapted ¡from ¡“The ¡War ¡of ¡the ¡Worlds” ¡by ¡H.G.Wells ¡
COURSE ¡OUTLINE ¡
area ¡
– An ¡overview ¡of ¡results ¡ – But ¡also ¡delve ¡deep ¡into ¡some ¡results, ¡to ¡get ¡the ¡ (mathemaDcal) ¡flavour ¡of ¡the ¡kind ¡of ¡results ¡one ¡ can ¡hope ¡to ¡establish ¡
LECTURE ¡OUTLINE ¡
experiment ¡in ¡order ¡to ¡see.. ¡
making ¡social ¡science ¡more ¡rigorous ¡
mathemaDcal ¡models ¡and ¡empirical ¡
COMPUTATIONAL ¡SOCIAL ¡SCIENCE? ¡
A ¡CLASSIC ¡REVISITED ¡
Omaha ¡vs ¡Boston ¡
Zeroing ¡in ¡
Outcome ¡
30% ¡of ¡the ¡leXers ¡reached ¡the ¡target ¡ Average ¡(median) ¡chain ¡length ¡was ¡ roughly ¡six ¡
Outcome ¡
target ¡reached ¡through ¡
Conjectures ¡
Take ¡any ¡two ¡people ¡in ¡ the ¡world, ¡and ¡they ¡will ¡ be ¡connected ¡by ¡a ¡very ¡ short ¡chain ¡of ¡ acquaintances ¡
Milgram’s ¡wonderful ¡conjecture ¡
Given ¡any ¡two ¡people ¡in ¡the ¡world, ¡ ¡ they ¡will ¡always ¡be ¡connected ¡by ¡a ¡short ¡chain ¡of ¡acquaintances ¡
Is ¡Milgram’s ¡conjecture ¡true? ¡
A ¡maXer ¡of ¡scale ¡
300 ¡
A ¡maXer ¡of ¡scale ¡
300 ¡ 60,000 ¡
A ¡maXer ¡of ¡scale ¡
300 ¡ 60,000 ¡ 230,000,000 ¡
A ¡maXer ¡of ¡scale ¡
300 ¡ 60,000 ¡ 750,000,000 ¡ 230,000,000 ¡
A ¡maXer ¡of ¡scale ¡
300 ¡ 60,000 ¡ 750,000,000 ¡ 230,000,000 ¡
Six ¡orders ¡of ¡magnitude!! ¡
Salient ¡properDes ¡
special ¡properDes, ¡eg ¡ they ¡have ¡many ¡ triangles ¡and ¡are ¡ “small ¡worlds” ¡
simple ¡mathemaDcal ¡ models ¡(stochasDc ¡ graphs) ¡that ¡reproduce ¡ them? ¡
WaXs ¡& ¡Strogatz ¡
WaXs ¡& ¡Strogatz ¡
WaXs ¡& ¡Strogatz ¡
WaXs ¡& ¡Strogatz ¡
WaXs ¡& ¡Strogatz ¡
WaXs ¡& ¡Strogatz ¡
Chaos ¡out ¡of ¡order ¡
Coexistence ¡
Coexistence ¡
RaDo ¡between ¡ average ¡path ¡lengths ¡ RaDo ¡between ¡ clustering ¡ coefficients ¡
Coexistence ¡
RaDo ¡between ¡ average ¡path ¡lengths ¡ RaDo ¡between ¡ clustering ¡ coefficients ¡ Graphs ¡in ¡this ¡region ¡have ¡ both ¡high ¡clustering ¡ coefficient ¡and ¡small ¡ diameter ¡
The true mystery ¡
The true mystery ¡
The true mystery ¡
The true mystery ¡
Rebel ¡King ¡
There ¡is ¡a ¡ unique ¡ distribuDon ¡of ¡ long ¡links ¡ compaDble ¡ with ¡Milgram’s ¡ experiment ¡
Kleinberg’s ¡Model ¡
Kleinberg’s ¡Model ¡
Long ¡Links ¡
(proporDonal ¡to) ¡
1 d(u, v)α
Long ¡Links ¡
(proporDonal ¡to) ¡
1 d(u, v)α
Later ¡we ¡will ¡ analyze ¡Kleinberg’s ¡ result ¡in ¡some ¡ detail ¡
Disappointments ¡
The ¡networks ¡of ¡WaXs&Strogatz ¡do ¡have ¡small ¡diameter ¡ (every ¡pair ¡of ¡nodes ¡is ¡connected ¡by ¡a ¡short ¡path) ¡but ¡ Milgram’s ¡experiment ¡cannot ¡succeed ¡in ¡them! ¡
PREDICTIONS ¡
Non-‑uniform ¡density ¡
Non-‑uniform ¡density ¡
[Liben-‑Nowell ¡et ¡ al] ¡
Dot ¡for ¡every ¡
inhabited ¡ locaDon ¡
Each ¡circle ¡
represents ¡ 50,000 ¡nodes ¡
Centered ¡at ¡
Ithaca, ¡NY ¡
RANK=7 ¡ For ¡homegenous ¡densiDes ¡we ¡recover ¡ Kleinberg’s ¡distribuDon ¡ v ¡
Test ¡with ¡LIVE ¡JOURNAL ¡
Test ¡with ¡LIVE ¡JOURNAL ¡
Test ¡with ¡FACEBOOK ¡
Recap ¡
to ¡change ¡dramaDcally ¡the ¡social ¡sciences ¡
wealth ¡of ¡data ¡and ¡mathemaDcal ¡models ¡can ¡ be ¡developed ¡to ¡capture ¡and ¡predict ¡(to ¡some ¡ extent) ¡their ¡evoluDon ¡
Recap ¡
empirical ¡observaDons ¡and ¡mathemaDcal ¡ modelling ¡
algorithmic ¡ ¡
PARADOXES ¡
Digital ¡Traces ¡
The ¡Grand ¡Challenge ¡
The Grand Challenge
What can we reconstruct the
process from the huge, and yet scanty, digital traces?
A ¡nice ¡example ¡
Internet ¡AcDvism ¡
FINAL ¡REMARKS ¡
and ¡modelling: ¡
– ObservaDons ¡inspire ¡models ¡ – Models ¡guide ¡observaDons ¡ – RelaDvely ¡good ¡quanDtaDve ¡predicDons ¡are ¡ possible ¡
THANKS ¡