CS224W: ¡Social ¡and ¡Information ¡Network ¡Analysis ¡ Lada ¡Adamic ¡ http://cs224w.stanford.edu ¡
Stanford ¡Social ¡Web ¡(ca. ¡1999) ¡ network ¡of ¡personal ¡homepages ¡at ¡Stanford ¡
different ¡notions ¡of ¡centrality ¡ In each of the following networks, X has higher centrality than Y according to a particular measure Y X X Y X X Y Y indegree outdegree betweenness closeness
review: ¡indegree ¡ X Y
trade ¡in ¡petroleum ¡and ¡ petroleum ¡products, ¡1998, ¡ source: ¡NBER-‑United ¡ Nations ¡Trade ¡Data ¡
¡ ¡Which ¡countries ¡have ¡high ¡indegree ¡(import ¡ petroleum ¡and ¡petroleum ¡products ¡from ¡ many ¡others) ¡ § Saudi ¡Arabia ¡ § Japan ¡ § Iraq ¡ § USA ¡ § Venezuela ¡
review: ¡outdegree ¡ X Y
Qatar Australia Taiwan Indonesia South Africa Angola Thailand Gabon Untd Arab Em Spain Mexico Oman India Japan Colombia Nigeria China Saudi Arabia Venezuela USA Korea Rep. Malaysia Canada Kuwait Iraq Singapore Iran Libya UK Algeria China HK SAR France,Monac Norway Italy Netherlands Germany trade ¡in ¡petroleum ¡and ¡ petroleum ¡products, ¡1998, ¡ Poland Sweden Belgium-Lux source: ¡NBER-‑United ¡ Russian Fed Nations ¡Trade ¡Data ¡
¡ ¡Which ¡country ¡has ¡low ¡outdegree ¡but ¡exports ¡a ¡ significant ¡quanDty ¡(thickness ¡of ¡the ¡edges ¡ represents ¡$$ ¡value ¡of ¡export) ¡of ¡petroleum ¡ products ¡ Qatar Australia § Saudi ¡Arabia ¡ Taiwan Indonesia Angola South Africa Thailand § Japan ¡ Gabon Untd Arab Em Spain Mexico Oman India § Iraq ¡ Japan Colombia Nigeria China Saudi Arabia Venezuela USA § USA ¡ Korea Rep. Malaysia Canada Kuwait Iraq Singapore Iran § Venezuela ¡ Libya UK Algeria China HK SAR France,Monac Norway Netherlands Italy Germany Poland Sweden Belgium-Lux Russian Fed
Uruguay Benin Ghana Niger Liberia Paraguay Sudan TFYR Macedna Burkina Faso Bolivia Malta Guinea Cyprus Peru Sri Lanka New Zealand Senegal Panama Costa Rica Dem.Rp.Congo Cote Divoire Papua N.Guin Morocco Pakistan Portugal El Salvador Mauritania Switz.Liecht Viet Nam Myanmar Nicaragua Malaysia Chile Thailand Australia Untd Arab Em Yemen Argentina Qatar Oman Taiwan Angola Singapore Indonesia Trinidad Tbg Jamaica Gabon Korea Rep. Brazil China Ecuador India Japan Kuwait Colombia USA Nigeria Venezuela Philippines Afghanistan Saudi Arabia Tunisia Iran Canada Mexico Greece Netherlands South Africa Iraq Turkey UK Belgium-Lux Norway Spain France,Monac trade ¡in ¡ crude ¡petroleum ¡ Denmark Algeria Italy and ¡petroleum ¡products, ¡ Germany Sweden Libya Guatemala 1998, ¡source: ¡NBER-‑United ¡ Nations ¡Trade ¡Data ¡ Syria Russian Fed Korea D P Rp Romania Egypt Finland Ukraine Bulgaria Ireland Czech Rep Hungary Israel Slovakia Kazakhstan Gibraltar Lithuania Armenia Poland Cuba Cameroon Dominican Rp Mongolia Barbados Uzbekistan Bahamas Azerbaijan Croatia Bermuda Georgia Austria Belarus Yugoslavia Slovenia Estonia Latvia
putting ¡numbers ¡to ¡it ¡ Undirected degree, e.g. nodes with more friends are more central. Assumption: the connections that your friend has don't matter, it is what they can do directly that does (e.g. go have a beer with you, help you build a deck...)
normalization ¡ divide degree by the max. possible, i.e. (N-1)
centralization: ¡skew ¡in ¡distribution ¡ How much variation is there in the centrality scores among the nodes? Freeman ’ s general formula for centralization (can use other metrics, e.g. gini coefficient or standard deviation): maximum value in the network g [ ] ∑ C D ( n * ) − C D ( i ) i = 1 C D = [( N − 1)( N − 2)]
degree ¡centralization ¡examples ¡ C D = 0.167 C D = 1.0 C D = 0.167
real-‑world ¡examples ¡ example financial trading networks low in-centralization: high in-centralization: buying is more evenly one node buying from distributed many others
In what ways does degree fail to capture centrality in the following graphs?
Stanford ¡Social ¡Web ¡(ca. ¡1999) ¡ network ¡of ¡personal ¡homepages ¡at ¡Stanford ¡
Y X
¡ intuition: how many pairs of individuals would have to go through you in order to reach one another in the minimum number of hops? Y X
Betweenness: ¡definition ¡ ∑ C B ( i ) = g jk ( i )/ g jk j < k Where g jk = the number of shortest paths connecting jk g jk (i) = the number that actor i is on. Usually normalized by: ' ( i ) = C B ( i )/[( n − 1)( n − 2)/2] C B number of pairs of vertices excluding the vertex itself
¡ non-normalized version:
¡ non-normalized version: A B C D E n A lies between no two other vertices n B lies between A and 3 other vertices: C, D, and E n C lies between 4 pairs of vertices (A,D),(A,E),(B,D),(B,E) n note that there are no alternate paths for these pairs to take, so C gets full credit
¡ non-normalized version:
¡ non-normalized version: n why do C and D each have betweenness 1? C n They are both on shortest paths for pairs (A,E), and (B,E), and so must share credit: n ½ + ½ = 1 A E B D
¡ What ¡is ¡the ¡betweenness ¡of ¡node ¡E? ¡ E
betweenness: ¡example ¡ Lada ’ s old Facebook network: nodes are sized by degree, and colored by betweenness.
Q: ¡high ¡betweenness, ¡low ¡degree ¡ ¤ Find a node that has high betweenness but low degree
Q: ¡low ¡betweenness, ¡high ¡degree ¡ ¤ Find a node that has low betweenness but high degree
¡ What if it ’ s not so important to have many direct friends? ¡ Or be “ between ” others ¡ But one still wants to be in the “ middle ” of things, not too far from the center
need ¡not ¡be ¡in ¡a ¡brokerage ¡position ¡ Y Y X X X Y
closeness: ¡definition ¡ Closeness is based on the length of the average shortest path between a node and all other nodes in the network Closeness Centrality: − 1 # & N ∑ C c ( i ) = d ( i , j ) % ( % ( $ ' j = 1 Normalized Closeness Centrality ' ( i ) = ( C C ( i ))/( N − 1) C C
Closeness: ¡toy ¡example ¡ A B C D E − 1 # N & ∑ d ( A , j ) % ( − 1 − 1 # & # & = 1 + 2 + 3 + 4 = 10 ' ( A ) = % ( j = 1 C c = 0.4 % ( % ( % ( N − 1 $ 4 ' $ 4 ' % ( $ '
Closeness: ¡more ¡toy ¡examples ¡
Q:high ¡degree, ¡low ¡closeness ¡ Which ¡node ¡has ¡ relatively ¡high ¡degree ¡ but ¡low ¡closeness? ¡
¡ ¡How ¡central ¡you ¡are ¡depends ¡on ¡how ¡central ¡ your ¡neighbors ¡are ¡
Bonacich ¡eigenvector ¡centrality ¡ ∑ c i ( β ) = ( α + β c j ) A ji j c ( β ) = α ( I − β A ) − 1 A 1 • α is a normalization constant • β determines how important the centrality of your neighbors is • A is the adjacency matrix (can be weighted) • I is the identity matrix (1s down the diagonal, 0 off-diagonal) • 1 is a matrix of all ones.
Bonacich ¡Power ¡Centrality: ¡attenuation ¡factor ¡ β small β è ¡high ¡attenuation ¡ ¡only ¡your ¡immediate ¡friends ¡matter, ¡and ¡their ¡ importance ¡is ¡factored ¡in ¡only ¡a ¡bit ¡ ¡ high ¡ β è ¡low ¡attenuation ¡ ¡global ¡network ¡structure ¡matters ¡(your ¡friends, ¡ your ¡friends' ¡of ¡friends ¡etc.) ¡ ¡ β ¡= ¡0 ¡yields ¡simple ¡degree ¡centrality ¡ ∑ c i ( β ) = ( α + β c j ) A ji j
Bonacich ¡Power ¡Centrality: ¡attenuation ¡factor ¡ β If β > 0, nodes have higher centrality when they have edges to other central nodes. If β < 0, nodes have higher centrality when they have edges to less central nodes.
Bonacich ¡Power ¡Centrality: ¡examples β =.25 β =-.25 Why does the middle node have lower centrality than its neighbors when β is negative?
¡ WWW ¡ food webs ¡ population dynamics ¡ influence ¡ hereditary ¡ citation ¡ transcription regulation networks ¡ neural networks
¡ We now consider the fraction of all directed paths between any two vertices that pass through a node paths between j and k that pass through i betweenness of vertex i ∑ C B ( i ) = g jk ( i )/ g jk j , k all paths between j and k n Only ¡modification: ¡when ¡normalizing, ¡we ¡have ¡ ¡ (N-‑1)*(N-‑2) ¡instead ¡of ¡(N-‑1)*(N-‑2)/2, ¡because ¡we ¡have ¡twice ¡ as ¡many ¡ordered ¡pairs ¡as ¡unordered ¡pairs ¡ ' ( i ) = C C B ( i )/[( N − 1)( N − 2)] B
Recommend
More recommend