Finding ¡Pa)erns ¡in ¡Complex ¡ Social ¡Networks ¡ Lennon Ganz Santa Barbara City College Computer Science Mentor: Dr. Yinghui Wu Faculty Advisor: Dr. Xifeng Yan Department: Computer Science Funded by: National Science Foundation ¡
Social ¡Network ¡ “A ¡network ¡of ¡social ¡interac<ons” ¡ ¡ Simple ¡– ¡Contains ¡one ¡type ¡of ¡en<ty ¡(usually ¡people) ¡and ¡their ¡rela<onships ¡ ¡ ¡ Complex ¡– ¡ Contains ¡mul<ple ¡types ¡of ¡en<<es ¡(people, ¡places, ¡events) ¡ and ¡their ¡rela<onships ¡ Simple ¡ Complex ¡ Shane Social ¡ Graph ¡ Proper<es ¡ Name: ¡Zach ¡Flint ¡ Zach Danny UCSB Born: ¡6/22/1991 ¡ Student at … ¡ Classmate Of
Graph ¡Analy<cs ¡Systems ¡ ¡ ¡ ¡ Challenges ¡ – Networks ¡are ¡large ¡and ¡complex ¡ – Queries ¡(ques<ons) ¡are ¡difficult ¡ to ¡write ¡ ¡ ¡ My ¡Objec9ve ¡ – Design ¡a ¡simple, ¡intui<ve ¡ plaTorm ¡to ¡analyze ¡complex ¡ networks ¡
Designing ¡a ¡Graph ¡Analysis ¡PlaTorm ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ Approach ¡ – Understand ¡exis<ng ¡graph ¡ databases ¡and ¡systems ¡ Titan ¡ – Iden<fy ¡suitable ¡queries ¡and ¡ algorithms ¡for ¡social ¡graphs ¡ Query ¡-‑ ¡ ¡ a ¡ques<on ¡ Ques9on ¡ Answer ¡ – Propose ¡and ¡research ¡ Algorithm ¡-‑ ¡ a ¡set ¡of ¡ instruc<ons ¡for ¡ op<miza<on ¡techniques ¡ answering ¡a ¡query ¡
Types ¡of ¡Queries ¡ ¡ Example ¡ Type ¡ • “How ¡many ¡a)acks ¡were ¡there ¡in ¡2005?” ¡ Aggrega<on ¡ • “What ¡was ¡the ¡most ¡common ¡type ¡of ¡weapon ¡ used?” ¡ • Have ¡these ¡two ¡terrorist ¡groups ¡ever ¡collaborated ¡on ¡ Reachability ¡ an ¡a)ack? ¡ • “Find ¡instances ¡where ¡a ¡terrorist ¡group ¡targeted ¡a ¡ Pa)ern ¡Matching ¡ government ¡official ¡who ¡had ¡also ¡been ¡a)acked ¡by ¡a ¡ different ¡group ¡earlier ¡that ¡year” ¡
System ¡ Queries ¡ Overview ¡ Graphical ¡User ¡Interface ¡(GUI) ¡ Query ¡Parser ¡ ¡ Query ¡Results ¡ Query ¡Execu<on ¡ Engine ¡ (Algorithms) ¡ Global ¡ Graph ¡ Index ¡ Terrorism ¡ Converter ¡ Files ¡ Files ¡ Data ¡
Global ¡ Building ¡a ¡Graph ¡ Terrorism ¡ Converter ¡ Data ¡ Converter ¡ Read ¡data ¡from ¡cells ¡ Add ¡data ¡to ¡new ¡or ¡exis<ng ¡ nodes ¡in ¡graph ¡ Connect! ¡
Graph ¡ Index ¡ Visualiza9on ¡ Files ¡ Files ¡ ~500 ¡incidents ¡out ¡ of ¡113,000 ¡in ¡ Global ¡Terrorism ¡ Database ¡(GTD) ¡
Queries ¡ Graphical ¡User ¡Interface ¡(GUI) ¡ Query ¡Parser ¡ ¡ Query ¡Results ¡ Query ¡Execu<on ¡ Engine ¡ Global ¡ Graph ¡ Index ¡ Converter ¡ Terrorism ¡ Files ¡ Files ¡ Data ¡
Query ¡Execu9on ¡ Reachability ¡Queries ¡ Engine ¡ Start ¡ Breadth-‑First ¡Search ¡ Node ¡ (BFS) ¡ 1 ¡ 0 ¡ 1 ¡ 1 ¡ 3 ¡ 2 ¡ 3 ¡ 2 ¡ 3 ¡ 2 ¡ 2 ¡ 3 ¡ 3 ¡ 4 ¡ 3 ¡ End ¡ 4 ¡ Node ¡
Query ¡Execu9on ¡ Query ¡Execu9on ¡ Bidirec<onal ¡Searching ¡ Engine ¡ Engine ¡ Almost ¡always ¡faster ¡ than ¡a ¡normal ¡search ¡ How ¡much ¡faster? ¡2X? ¡4X? ¡ ¡
Bidirec<onal ¡Search ¡Performance ¡ Performance ¡vs. ¡Graph ¡Size ¡ 35 ¡ Constant ¡Density ¡ 30 ¡ 25 ¡ Performance ¡ 20 ¡ Improvement ¡ 30x ¡faster ¡and ¡ 15 ¡ (x ¡faster) ¡ increasing ¡ 10 ¡ 5 ¡ 0 ¡ 0 ¡ 500 ¡ 1000 ¡ 1500 ¡ 2000 ¡ 2500 ¡ Number ¡of ¡Nodes ¡ 𝐽𝑛𝑞𝑠𝑝𝑤𝑓𝑛𝑓𝑜𝑢 = 𝐶𝐺𝑇 ¡ 𝑆𝑣𝑜𝑜𝑗𝑜 ¡ 𝑈𝑗𝑛𝑓/𝐶𝐽𝐶𝐺𝑇 ¡ 𝑆𝑣𝑜𝑜𝑗𝑜 ¡ 𝑈𝑗𝑛𝑓 ¡
Bidirec<onal ¡Search ¡Performance ¡ Performance ¡vs. ¡Edge ¡Probability ¡ 25 ¡ Constant ¡# ¡ 20 ¡ of ¡Nodes ¡ Performance ¡ 15 ¡ Improvement ¡ 10 ¡ (x ¡faster) ¡ 5 ¡ 0 ¡ 0 ¡ 0.1 ¡ 0.2 ¡ 0.3 ¡ 0.4 ¡ 0.5 ¡ 0.6 ¡ p ¡ 𝐽𝑛𝑞𝑠𝑝𝑤𝑓𝑛𝑓𝑜𝑢 = 𝐶𝐺𝑇 ¡ 𝑆𝑣𝑜𝑜𝑗𝑜 ¡ 𝑈𝑗𝑛𝑓/𝐶𝐽𝐶𝐺𝑇 ¡ 𝑆𝑣𝑜𝑜𝑗𝑜 ¡ 𝑈𝑗𝑛𝑓 ¡ Probability ¡that ¡any ¡two ¡nodes ¡ are ¡connected ¡by ¡an ¡edge ¡
Pa)ern ¡Matching ¡ Query ¡Execu9on ¡ Engine ¡ Perpetrator ¡ ¡“Search ¡for ¡two ¡dis<nct ¡ incidents ¡ that ¡had ¡the ¡ ¡ ¡ Incident ¡2 ¡ Incident ¡1 ¡ same ¡perpetrator ¡ and ¡the ¡ same ¡target ” ¡ Target ¡
Pa)ern ¡Found ¡ Query ¡Results ¡ 200602040010 ¡ 200602050020 ¡ Target : ¡Afghan ¡Na<onal ¡ Target : ¡Afghan ¡Na<onal ¡ Police ¡ Police ¡ Date : ¡2/4/06 ¡ Date : ¡2/5/06 ¡ Country : ¡Afghanistan ¡ Country : ¡Afghanistan ¡ City : ¡Kandahar ¡ City : ¡Khakrez ¡ Weapon ¡Type : ¡IED ¡ Weapon ¡ Type : ¡Land ¡Mine ¡ Casual9es : ¡2 ¡ Casual9es : ¡6 ¡ Wounded : ¡2 ¡ Wounded : ¡2 ¡ Summary : ¡………….. ¡ Summary : ¡………….. ¡
Ongoing ¡ Queries ¡ Development ¡ Graphical ¡User ¡Interface ¡(GUI) ¡ Query ¡Parser ¡ ¡ Query ¡Results ¡ Query ¡Execu9on ¡ Engine ¡ A pplica<on ¡ Geographic ¡ P rogramming ¡ Visualiza<on ¡ I nterface ¡ Global ¡ Graph ¡ Index ¡ Terrorism ¡ Converter ¡ Files ¡ Files ¡ Data ¡
Acknowledgments ¡ ¡ Dr. ¡Yinghui ¡Wu ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡Dr. ¡Xifeng ¡Yan ¡ ¡ ¡ Zach, ¡Shane, ¡Danny ¡
Recommend
More recommend