riskroute a framework for mi3ga3ng
play

RiskRoute: A Framework for Mi3ga3ng Network Outage Threats - PowerPoint PPT Presentation

RiskRoute: A Framework for Mi3ga3ng Network Outage Threats Ramakrishnan Durairajan + Brian Eriksson * , Paul Barford + * Technicolor Palo Alto + University


  1. RiskRoute: ¡A ¡Framework ¡for ¡Mi3ga3ng ¡ Network ¡Outage ¡Threats ¡ ¡ ¡ Ramakrishnan ¡Durairajan + ¡ ¡ ¡ Brian ¡Eriksson * , ¡Paul ¡Barford + ¡ ¡ ¡ * Technicolor ¡Palo ¡Alto ¡ + University ¡of ¡Wisconsin ¡

  2. Problem ¡Setup ¡ Consider ¡Internet ¡physical ¡infrastructure: ¡ Standard ¡ Outage ¡ Rou3ng ¡ Physical ¡Router ¡or ¡PoP ¡ Poten3al ¡Backup ¡Routes ¡ Fiber ¡op3cs ¡link ¡ Can ¡we ¡automa3cally ¡adjust ¡Internet ¡rou3ng ¡to ¡ Goals ¡: ¡ 1 ¡ avoid ¡network ¡outages ¡ before ¡they ¡happen ? ¡ 2 ¡ Can ¡we ¡choose ¡the ¡best ¡backup ¡route? ¡

  3. Network ¡Outage ¡Causes ¡ Censorship ¡ Outage ¡ Why? ¡ hRp://www.caida.org ¡

  4. Network ¡Outage ¡Causes ¡ Accidents ¡ hRp://www.ap.org/ ¡ Outage ¡ Why? ¡

  5. Network ¡Outage ¡Causes ¡ Our ¡Focus: ¡Natural ¡Disaster ¡Events ¡ Outage ¡ Why? ¡ Thunderstorms ¡ Hurricanes ¡ Tornados ¡ ¡ hRp://www.noaa.gov/ ¡

  6. Is ¡the ¡Internet ¡fragile ¡to ¡Natural ¡Disasters? ¡ Large-­‑Scale ¡ Disaster ¡Events ¡ Network ¡ Cho ¡et. ¡al., ¡“The ¡ Traffic ¡ Japan ¡Earthquake…”, ¡ SWID ¡11 ¡ Time ¡ March ¡11 th ¡2011 ¡Earthquake ¡ Small-­‑Scale ¡ Disaster ¡Events ¡ Schulman ¡and ¡ Spring, ¡“Pingin ¡in ¡ End ¡Host ¡ the ¡Rain”, ¡IMC ¡11 ¡ Up-­‑Down ¡ Rate ¡ Network ¡outages ¡increase ¡by ¡4x ¡in ¡storms. ¡

  7. Our ¡Focus ¡: ¡Natural ¡Disasters-­‑Based ¡Outages ¡ In ¡contrast ¡to ¡accidents ¡and ¡censorship, ¡weather-­‑related ¡ events ¡ follow ¡predictable ¡geographic ¡and ¡temporal ¡pa3erns . ¡ ¡ ¡ Predictable ¡Trajectories ¡ Known ¡Occurrence ¡PaRerns ¡ via ¡Forecas3ng ¡ “Tornado ¡Alley” ¡ Earthquake ¡Fault ¡Lines ¡ Hurricane ¡PaRerns ¡ hRp://www.noaa.gov/ ¡

  8. Current ¡Rou3ng ¡Under ¡Disasters ¡ Does ¡Internet ¡rou3ng ¡currently ¡take ¡advantage ¡of ¡this ¡ predictability ¡of ¡natural ¡disasters? ¡ Answer: ¡Sort ¡of… ¡ hRp://www.renesys.com/blog/ 2012/11/sandys-­‑global-­‑impacts.shtml ¡

  9. Current ¡Rou3ng ¡Under ¡Disasters ¡ Does ¡Internet ¡rou3ng ¡currently ¡take ¡advantage ¡of ¡this ¡ predictability ¡of ¡natural ¡disasters? ¡ Level3 ¡Network ¡Topology ¡ Answer: ¡Sort ¡of… ¡ To ¡London ¡PoP ¡ To ¡Paris ¡PoP ¡ hRp://www.renesys.com/blog/ 2012/11/sandys-­‑global-­‑impacts.shtml ¡

  10. Current ¡Rou3ng ¡Under ¡Disasters ¡ Does ¡Internet ¡rou3ng ¡currently ¡take ¡advantage ¡of ¡this ¡ predictability ¡of ¡natural ¡disasters? ¡ Answer: ¡Sort ¡of… ¡ Manual ¡Rou3ng ¡Change ¡ To ¡London ¡PoP ¡ To ¡Paris ¡PoP ¡ hRp://www.renesys.com/blog/ 2012/11/sandys-­‑global-­‑impacts.shtml ¡ 11:00 ¡PM ¡October ¡28 th , Tropical ¡ 2012 ¡ Storm-­‑Force ¡ Weather ¡ Hurricane-­‑ Winds ¡ Force ¡Winds ¡ Forecast ¡ Informa3on: ¡

  11. Current ¡Rou3ng ¡Under ¡Disasters ¡ Does ¡Internet ¡rou3ng ¡currently ¡take ¡advantage ¡of ¡this ¡ predictability ¡of ¡natural ¡disasters? ¡ Answer: ¡Sort ¡of… ¡ To ¡London ¡PoP ¡ To ¡Paris ¡PoP ¡ hRp://www.renesys.com/blog/ 2012/11/sandys-­‑global-­‑impacts.shtml ¡ 11:00 ¡PM ¡October ¡29 th , 2012 ¡ Main ¡Problem ¡: ¡Manual ¡rou3ng ¡changes ¡are ¡too ¡3me-­‑ consuming ¡and ¡coarse-­‑scale ¡to ¡be ¡effec3ve. ¡

  12. Talk ¡Outline ¡ Goal ¡: ¡Can ¡we ¡exploit ¡the ¡predictability ¡of ¡natural ¡ disasters ¡to ¡automa3cally ¡adjust ¡Internet ¡rou3ng? ¡ • Bit-­‑Risk ¡Miles ¡Metric ¡ – Assess ¡sensi3vity ¡to ¡network ¡outages ¡ • RiskRoute ¡Framework ¡ – Real-­‑3me ¡rou3ng ¡changes ¡to ¡minimize ¡outage ¡risk ¡ • Experiments ¡ – Example ¡rou3ng ¡changes ¡on ¡real ¡world ¡networks ¡and ¡ historical ¡disaster ¡case ¡studies ¡ – Robustness ¡sugges3ons ¡ ¡

  13. Bit-­‑Risk ¡Miles ¡Metric ¡ • The ¡idea ¡of ¡bit-­‑miles ¡mo3vates ¡the ¡introduc3on ¡of ¡ bit-­‑ risk ¡ miles. ¡ Outage ¡ # ¡of ¡Bits ¡ Bit-­‑Risk ¡ Distance ¡ Risk ¡ Sent ¡ Miles ¡ – Consider ¡a ¡rou3ng ¡path ¡: ¡ Bit ¡Miles ¡ i ¡ j ¡ – The ¡bit-­‑risk ¡miles ¡of ¡the ¡rou3ng ¡path ¡is ¡defined ¡as: ¡ ¡ ¡ Bit ¡Miles ¡ Infrastructure ¡Outage ¡Risk ¡

  14. Bit-­‑Risk ¡Miles ¡Metric ¡ Bit ¡Miles ¡ Infrastructure ¡Outage ¡Risk ¡ • Quan3fies ¡the ¡trade-­‑offs ¡of: ¡ Short ¡geographic ¡ rou3ng ¡paths ¡with ¡ high ¡ outage ¡risk ¡ vs. ¡ Long ¡geographic ¡rou3ng ¡ High ¡Risk ¡ paths ¡with ¡ low ¡outage ¡ Area ¡ risk ¡

  15. • What ¡is ¡the ¡cost ¡of ¡an ¡outage ¡between ¡the ¡source ¡and ¡ des3na3on? ¡ • In ¡real-­‑world ¡networks, ¡this ¡can ¡be ¡monetary: ¡ – SLA ¡viola3ons ¡ – End ¡user ¡refunds ¡ ¡ • To ¡approximate ¡this, ¡we ¡use ¡the ¡frac3on ¡of ¡popula3on ¡affected: ¡ A ¡nearest-­‑neighbor ¡par33oning ¡ aggregates ¡popula3on ¡to ¡PoP ¡loca3ons. ¡ United ¡States ¡Popula3on ¡Density ¡(www.census.gov) ¡ Teliasonera ¡Network ¡

  16. • What ¡is ¡historical ¡outage ¡probability ¡at ¡this ¡PoP ¡loca3on? ¡ Corpus ¡of ¡weather ¡events ¡from ¡1970 ¡to ¡ 2010 ¡ • 29,865 ¡FEMA ¡emergency ¡ ¡declara3ons ¡ • Over ¡145,000 ¡NOAA ¡severe ¡weather ¡ ¡events ¡ 2,267 ¡Earthquake ¡Occurrences ¡ ¡ 20,623 ¡Thunderstorm ¡Occurrences ¡ ¡ 2,805 ¡Hurricane ¡Occurrences ¡ ¡ www.noaa.gov, ¡www.fema.gov ¡ ¡

  17. • What ¡is ¡forecasted ¡outage ¡probability ¡at ¡this ¡PoP ¡loca3on? ¡ Na3onal ¡Weather ¡Service, ¡Na3onal ¡ • Event ¡Center ¡ Hurricane ¡Center ¡(www.nhc.noaa.gov) ¡ • Storm-­‑specific ¡Details ¡ • Radius ¡of ¡tropical-­‑force ¡ winds ¡ • Radius ¡of ¡hurricane-­‑force ¡ winds ¡ HURRICANE ¡IRENE ¡INTERMEDIATE ¡ADVISORY ¡NUMBER ¡ ¡28A ¡ NWS ¡NATIONAL ¡HURRICANE ¡CENTER ¡MIAMI ¡FL ¡ ¡ ¡ ¡AL092011 ¡ 800 ¡AM ¡EDT ¡SAT ¡AUG ¡27 ¡2011 ¡ Hurricane ¡Irene ¡ Hurricane ¡Katrina ¡ Hurricane ¡Sandy ¡

  18. RiskRoute ¡Methodology ¡ How ¡do ¡we ¡choose ¡which ¡backup ¡path ¡has ¡the ¡ smallest ¡bit-­‑risk ¡miles? ¡ • Storing ¡all ¡the ¡backup ¡paths ¡is ¡combinatorial. ¡ • Current ¡Techniques: ¡Storing ¡only ¡one ¡backup ¡path ¡ (e.g., ¡Fast ¡Reroute) ¡is ¡fragile ¡to ¡large-­‑scale ¡outages. ¡ • RiskRoute ¡Framework: ¡ ¡Using ¡shortest ¡path ¡ techniques, ¡con3nuously ¡recalculate ¡all ¡paths ¡with ¡ the ¡smallest ¡bit-­‑risk ¡miles: ¡ i ¡ j ¡ Bit-­‑Risk ¡Miles ¡ for ¡route ¡ p ¡

  19. Experiment ¡Datasets ¡ • Real-­‑World ¡Network ¡ – 7 ¡Tier-­‑1 ¡ISPs, ¡16 ¡regional ¡networks ¡ • Intra-­‑domain ¡Rou3ng ¡ – Rou3ng ¡inside ¡a ¡specified ¡network ¡ • Interdomain ¡Rou3ng ¡ – Rou3ng ¡between ¡networks ¡ • Performance ¡Metrics: ¡ ¡ Risk ¡RaCo ¡– ¡The ¡average ¡reduc3on ¡in ¡bit-­‑ 1 ¡ risk ¡miles ¡using ¡RiskRoute ¡compared ¡with ¡ shortest ¡path ¡rou3ng ¡ Distance ¡RaCo ¡– ¡The ¡average ¡increase ¡in ¡ 2 ¡ bit-­‑miles ¡using ¡RiskRoute ¡compared ¡with ¡ shortest ¡path ¡rou3ng ¡

  20. RiskRoute ¡ Intradomain ¡RiskRoute ¡Results ¡ Path ¡ Shortest ¡ Path ¡ Historical ¡Outage-­‑Only ¡Bit-­‑Risk ¡Miles ¡ metric: ¡ Tuning ¡ parameter ¡ Historical ¡Outage ¡Probability ¡

  21. Intradomain ¡RiskRoute ¡Results ¡ • What ¡are ¡the ¡tradeoffs ¡to ¡using ¡RiskRoute? ¡ Average ¡frac3on ¡ reduc3on ¡in ¡bit-­‑ risk ¡miles. ¡ Average ¡frac3on ¡ increase ¡in ¡bit-­‑ miles. ¡

  22. Intradomain ¡RiskRoute ¡Results ¡ • What ¡makes ¡some ¡networks ¡more ¡advantageous ¡towards ¡ using ¡RiskRoute? ¡ Geographic ¡Footprint ¡ Aver. ¡Router ¡Outdegree ¡ Reduc3on ¡in ¡ Bit-­‑Risk ¡Miles ¡ (Risk ¡Ra3o) ¡ Number ¡of ¡Peers ¡ Number ¡of ¡PoPs ¡ Increase ¡in ¡Bit-­‑ Miles ¡ (Distance ¡Ra3o) ¡

Recommend


More recommend