Local ¡Processing ¡in ¡Distributed ¡Storage ¡ Arya ¡Mazumdar ¡ ¡ ¡ ¡ ¡ Based ¡on ¡Joint ¡works ¡with ¡ ¡ Viveck ¡Cadambe, ¡Venkat ¡Chander, ¡Greg ¡Wornell ¡(MIT) ¡ ¡Ankit ¡Rawat, ¡Sriram ¡Viswanath ¡(UTAusJn) ¡ ¡ Arya ¡Mazumdar ¡-‑ ¡Univ. ¡of ¡Minnesota ¡
An ¡informaJon ¡storage ¡graph ¡ q Can ¡store ¡1 ¡bit ¡in ¡each ¡vertex ¡ q Content ¡of ¡any ¡vertex ¡can ¡be ¡ determined ¡by ¡looking ¡at ¡the ¡contents ¡ of ¡its ¡neighbors ¡ How ¡many ¡bits ¡of ¡informaJon ¡can ¡be ¡ stored ¡in ¡this ¡graph? ¡ q InformaJon ¡theoreJc ¡formulaJon ¡ q Answer: ¡wait ¡Jll ¡the ¡end ¡of ¡the ¡talk ¡ Why ¡ask ¡this ¡quesJon? ¡ ¡ ¡ Arya ¡Mazumdar ¡-‑ ¡Univ. ¡of ¡Minnesota ¡
Large-‑scale ¡distributed ¡storage: ¡ Network ¡of ¡servers ¡ • Link ¡Failure ¡ • Long ¡queue ¡ • Power-‑down ¡ • Hardware ¡ problems ¡ • System ¡crash ¡ Arya ¡Mazumdar ¡-‑ ¡Univ. ¡of ¡Minnesota ¡
Local ¡repair ¡ Minimize ¡repair ¡bandwidth ¡ (amount ¡of ¡data ¡downloaded) ¡ ¡ Arya ¡Mazumdar ¡-‑ ¡Univ. ¡of ¡Minnesota ¡
Update-‑efficiency ¡ Codewords ¡ Message ¡ Slight ¡change ¡in ¡message ¡ Not ¡much ¡change ¡in ¡the ¡codeword ¡ ¡ Good ¡update-‑efficient ¡codes ¡that ¡can ¡handle ¡node ¡(disk) ¡failures? ¡ Arya ¡Mazumdar ¡-‑ ¡Univ. ¡of ¡Minnesota ¡
Challenges? ¡ Unorthodox ¡constraints ¡– ¡Local ¡Recovery/Smooth ¡Encoding ¡ ¡ OpJmal ¡rate ¡– ¡Best ¡codes ¡(InformaJon ¡theory) ¡ ¡ How ¡to ¡build ¡codes? ¡(Coding ¡theory) ¡ ¡ Explicit ¡(fast ¡algorithmic) ¡construcJons ¡of ¡Codes ¡that ¡support ¡ LOCAL ¡PROCESSING ¡ Arya ¡Mazumdar ¡-‑ ¡Univ. ¡of ¡Minnesota ¡
Outline ¡ ¡ q Distributed ¡Storage ¡ ¡ q Local ¡Repair ¡ q Update ¡Efficiency ¡ q Topology ¡of ¡Distributed ¡Network ¡Storage ¡ Arya ¡Mazumdar ¡-‑ ¡Univ. ¡of ¡Minnesota ¡
Local ¡repair ¡ Arya ¡Mazumdar ¡-‑ ¡Univ. ¡of ¡Minnesota ¡
Repair ¡of ¡single ¡failed ¡node ¡ Minimize ¡repair ¡bandwidth ¡ (amount ¡of ¡data ¡downloaded) ¡ ¡ Many ¡works: ¡Most ¡prominent ¡Dimakis, ¡Godfrey, ¡Wu, ¡ Wainwright, ¡Ramachandran ¡(2009) ¡ Called ¡regeneraJve ¡codes ¡ Arya ¡Mazumdar ¡-‑ ¡Univ. ¡of ¡Minnesota ¡
How ¡coding ¡helps? ¡ RepeJJon ¡(ProtecJon ¡against ¡1 ¡erasure) ¡ A ¡ A ¡ B ¡ B ¡ Rate ¡= ¡1/2 ¡ Coding ¡ A ¡ B ¡ A+B ¡ Rate ¡= ¡2/3 ¡ Arya ¡Mazumdar ¡-‑ ¡Univ. ¡of ¡Minnesota ¡
Benefits ¡of ¡repeJJon ¡ • Many ¡sophisJcated ¡coding ¡schemes ¡ • STILL ¡repeJJon ¡is ¡used ¡.. ¡WHY? ¡ – Local ¡Recovery ¡ ¡ Arya ¡Mazumdar ¡-‑ ¡Univ. ¡of ¡Minnesota ¡
Example: ¡ RepeJJon ¡(ProtecJon ¡against ¡1 ¡erasure) ¡ LOCALITY ¡= ¡1 ¡ A ¡ A ¡ B ¡ B ¡ Rate ¡= ¡1/2 ¡ A,B,A+B ¡Coding ¡ LOCALITY ¡= ¡2 ¡ A ¡ B ¡ A+B ¡ Rate ¡= ¡2/3 ¡ Arya ¡Mazumdar ¡-‑ ¡Univ. ¡of ¡Minnesota ¡
Locally ¡repairable ¡codes ¡(Gopalan, ¡ Huang, ¡Simitci, ¡Yekhanin, ¡2011) ¡ Minimize ¡number ¡of ¡parJcipaJng ¡servers ¡ 1. Each ¡Symbol: ¡Stored ¡at ¡a ¡different ¡node ¡of ¡network ¡ 2. Each ¡Symbol: ¡Represents ¡a ¡packet ¡or ¡block ¡of ¡bits ¡of ¡arbitrary ¡size ¡ 3. n: ¡Number ¡of ¡servers ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡k: ¡amount ¡of ¡informaJon ¡ ¡ ¡ Arya ¡Mazumdar ¡-‑ ¡Univ. ¡of ¡Minnesota ¡
Local ¡repair ¡ • Gopalan, ¡Yekhanin ¡et ¡al. ¡(r: ¡locality) ¡ • ConstrucJons ¡ – Gopalan ¡et ¡al. ¡; ¡Dimakis ¡et ¡al. ¡(existence) ¡ ¡ – Barg ¡and ¡Tamo ¡ ¡ ¡ • Server ¡size: ¡any ¡role? ¡ Arya ¡Mazumdar ¡-‑ ¡Univ. ¡of ¡Minnesota ¡
New ¡fundamental ¡limits: ¡with ¡server ¡size ¡ ¡ q q: ¡size ¡of ¡the ¡node ¡ q Uses ¡the ¡opJmal ¡(unknown) ¡dimension ¡of ¡error-‑correcJng ¡ codes ¡ q The ¡last ¡bound ¡(Gopalan ¡et ¡al., ¡Dimakis ¡et ¡al.) ¡is ¡a ¡special ¡ case ¡ q Tight ¡construcJons ¡are ¡possible ¡at ¡various ¡points ¡ ¡ ¡ CadambeMazumdar2013 ¡ Arya ¡Mazumdar ¡-‑ ¡Univ. ¡of ¡Minnesota ¡
New ¡bounds ¡.. ¡ Arya ¡Mazumdar ¡-‑ ¡Univ. ¡of ¡Minnesota ¡
Local ¡Recovery ¡ CooperaJve ¡Local ¡Recovery? ¡ Arya ¡Mazumdar ¡-‑ ¡Univ. ¡of ¡Minnesota ¡
CooperaJve ¡local ¡repair ¡ • Systems ¡may ¡encounter ¡mulJple ¡node ¡failures ¡in ¡ quick ¡succession ¡[Ford ¡et ¡al. ¡2010] ¡. ¡ – Deliberately ¡accumulate ¡failures ¡and ¡repair ¡them ¡ simultaneously. ¡ – [Shum ¡and ¡Hu ¡2011] ¡ ¡show ¡that ¡cooperaJve ¡repair ¡ ¡may ¡ lead ¡to ¡smaller ¡repair ¡bandwidth ¡. ¡ • We ¡propose ¡the ¡cooperaJve ¡repair ¡with ¡small ¡ locality ¡ ¡as ¡performance ¡metric. ¡ Arya ¡Mazumdar ¡-‑ ¡Univ. ¡of ¡Minnesota ¡
CooperaJve ¡repair ¡ Arya ¡Mazumdar ¡-‑ ¡Univ. ¡of ¡Minnesota ¡
Hadamard ¡(Simplex) ¡codes ¡ Arya ¡Mazumdar ¡-‑ ¡Univ. ¡of ¡Minnesota ¡
Hadamard ¡codes ¡ MazumdarRawatVishwanath2014 ¡ What ¡about ¡general ¡codes? ¡ Arya ¡Mazumdar ¡-‑ ¡Univ. ¡of ¡Minnesota ¡
First: ¡What ¡is ¡possible ¡ ¡ • How ¡many ¡codewords ¡can ¡have ¡the ¡same ¡prefix? ¡ • Codewords ¡with ¡same ¡prefix: ¡subcode ¡with ¡same ¡distance ¡ • Use ¡bounds ¡on ¡codes ¡ CadambeMazumdar2013 ¡ Arya ¡Mazumdar ¡-‑ ¡Univ. ¡of ¡Minnesota ¡ MazumdarRawatVishwanath2014 ¡
Limit ¡of ¡cooperaJve ¡repair ¡ Also ¡have: ¡bounds ¡with ¡server ¡size ¡as ¡an ¡argument ¡ ¡ ¡ MazumdarRawatVishwanath2014 ¡ Arya ¡Mazumdar ¡-‑ ¡Univ. ¡of ¡Minnesota ¡
ConstrucJons ¡ • ParJJon ¡MDS ¡codes ¡ ¡ Arya ¡Mazumdar ¡-‑ ¡Univ. ¡of ¡Minnesota ¡ MazumdarRawatVishwanath2014 ¡
Tightness ¡of ¡the ¡bounds ¡ Arya ¡Mazumdar ¡-‑ ¡Univ. ¡of ¡Minnesota ¡
Random ¡failures: ¡Capacity ¡of ¡local ¡ repair ¡ MazumdarChandarWornell2013 ¡ Arya ¡Mazumdar ¡-‑ ¡Univ. ¡of ¡Minnesota ¡
ConcentraJon ¡of ¡output ¡entropy ¡ q Entropy ¡of ¡the ¡unerased ¡variables: ¡1-‑Lipschitz ¡(of ¡random ¡ erasures ¡by ¡the ¡channel) ¡ q Average ¡ ¡(output ¡entropy ¡= ¡#unerased ¡variables ¡– ¡#useless ¡ variables) ¡ q Useless ¡variables ¡= ¡Non-‑erased ¡but ¡the ¡recovery ¡sets ¡ erased ¡(esJmate ¡this) ¡ q Use ¡the ¡esJmated ¡output ¡entropy ¡in ¡(say) ¡Fano’s ¡ inequality ¡ MazumdarChandarWornell2013 ¡ Arya ¡Mazumdar ¡-‑ ¡Univ. ¡of ¡Minnesota ¡
Update-‑efficiency ¡ Arya ¡Mazumdar ¡-‑ ¡Univ. ¡of ¡Minnesota ¡
Recommend
More recommend