Online Deduplication for Databases
2
3
3
• Reduce cost – – • Improve Performance – – 3
• – – • – – • • 4
• – – • – – – 5
• • Need For Similarity-based Dedup • • 6
• – – – • – – 7
8
8
8
8
9
9
9
Incoming Data 10
Incoming Data Dedup’ed Data 10
11
• • • Our Approach: dbDedup • 12
• – – – 13
14
15
15
15
• – • – • – 16
• – • • – • • • – – 17
Δ 1,2 Δ 1,2 Δ 2,3 Δ 2,3 18
Δ 1,2 Δ 2,1 Δ 1,2 Δ 2,1 Δ 2,3 Δ 2,3 18
Δ 1,2 Δ 2,1 Δ 1,2 Δ 2,1 Δ 2,3 Δ 2,3 18
Δ 1,2 Δ 2,1 Δ 1,2 Δ 2,1 Δ 3,2 Δ 2,3 Δ 2,3 Δ 3,2 18
Δ 1,2 Δ 2,1 Δ 1,2 Δ 2,1 Δ 3,2 Δ 2,3 Δ 2,3 Δ 3,2 18
Δ 1,2 Δ 2,1 Δ 1,2 Δ 2,1 Δ 3,2 Δ 2,3 Δ 2,3 Δ 3,2 Network-level dedup Storage-level dedup 18
Δ 2,1 Δ 3,2 Δ 4,3 Δ 5,4 Δ 3,2 Δ 5,4 1 3 19
Δ 2,1 Δ 3,2 Δ 4,3 Δ 5,4 Δ 3,2 Δ 5,4 1 3 Δ 3,1 Δ 3,2 Δ 5,3 Δ 5,4 19
• – • – • • – 20
• – – • – – 21
22
22
22
22
22
• • • • Evaluation 23
• – – • – – 24
25
26
27
28
29
• – – – – 30
Recommend
More recommend