Further ¡Improvement ¡in ¡Approximating ¡the ¡ Maximum ¡Duo-‑Preservation ¡String ¡ Mapping ¡Problem ¡ Brian ¡Brubach ¡ University ¡of ¡Maryland, ¡College ¡Park ¡ 16 th ¡Workshop ¡on ¡Algorithms ¡in ¡BioinformaAcs ¡– ¡WABI ¡2016 ¡
Nicknames ¡ • Maximum ¡Duo-‑preservaAon ¡String ¡Mapping ¡ problem ¡(MPSM) ¡ – Duo-‑preservaAon ¡problem ¡ • Minimum ¡Common ¡String ¡ParAAon ¡problem ¡ (MCSP) ¡ – String ¡ParAAon ¡problem ¡ • The ¡aroncyms ¡for ¡tehse ¡plorebms ¡are ¡aslo ¡ hrad ¡to ¡tlel ¡arapt ¡ – Yuor ¡bairn ¡can ¡slove ¡tshee ¡pbroelms ¡
Motivations ¡ • Comparing ¡biological ¡sequences ¡which ¡differ ¡ due ¡to ¡some ¡process ¡of ¡rearrangements ¡ • A ¡Linear ¡Time ¡Approxima.on ¡Algorithm ¡for ¡ the ¡DCJ ¡Distance ¡for ¡Genomes ¡with ¡Bounded ¡ Number ¡of ¡Duplicates ¡ – Rubert, ¡Feijão, ¡Braga, ¡Stoye, ¡MarAnez ¡(WABI ¡‘16) ¡ – UAlizes ¡an ¡approximaAon ¡algorithm ¡for ¡MCSP ¡ • Data ¡compression ¡of ¡similar ¡strings ¡using ¡ rearrangements ¡
Max ¡Duo-‑preservation ¡String ¡ Mapping ¡Problem ¡(MPSM) ¡ • Input: ¡two ¡strings ¡which ¡are ¡permutaAons ¡of ¡each ¡other ¡ A: ¡ a ¡ b ¡ c ¡ d ¡ d ¡ c ¡ b ¡ a ¡ B: ¡ b ¡ c ¡ a ¡ d ¡ d ¡ c ¡ a ¡ b ¡
Max ¡Duo-‑preservation ¡String ¡ Mapping ¡Problem ¡(MPSM) ¡ • Input: ¡two ¡strings ¡which ¡are ¡permutaAons ¡of ¡each ¡other ¡ • Goal: ¡a ¡one-‑to-‑one ¡mapping ¡that ¡preserves ¡the ¡maximum ¡ number ¡of ¡duos ¡ A: ¡ a ¡ b ¡ c ¡ d ¡ d ¡ c ¡ b ¡ a ¡ B: ¡ b ¡ c ¡ a ¡ d ¡ d ¡ c ¡ a ¡ b ¡
Max ¡Duo-‑preservation ¡String ¡ Mapping ¡Problem ¡(MPSM) ¡ • Input: ¡two ¡strings ¡which ¡are ¡permutaAons ¡of ¡each ¡other ¡ • Goal: ¡a ¡one-‑to-‑one ¡mapping ¡that ¡preserves ¡the ¡maximum ¡ number ¡of ¡duos ¡ • A ¡duo ¡is ¡a ¡pair ¡of ¡consecuAve ¡leYers ¡in ¡a ¡string ¡ A: ¡ a ¡ b ¡ c ¡ d ¡ d ¡ c ¡ b ¡ a ¡ B: ¡ b ¡ c ¡ a ¡ d ¡ d ¡ c ¡ a ¡ b ¡
Max ¡Duo-‑preservation ¡String ¡ Mapping ¡Problem ¡(MPSM) ¡ • Input: ¡two ¡strings ¡which ¡are ¡permutaAons ¡of ¡each ¡other ¡ • Goal: ¡a ¡one-‑to-‑one ¡mapping ¡that ¡preserves ¡the ¡maximum ¡ number ¡of ¡duos ¡ • A ¡duo ¡is ¡a ¡pair ¡of ¡consecuAve ¡leYers ¡in ¡a ¡string ¡ • A ¡duo ¡is ¡preserved ¡if ¡it’s ¡leYers ¡are ¡mapped ¡to ¡some ¡idenAcal ¡ duo ¡in ¡the ¡other ¡string ¡ 3 ¡duos ¡preserved ¡ A: ¡ a ¡ b ¡ c ¡ d ¡ d ¡ c ¡ b ¡ a ¡ B: ¡ b ¡ c ¡ a ¡ d ¡ d ¡ c ¡ a ¡ b ¡
Max ¡Duo-‑preservation ¡String ¡ Mapping ¡Problem ¡(MPSM) ¡ • Complement ¡of ¡the ¡well-‑studied ¡Minimum ¡Common ¡String ¡ ParAAon ¡problem ¡(MCSP) ¡ 3 ¡duos ¡preserved ¡ A: ¡ a ¡ b ¡ c ¡ d ¡ d ¡ c ¡ b ¡ a ¡ B: ¡ b ¡ c ¡ a ¡ d ¡ d ¡ c ¡ a ¡ b ¡
Max ¡Duo-‑preservation ¡String ¡ Mapping ¡Problem ¡(MPSM) ¡ • Complement ¡of ¡the ¡well-‑studied ¡Minimum ¡Common ¡String ¡ ParAAon ¡problem ¡(MCSP) ¡ – Separate ¡the ¡strings ¡into ¡idenAcal ¡parAAons ¡of ¡min ¡cardinality ¡ 5 ¡substrings ¡ 3 ¡duos ¡preserved ¡ A: ¡ a ¡ b ¡ c ¡ d ¡ d ¡ c ¡ b ¡ a ¡ B: ¡ b ¡ c ¡ a ¡ d ¡ d ¡ c ¡ a ¡ b ¡
Max ¡Duo-‑preservation ¡String ¡ Mapping ¡Problem ¡(MPSM) ¡ • Complement ¡of ¡the ¡well-‑studied ¡Minimum ¡Common ¡String ¡ ParAAon ¡problem ¡(MCSP) ¡ – Separate ¡the ¡strings ¡into ¡idenAcal ¡parAAons ¡of ¡min ¡cardinality ¡ 5 ¡+ ¡3 ¡= ¡length ¡ 5 ¡substrings ¡ 3 ¡duos ¡preserved ¡ A: ¡ a ¡ b ¡ c ¡ d ¡ d ¡ c ¡ b ¡ a ¡ B: ¡ b ¡ c ¡ a ¡ d ¡ d ¡ c ¡ a ¡ b ¡
Max ¡Duo-‑preservation ¡String ¡ Mapping ¡Problem ¡(MPSM) ¡ • Complement ¡of ¡the ¡well-‑studied ¡Minimum ¡Common ¡String ¡ ParAAon ¡problem ¡(MCSP) ¡ – Separate ¡the ¡strings ¡into ¡idenAcal ¡parAAons ¡of ¡min ¡cardinality ¡ • In ¡the ¡ k -‑MPSM ¡and ¡ k -‑MCSP ¡problems, ¡each ¡leYer ¡occurs ¡at ¡ most ¡ k ¡Ames ¡in ¡each ¡string ¡ 5 ¡+ ¡3 ¡= ¡length ¡ 5 ¡substrings ¡ 3 ¡duos ¡preserved ¡ A: ¡ a ¡ b ¡ c ¡ d ¡ d ¡ c ¡ b ¡ a ¡ B: ¡ b ¡ c ¡ a ¡ d ¡ d ¡ c ¡ a ¡ b ¡
Related ¡Work ¡ Problem ¡ Approx. ¡ Authors/year ¡ Chen, ¡Chen, ¡Samatova, ¡Peng ¡Wang, ¡ k -‑MPSM ¡ k 2 ¡ and ¡Tang ¡(2014) ¡ Boria, ¡Kurpisz, ¡Leppänen, ¡and ¡ 4 ¡ Mastrolilli ¡(2014) ¡ MPSM ¡ Boria, ¡Cabodi, ¡CamuraA, ¡Palena, ¡ 3.5 ¡ Pasini, ¡and ¡Quer ¡(2016) ¡ 3.25 ¡ This ¡paper ¡(2016) ¡ O(log ¡n ¡log*n) ¡ Cormode ¡and ¡Muthukrishnan ¡(2002) ¡ MCSP ¡ (edit ¡distance ¡with ¡moves ¡problem) ¡
Hardness ¡ • 2-‑MCSP ¡is ¡NP-‑hard ¡and ¡APX-‑hard ¡ – Goldstein, ¡Kolman, ¡and ¡Zheng ¡(2004) ¡ – Implies ¡Duo-‑preservaAon ¡is ¡also ¡NP-‑hard ¡ • 2-‑MPSM ¡is ¡APX-‑hard ¡ – Boria, ¡Kurpisz, ¡Leppänen, ¡and ¡Mastrolilli ¡(2014) ¡
Other ¡Related ¡Work ¡ • Fixed ¡parameter ¡tractability ¡(FPT) ¡ – Duo-‑preservaAon ¡is ¡FPT ¡when ¡parameterized ¡by ¡ number ¡of ¡preserved ¡duos ¡ • BereYa, ¡Castelli, ¡Dondi ¡(2015) ¡ • HeurisAcs ¡(for ¡String ¡ParAAon) ¡ – Blum, ¡Lozano, ¡Davidson ¡(2015) ¡ – Ferdous, ¡Rahman ¡(2015) ¡ • ApplicaAons ¡(for ¡String ¡ParAAon) ¡ – Chen, ¡Zheng, ¡Fu, ¡Nan, ¡Zhong, ¡Lonardi, ¡Jiang ¡(2005) ¡ – Swenson, ¡Marron, ¡Earnest-‑deyoung, ¡Moret ¡(2005) ¡
Duo ¡Mapping ¡and ¡ConFlicts ¡ • Consider ¡a ¡biparAte ¡graph ¡on ¡duos ¡ – Add ¡edges ¡between ¡idenAcal ¡duos ¡ – Max ¡matching ¡is ¡upper ¡bound ¡on ¡max ¡duo-‑preservaAon ¡ ta ¡ at ¡ tc ¡ ct ¡ aa ¡ t ¡ c ¡ t ¡ A: ¡ a ¡ a ¡ a ¡ t ¡ B: ¡ a ¡ t ¡ a ¡ a ¡ c ¡ at ¡ at ¡ ta ¡ aa ¡ tc ¡
Duo ¡Mapping ¡and ¡ConFlicts ¡ • Consider ¡a ¡biparAte ¡graph ¡on ¡duos ¡ – Add ¡edges ¡between ¡idenAcal ¡duos ¡ – Max ¡matching ¡is ¡upper ¡bound ¡on ¡max ¡duo-‑preservaAon ¡ • Two ¡types ¡of ¡conflicts: ¡ ta ¡ at ¡ tc ¡ ct ¡ aa ¡ t ¡ c ¡ t ¡ A: ¡ a ¡ a ¡ a ¡ t ¡ B: ¡ a ¡ t ¡ a ¡ a ¡ c ¡ at ¡ at ¡ ta ¡ aa ¡ tc ¡
Duo ¡Mapping ¡and ¡ConFlicts ¡ • Consider ¡a ¡biparAte ¡graph ¡on ¡duos ¡ – Add ¡edges ¡between ¡idenAcal ¡duos ¡ – Max ¡matching ¡is ¡upper ¡bound ¡on ¡max ¡duo-‑preservaAon ¡ • Two ¡types ¡of ¡conflicts: ¡ – Type ¡1: ¡two ¡edges ¡to ¡the ¡same ¡duo ¡ ta ¡ at ¡ tc ¡ ct ¡ aa ¡ t ¡ c ¡ t ¡ A: ¡ a ¡ a ¡ a ¡ t ¡ B: ¡ a ¡ t ¡ a ¡ a ¡ c ¡ at ¡ at ¡ ta ¡ aa ¡ tc ¡
Duo ¡Mapping ¡and ¡ConFlicts ¡ • Consider ¡a ¡biparAte ¡graph ¡on ¡duos ¡ – Add ¡edges ¡between ¡idenAcal ¡duos ¡ – Max ¡matching ¡is ¡upper ¡bound ¡on ¡max ¡duo-‑preservaAon ¡ • Two ¡types ¡of ¡conflicts: ¡ – Type ¡1: ¡two ¡edges ¡to ¡the ¡same ¡duo ¡ – Type ¡2: ¡from ¡consecuAve ¡duos ¡to ¡non-‑consecuAve ¡duos ¡ ta ¡ at ¡ tc ¡ ct ¡ aa ¡ t ¡ c ¡ t ¡ A: ¡ a ¡ a ¡ a ¡ t ¡ B: ¡ a ¡ t ¡ a ¡ a ¡ c ¡ at ¡ at ¡ ta ¡ aa ¡ tc ¡
Main ¡Contributions ¡ • New ¡way ¡to ¡construct ¡a ¡duo ¡matching ¡ – First ¡find ¡weighted ¡matching ¡on ¡triplets ¡ – Translate ¡to ¡a ¡fracAonal ¡duo ¡matching ¡ – Gives ¡a ¡Aghter ¡upper ¡bound ¡ • New ¡method ¡for ¡resolving ¡conflicts ¡ – Based ¡on ¡local ¡graph ¡structures ¡
Recommend
More recommend