an itera ve approach to synthesize data transforma on
play

An Itera)ve Approach to Synthesize Data Transforma)on - PowerPoint PPT Presentation

An Itera)ve Approach to Synthesize Data Transforma)on Programs Bo Wu and Craig Knoblock University of Southern California 1/10 7/30/15 Learning Transforma)on


  1. An ¡Itera)ve ¡Approach ¡to ¡Synthesize ¡ Data ¡Transforma)on ¡Programs ¡ Bo ¡Wu ¡and ¡Craig ¡Knoblock ¡ University ¡of ¡Southern ¡California ¡ 1/10 ¡ 7/30/15 ¡

  2. Learning ¡Transforma)on ¡Programs ¡ ¡by ¡Example ¡ Input ¡Data ¡ Target ¡Data ¡ 2000 ¡Ford ¡Expedi)on ¡11k ¡runs ¡great ¡los ¡angeles ¡$4900 ¡(los ¡ 2000 ¡Ford ¡Expedi)on ¡los ¡angeles ¡$4900 ¡ angeles) ¡ 1998 ¡Honda ¡Civic ¡12k ¡miles ¡s. ¡Auto. ¡-­‑ ¡$3800 ¡(Arcadia) ¡ 2008 ¡Mitsubishi ¡Galant ¡Sylmar ¡CA ¡$7500 ¡ 2008 ¡Mitsubishi ¡Galant ¡ES ¡$7500 ¡(Sylmar ¡CA) ¡pic ¡ 2008 ¡Mitsubishi ¡Galant ¡ES ¡$7500 ¡(Sylmar ¡CA) ¡pic ¡ 1998 ¡Honda ¡Civic ¡Arcadia ¡$3800 ¡ 1998 ¡Honda ¡Civic ¡12k ¡miles ¡s. ¡Auto. ¡-­‑ ¡$3800 ¡(Arcadia) ¡ ¡ 1996 ¡Isuzu ¡Trooper ¡14k ¡clean ¡)tle ¡west ¡covina ¡$999 ¡(west ¡ 1996 ¡Isuzu ¡Trooper ¡west ¡covina ¡$999 ¡ covina) ¡pic ¡ … ¡ … ¡ Time ¡complexity ¡is ¡ exponen/al ¡in ¡the ¡ number ¡ ¡ and ¡a ¡ high ¡polynomial ¡ in ¡the ¡ length ¡of ¡examples ¡ 2/10 ¡ 7/30/15 ¡

  3. Reuse ¡subprograms ¡ (BNK, ¡LWRD,3) ¡ (NUM, ¡BNK,2) ¡ (START,NUM,1) ¡ (BNK,NUM,1) ¡ 0 ¡ 20 ¡ 35 ¡ 52 ¡ Original: ¡ 2000 ¡Ford ¡Expedi)on ¡11k ¡runs ¡great ¡los ¡angeles ¡$4900 ¡(los ¡angeles) ¡ ¡ Target: ¡ 2000 ¡Ford ¡Expedi)on ¡los ¡angeles ¡$4900 ¡ Posi)on ¡program= ¡(lec ¡context, ¡right ¡context, ¡occurance) ¡ Learned ¡Programs ¡ ¡ Acer ¡1 st ¡ ¡ example ¡ Acer ¡2 nd ¡ ¡ example ¡ Acer ¡3 rd ¡ ¡ example ¡ 7/30/15 ¡

  4. Iden)fy ¡incorrect ¡subprograms ¡ Input ¡ Output ¡ 2000 ¡Ford ¡Expedi)on ¡11k ¡runs ¡great ¡los ¡angeles ¡$4900 ¡(los ¡angeles) ¡ 2000 ¡Ford ¡Expedi)on ¡los ¡angeles ¡$4900 ¡ ¡ ¡ 1998 ¡Honda ¡Civic ¡12k ¡miles ¡s. ¡Auto. ¡-­‑ ¡$3800 ¡(Arcadia) ¡ 2008 ¡Mitsubishi ¡Galant ¡Sylmar ¡CA ¡$7500 ¡ ¡ Program ¡ (ANY,BNK’$', ¡1) ¡(NUM, ¡BNK, ¡2) ¡ (START, ¡NUM, ¡1) ¡(BNK, ¡NUM, ¡1) ¡ (’(’, ¡WORD, ¡1) ¡(LWRD, ¡’)', ¡1) ¡ Null ¡ Null ¡ Execu)on ¡Result: ¡ ␣ $7500 ¡ 0 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡-­‑1 ¡ 33 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡-­‑1 ¡ ≠ ¡ ≠ ¡ = ¡ = ¡ ¡33 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡43 ¡ 0 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡23 ¡ Output: ¡ 2008 ¡Mitsubishi ¡Galant ¡Sylmar ¡CA ¡$7500 ¡ ¡ Input: ¡ 2008 ¡Mitsubishi ¡Galant ¡ES ¡$7500 ¡(Sylmar ¡CA) ¡pic ¡ ¡ 4/10 ¡ 7/30/15 ¡

  5. Update ¡hypothesis ¡spaces ¡ Program ¡ (START, ¡NUM, ¡1) ¡(BNK, ¡NUM, ¡1) ¡ (ANY,BNK’$', ¡1) ¡ (’(’, ¡WORD, ¡1) ¡(LWRD, ¡’)', ¡1) ¡ Hypothesis ¡H 3 ¡ 2000 ¡Ford ¡Expedi)on ¡11k ¡runs ¡great ¡los ¡angeles ¡$4900 ¡(los ¡angeles) ¡ H 3 ¡ 1998 ¡Honda ¡Civic ¡12k ¡miles ¡s. ¡Auto. ¡-­‑ ¡$3800 ¡(Arcadia) ¡ h 33 ¡ h 31 ¡ h 32 ¡ e ¡ h 32 ¡ e ¡ s ¡ e ¡ s ¡ e ¡ h 31 ¡ h 32 ¡ h 32 ¡ h 31 ¡ h 32 ¡ Left context: ¡ Right context: ¡ • LWRD ¡ • “)” ¡ • WORD ¡ • … ¡ • … ¡ Right context: ¡ Left context: • WORD ¡ • “)” ¡ • … ¡ • … ¡ 2008 ¡Mitsubishi ¡Galant ¡ES ¡$7500 ¡(Sylmar ¡CA) ¡pic ¡ ¡ 5/10 ¡ 7/30/15 ¡

  6. Evalua)on ¡ • Dataset ¡ – D1 : ¡17 ¡scenarios ¡used ¡in ¡(Lin ¡et ¡al., ¡2014) ¡ ¡ • 5 ¡records ¡per ¡scenario ¡ – D2 : ¡30 ¡scenarios ¡collected ¡from ¡student ¡data ¡integra)on ¡ projects ¡ • about ¡350 ¡records ¡per ¡scenario ¡ – D3 : ¡synthe)c ¡dataset ¡ • designed ¡to ¡evaluate ¡scale-­‑up ¡ • Alterna)ve ¡approaches ¡ – Our ¡implementa/on ¡of ¡Gulwani’s ¡approach : ¡(Gulwani, ¡2011) ¡ – Metagol: ¡ (Lin ¡et ¡al., ¡2014) ¡ • Metric ¡ – Time ¡(in ¡ seconds ) ¡to ¡generate ¡a ¡transforma)on ¡program ¡ 6/10 ¡ 7/30/15 ¡

  7. Program ¡genera)on ¡)me ¡comparisons ¡ Table: ¡)me ¡(in ¡seconds) ¡to ¡generate ¡programs ¡on ¡D1 ¡and ¡D2 ¡datasets ¡ D3 ¡ Figure: ¡scalability ¡test ¡on ¡D3 ¡ 7/10 ¡ 7/30/15 ¡

  8. Discussion ¡ • Our ¡itera)ve ¡PBE ¡approach ¡significantly ¡ reduces ¡)me ¡in ¡synthesizing ¡programs ¡ ¡ ¡ ¡ ¡Future ¡work ¡ • Extend ¡to ¡domains ¡with ¡only ¡par)al ¡traces ¡ • Help ¡user ¡to ¡determine ¡when ¡to ¡stop ¡ transforming ¡on ¡large ¡datasets. ¡ 8/10 ¡ 7/30/15 ¡

  9. Thanks ¡ ¡ Please ¡come ¡to ¡my ¡poster ¡#23 ¡for ¡more ¡details ¡ Bo ¡Wu ¡ bowu@isi.edu ¡ ¡ ¡ ¡ 9/10 ¡ 7/30/15 ¡

  10. References ¡ [Lin ¡et ¡al., ¡2014] ¡Dianhuan ¡Lin, ¡Eyal ¡Dechter, ¡Kevin ¡Ellis, ¡Joshua ¡Tenenbaum, ¡and ¡Stephen ¡Muggleton. ¡Bias ¡ reformula)on ¡for ¡one-­‑shot ¡func)on ¡induc)on. ¡In ¡ECAI, ¡2014. ¡ [Gulwani, ¡2011] ¡Sumit ¡Gulwani. ¡Automa)ng ¡string ¡processing ¡in ¡spreadsheets ¡using ¡input-­‑output ¡examples. ¡In ¡ POPL, ¡2011. ¡ ¡ 10/10 ¡ 7/30/15 ¡

  11. Different ¡number ¡of ¡segments ¡ 32 ¡ 39 ¡41 ¡ 48 ¡ 1998 ¡Honda ¡Civic ¡ ¡130 ¡k ¡miles ¡-­‑ ¡$3800 ¡(Arcadia) ¡ Input: ¡ Trace ¡ Output: ¡ 1998 ¡Honda ¡Civic ¡Arcadia ¡$3800 ¡ ¡ ¡ h 31 ¡ h 32 ¡ h 33 ¡ Hypothesis ¡Spaces: ¡ H 3 ¡ 2000 ¡Ford ¡Expedi)on ¡los ¡angeles ¡$4900 ¡ Execu)on ¡Result: ¡ (START, ¡NUM, ¡1) ¡ (BNK, ¡NUM, ¡1) ¡ (BNK, ¡LWRD, ¡2) ¡ (NUM, ¡BNK, ¡-­‑1) ¡ Old ¡Program: ¡ Start ¡= ¡24 ¡ End ¡= ¡39 ¡ 7/30/15 ¡

Recommend


More recommend