grounded seman cs
play

Grounded Seman,cs Berkeley N L P Jacob - PowerPoint PPT Presentation

Grounded Seman,cs Berkeley N L P Jacob Andreas What does the world look like? HAL 0 open 0 Bowman 0 close 0 podBayDoors 0 Todays plan


  1. Grounded ¡Seman,cs ¡ Berkeley ¡ N ¡ ¡ ¡ ¡L ¡ ¡ ¡ ¡P ¡ Jacob ¡Andreas ¡

  2. What ¡does ¡the ¡world ¡look ¡like? ¡ HAL 0 open 0 ∧ Bowman 0 close 0 podBayDoors 0 ∃

  3. Today’s ¡plan ¡ 1. How ¡do ¡we ¡relate ¡language ¡to ¡a ¡richer ¡ representa,on ¡of ¡the ¡world? ¡ 2. How ¡do ¡we ¡learn ¡meanings ¡without ¡ annotated ¡logical ¡forms? ¡

  4. Today’s ¡plan ¡ Open ¡the ¡pod ¡bay ¡doors, ¡HAL ¡ ¡ ¡ open(HAL , podBayDoors) ¡ ¡ ¡

  5. Today’s ¡plan ¡ Grounded ¡ Formal ¡seman,cs: ¡ ¡ How ¡do ¡we ¡learn ¡the ¡rela,onship ¡between ¡text ¡ and ¡logical ¡forms? ¡ the ¡world ¡

  6. Three ¡approaches ¡ 1. Learning ¡with ¡hardcoded ¡predicates ¡ 2. Jointly ¡learning ¡parsers ¡and ¡classifiers ¡ 3. Learning ¡a ¡policy ¡directly ¡

  7. Hard-­‑coded ¡predicates ¡ Don’t ¡forget: ¡ ¡ the ¡λ-­‑calculus ¡is ¡a ¡programming ¡language! ¡ ¡ final ¡Entity ¡HAL ¡= ¡... ¡ Entity ¡podBayDoors ¡= ¡... ¡ void ¡open(Entity ¡opener, ¡Entity ¡opened) ¡{ ¡ ¡... ¡ } ¡ ¡

  8. Hard-­‑coded ¡predicates ¡ Given ¡full ¡supervision ¡we ¡can ¡immediately ¡ execute ¡output ¡from ¡our ¡seman,c ¡parser. ¡ ¡ final ¡Entity ¡HAL ¡= ¡... ¡ Entity ¡podBayDoors ¡= ¡... ¡ void ¡open(Entity ¡opener, ¡Entity ¡opened) ¡{ ¡ ¡... ¡ } ¡ ¡

  9. Hard-­‑coded ¡predicates ¡ Open ¡the ¡pod ¡bay ¡doors, ¡HAL ¡ ¡ ¡ open(HAL, ¡podBayDoors) ¡ ¡ ¡ ¡

  10. Distant ¡supervision ¡ Can ¡we ¡use ¡the ¡ability ¡to ¡execute ¡predicted ¡ parses ¡to ¡learn ¡with ¡weaker ¡supervision? ¡ ¡ ¡ ¡ ¡ ¡ ¡

  11. Distant ¡supervision ¡ Can ¡we ¡use ¡the ¡ability ¡to ¡execute ¡predicted ¡ parses ¡to ¡learn ¡with ¡weaker ¡supervision? ¡ ¡ Before: ¡ Open ¡the ¡pod ¡bay ¡doors ¡ observe ¡text ¡ predict ¡LF ¡ close(HAL, ¡podBayDoors) ¡ open(HAL, ¡podBayDoors) ¡ observe ¡true ¡LF ¡ ¡ 1 . 0 incur ¡loss ¡

  12. Distant ¡supervision ¡ Can ¡we ¡use ¡the ¡ability ¡to ¡execute ¡predicted ¡ parses ¡to ¡learn ¡with ¡weaker ¡supervision? ¡ ¡ Before: ¡ Open ¡the ¡pod ¡bay ¡doors ¡ observe ¡text ¡ predict ¡LF ¡ open(HAL, ¡podBayDoors) ¡ open(HAL, ¡podBayDoors) ¡ observe ¡true ¡LF ¡ ¡ 0 . 0 incur ¡loss ¡

  13. Distant ¡supervision ¡ Can ¡we ¡use ¡the ¡ability ¡to ¡execute ¡predicted ¡ parses ¡to ¡learn ¡with ¡weaker ¡supervision? ¡ Now: ¡ Open ¡the ¡pod ¡bay ¡doors ¡ observe ¡text ¡ predict ¡LF ¡ close(HAL, ¡podBayDoors) ¡ doorsClosed ¡= ¡true ¡ predicted ¡outcome ¡ doorsClosed ¡= ¡false ¡ desired ¡outcome ¡ ¡ 1 . 0 incur ¡loss ¡

  14. Distant ¡supervision ¡ Recall ¡our ¡previous ¡training ¡procedure. ¡ ¡ Structured ¡perceptron ¡update: ¡ θ t +1 = θ t + Φ ( x, y ) − Φ ( x, ˆ ¡ y ) where ¡ θ > Φ ( x, y ) y = arg max ˆ ¡ y ¡

  15. Distant ¡supervision ¡ Now ¡only ¡supervision ¡is ¡an ¡ outcome ¡z. ¡ ¡ Structured ¡perceptron ¡update: ¡ θ t +1 = θ t + Φ ( x, y ∗ ) − Φ ( x, ˆ ¡ y ) where ¡ θ > Φ ( x, y ) y = arg max ˆ ¡ y ¡ y ⇤ = arg max θ > Φ ( x, y ) y :exec( y )= z

  16. Distant ¡supervision ¡ close(HAL, ¡podBayDoors) ¡ ˆ y open(HAL, ¡podBayDoors) ¡ y ∗ open(HAL, ¡cockpitDoors) ¡ make(HAL, ¡sandwich, ¡Dave) ¡ … ¡ smash(HAL, ¡podBayDoors, ¡filingCabinet) ¡ y ∗

  17. Distant ¡supervision ¡ Open ¡the ¡pod ¡bay ¡doors, ¡HAL ¡ ¡ ¡ open(HAL, ¡podBayDoors) ¡ ¡ ¡ ¡

  18. What ¡can ¡we ¡do ¡with ¡this? ¡ Learn ¡to ¡answer ¡ques,ons ¡given ¡only ¡ ¡ (ques,on, ¡answer) ¡pairs ¡and ¡a ¡database ¡of ¡facts ¡ [Liang ¡et ¡al. ¡2011 ¡& ¡various ¡others] ¡ ¡ Learn ¡to ¡follow ¡direc,ons ¡given ¡only ¡ (source, ¡pairs) ¡and ¡a ¡model ¡environment ¡ [Chen ¡& ¡Mooney ¡2011, ¡Artzi ¡& ¡Ze_lemoyer ¡2013] ¡

  19. Joint ¡parsing ¡and ¡percep,on ¡ What ¡if ¡the ¡world ¡doesn’t ¡look ¡like ¡a ¡database ¡ underneath? ¡ ¡ Open ¡the ¡elevator ¡doors, ¡HAL ¡ ¡ What’s ¡a ¡door? ¡

  20. Joint ¡parsing ¡and ¡percep,on ¡ What’s ¡a ¡door? ¡ ¡ f ( podBayDoors ) = true ¡ ¡ ¡ ¡ door ¡ podBayDoor, ¡elevatorDoor1, ¡cockpitDoor, ¡… ¡ window ¡ bridgeWindow, ¡bathroomWindow, ¡… ¡ ¡ isOpen ¡ podBayDoor, ¡bathroomWindow ¡ ¡

  21. Joint ¡parsing ¡and ¡percep,on ¡ What’s ¡a ¡door? ¡ ¡ ¡ ! ¡ true ¡ f = ¡ ¡ ¡

  22. Joint ¡parsing ¡and ¡percep,on ¡ What’s ¡a ¡door? ¡ ¡ ¡ ! ¡ true ¡ f = ¡ ¡ ¡

  23. Joint ¡parsing ¡and ¡percep,on ¡ What’s ¡a ¡door? ¡ ¡ ¡ ! ¡ false ¡ f = ¡ ¡ ¡

  24. Joint ¡parsing ¡and ¡percep,on ¡ Fixed ¡inventory ¡of ¡func,ons ¡ ¡ ¡ ¡ ¡ ¡

  25. Joint ¡parsing ¡and ¡percep,on ¡ Fixed ¡inventory ¡of ¡func,ons ¡ ¡ One ¡func,on ¡per ¡word ¡ ¡ door ¡ ¡door’: ¡ ¡Image ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡Boolean ¡ in ¡ ¡ ¡in’: ¡(Image, ¡Image) ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡Boolean ¡

  26. Joint ¡parsing ¡and ¡percep,on ¡ blue ¡ 1 ¡ mug ¡ 1, ¡3 ¡ on ¡ (1,4), ¡(2,4), ¡(3,4) ¡ table ¡ 4 ¡ blue ¡mug ¡on ¡the ¡table ¡ ¡ λ x. ∃ y.blue ( x ) ∧ table ( y ) ∧ on ( x, y ) [Krishnamurthy ¡et ¡al. ¡2013] ¡

  27. Joint ¡parsing ¡and ¡percep,on ¡ ✓ ◆ blue ¡mug ¡ | on ¡the ¡ p , table ¡ ¡ text ¡ query ¡ image ¡ database ¡ answer ¡

  28. Joint ¡parsing ¡and ¡percep,on ¡ Can ¡even ¡learn ¡to ¡compose ¡these ¡grounding ¡ func,ons: ¡ ¡ a ¡blue ¡eye ¡ ¡ a ¡dark ¡blue ¡eye ¡ ¡ a ¡dark ¡pastel ¡blue ¡eye ¡ [Andreas ¡et ¡al. ¡2013] ¡

  29. ¡ The ¡picture ¡so ¡far ¡ ¡ ¡ Open ¡the ¡pod ¡bay ¡doors ¡ observe ¡text ¡ predict ¡LF ¡ close(HAL, ¡podBayDoors) ¡ predicted ¡outcome ¡ doorsClosed ¡= ¡true ¡ desired ¡outcome ¡ doorsClosed ¡= ¡false ¡ incur ¡loss ¡ ¡ 1 . 0

  30. ¡ The ¡picture ¡so ¡far ¡ ¡ ¡ Open ¡the ¡pod ¡bay ¡doors ¡ observe ¡text ¡ predict ¡LF ¡ close(HAL, ¡podBayDoors) ¡ predicted ¡outcome ¡ doorsClosed ¡= ¡true ¡ desired ¡outcome ¡ doorsClosed ¡= ¡false ¡ incur ¡loss ¡ ¡ 1 . 0

  31. ¡ ¡ ¡Learning ¡a ¡condi,onal ¡policy ¡ Learn ¡an ¡intermediate ¡meaning ¡representa,on ¡ ¡ X p (result | text) = p (result | MR) p (MR | text) ¡ MR ¡ Learn ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡directly ¡ p (result | text)

  32. MDP ¡refresher ¡ • Set ¡S ¡of ¡states ¡ • Set ¡A ¡of ¡ac,ons ¡ • Transi,on ¡func,on ¡T ¡: ¡(S ¡x ¡A) ¡ ¡ ¡ ¡ ¡S ¡ • Reward ¡func,on ¡R ¡: ¡(S ¡x ¡A) ¡ ¡ ¡ ¡ ¡ ¡ R Lots ¡of ¡algorithms ¡for ¡ learning ¡a ¡policy ¡ ¡ ¡ ¡ ¡: ¡S ¡ ¡ ¡ ¡ ¡A ¡given ¡only ¡black-­‑box ¡interac,on ¡ π

  33. Reading ¡as ¡an ¡MDP ¡ Idea: ¡augment ¡base ¡MDP ¡state ¡space ¡with ¡ posi,on ¡in ¡document. ¡ ¡ Open ¡the ¡pod ¡bay ¡doors ¡aeer ¡making ¡me ¡a ¡sandwich ¡ ¡ {sandwich=true, ¡doorOpen=true}, ¡ ¡ {sandwich=true, ¡doorOpen=false}, ¡ ... ¡ { ¡ } ¡ sandwich=true, ¡doorOpen=false ¡ text= Open ¡the ¡pod ¡bay ¡doors ¡aeer ¡making ¡me ¡a ¡sandwich ¡

  34. Reading ¡as ¡an ¡MDP ¡ Now ¡just ¡want ¡to ¡pick ¡ ¡ ¡ � sandwich=true, ¡doorOpen=false ¡ � f ∈ text= Open ¡the ¡pod ¡bay ¡doors ¡aeer ¡making ¡me ¡a ¡sandwich ¡ ¡ { a 1 , a 2 , ... } ¡ maximizing ¡reward. ¡ ¡ Use ¡your ¡favorite ¡policy ¡learning ¡technique! ¡ [Vogel ¡& ¡Jurafsky ¡2010, ¡Branavan ¡et ¡al. ¡numerously] ¡

Recommend


More recommend