effec ve structured query formula on for session search
play

Effec)ve Structured Query Formula)on for Session Search - PDF document

11/12/12 Effec)ve Structured Query Formula)on for Session Search Dongyi Guan, Grace Hui Yang, Nazli Goharian Speaker: Grace Hui Yang Department of


  1. 11/12/12 ¡ Effec)ve ¡Structured ¡Query ¡ Formula)on ¡for ¡Session ¡Search ¡ Dongyi ¡Guan, ¡Grace ¡Hui ¡Yang, ¡Nazli ¡Goharian ¡ ¡ Speaker: ¡Grace ¡Hui ¡Yang ¡ ¡ Department ¡of ¡Computer ¡Science ¡ Georgetown ¡University ¡ ¡ Nov ¡9, ¡2012@TREC ¡ ¡ 1 ¡ Introduc)on ¡ • A ¡session ¡contains ¡ ¡ ¡ • Interac)ons ¡ -­‑ Previous ¡Queries ¡ ¡ q 1 , ¡ q 2 , ¡… ¡, ¡ q n -1 ¡ -­‑ Previous ¡Search ¡Results ¡ -­‑ Click ¡Informa)on ¡ • Current ¡Query ¡ q n ¡ • A ¡ retrieval ¡task ¡ ¡ • So, ¡we ¡basically ¡use ¡Lemur ¡– ¡a ¡strong ¡ baseline ¡ • The ¡problem ¡becomes ¡ ¡ • how ¡to ¡make ¡good ¡use ¡of ¡Lemur ¡ ¡ • … ¡and ¡how ¡to ¡improve ¡over ¡Lemur ¡ 2 ¡ 1 ¡

  2. 11/12/12 ¡ Outline ¡ • Our ¡Approach ¡ – Structured ¡Query ¡Formula)on ¡ – Query ¡Expansion ¡ – Duplicated ¡Queries ¡ – Document ¡Re-­‑ranking ¡by ¡Dwell ¡Time ¡ • Experiments ¡ 3 ¡ Structured ¡Query ¡Formula)on ¡ • We ¡emphasize ¡on ¡formula=ng ¡effec=ve ¡Lemur ¡queries ¡ – then ¡submit ¡the ¡queries ¡to ¡Lemur ¡ • An ¡observa)on: ¡ – In ¡a ¡query, ¡several ¡words ¡oZen ¡bundle ¡together ¡as ¡a ¡ phrase ¡to ¡express ¡a ¡coherent ¡meaning; ¡we ¡call ¡them ¡ nuggets ¡ – Nuggets ¡are ¡substrings ¡in ¡ q n , ¡similar ¡to ¡phrases ¡but ¡not ¡ necessarily ¡as ¡seman)cally ¡coherent ¡as ¡phrases ¡ – Using ¡nuggets ¡to ¡form ¡structured ¡query ¡could ¡be ¡more ¡ effec)ve ¡than ¡using ¡plain ¡free ¡text ¡query ¡ ¡ servering ¡spinal ¡cord ¡paralysis ¡ servering ¡#1(spinal ¡cord) ¡paralysis ¡ word ¡ nugget ¡ word ¡ 4 ¡ 2 ¡

  3. 11/12/12 ¡ How ¡to ¡Iden)fy ¡Nuggets ¡ • More ¡Observa)ons: ¡ – a ¡valid ¡nugget ¡(within ¡a ¡query) ¡appears ¡frequently ¡in ¡the ¡ top ¡returned ¡snippets ¡for ¡the ¡query ¡ – Even ¡if ¡the ¡words ¡in ¡a ¡nugget ¡do ¡not ¡appear ¡con=nuously ¡ in ¡the ¡snippets, ¡they ¡appear ¡close. ¡ ...preservation uk spinal cord injury care in egypt cky cord noats guitar viewsonic power cord malfunction spinal cord stimulator...injury spinal cord dell...extension cord nylon... cord paralysis vocal vegas… A ¡sample ¡snippet ¡for ¡TREC ¡2012 ¡session ¡53 ¡query ¡ servering ¡spinal ¡cord ¡ paralysis , ¡where ¡“spinal ¡cord” ¡are ¡grouped ¡as ¡a ¡nugget ¡#1(spinal ¡cord) ¡ 5 ¡ How ¡to ¡Iden)fy ¡Nuggets ¡ 1. Send ¡ q n ¡ to ¡Lemur, ¡get ¡ini)al ¡retrieval ¡results ¡ 2. look ¡for ¡possible ¡nuggets ¡in ¡the ¡top ¡ k ¡ snippets ¡ – High ¡frequency ¡adjacent ¡words ¡ – Other ¡words ¡which ¡frequently ¡co-­‑occur ¡within ¡a ¡ certain ¡proximity ¡ ¡ 6 ¡ 3 ¡

  4. 11/12/12 ¡ Strict ¡Method ¡ q w w  w = 1 2 l count( w i w i + 1 ;Snippet) w i w i + 1 are connected min(count( w i w i + 1 ;Snippet),count( w i w i + 1 ;Snippet)) ≥ θ ⇒ nugget # 1 ( w w  w ) w w  w are connected = i i 1 i k i i 1 i k + + + + Example ¡ Query ¡ servering ¡spinal ¡cord ¡paralysis ¡ Snippet ¡ ...preservation uk spinal cord injury care in egypt cky cord noats guitar viewsonic power cord malfunction spinal cord stimulator...injury spinal cord dell...extension cord nylon... cord paralysis vocal vegas… Structured ¡Query ¡ RL1 ¡Query ¡ servering ¡#1(spinal ¡cord) ¡paralysis ¡ 7 ¡ Relaxed ¡Method ¡ x ( w ; S ) ∑∑ 1 k j i t Define ¡centroid ¡of ¡a ¡word ¡ w i ¡is ¡ ¡ j x ( w ) = ⋅ i k count ( w ; S ) t 1 = i t # 1 ( w w ) | x ( w ) x ( w ) | 5 ⎧ − ≤ i i 1 i i 1 + + ⎪ Predict ¡the ¡nugget ¡window ¡size ¡ nugget # 2 ( w w ) 5 | x ( w ) x ( w ) | 10 = < − ≤ ⎨ i i 1 i i 1 + + ⎪ | x ( w ) x ( w ) | 10 Example ¡ φ − > ⎩ i i 1 + Query ¡ Structured ¡Query ¡ marsupial ¡cartoon ¡character ¡ marsupial ¡#2(cartoon ¡character) ¡ Snippet ¡ …about ¡a ¡ cartoon ¡character . ¡For ¡the ¡carnivorous ¡ marsupial , ¡see ¡Tasmanian…animated ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡7 ¡ ¡ ¡ ¡8 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ 9 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡10 ¡ ¡ ¡ ¡ ¡ ¡ ¡11 ¡ ¡ ¡12 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡13 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ 14 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡15 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡16 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡23 ¡ cartoon ¡character ¡in ¡the…series ¡of ¡ cartoons …the ¡ character ¡aZer…between ¡the ¡ ¡ ¡ ¡ ¡ ¡ ¡ 24 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡25 ¡ ¡ ¡ ¡ ¡ ¡26 ¡27 ¡ ¡ ¡ ¡ ¡ ¡ ¡32 ¡ ¡ ¡ ¡33 ¡ ¡ ¡ ¡ ¡ ¡ 34 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡38 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ 39 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡40 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡55 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡56 ¡ ¡ marsupial …encyclopedia ¡ cartoon ¡character ) ¡Jump…propelled ¡the ¡ character ¡to ¡new… ¡ ¡ ¡ ¡ ¡ ¡ ¡57 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡68 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ 69 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡70 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡71 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡80 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡81 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ 82 ¡ ¡ ¡ ¡ ¡ ¡ ¡83 ¡ ¡84 ¡ animated ¡ cartoon ¡character …Tunes ¡series ¡of ¡ cartoons . ¡The ¡ character ¡appeared ¡in… ¡ ¡ ¡ ¡ ¡ ¡89 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ 90 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡91 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡98 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡99 ¡ ¡100 ¡ ¡ ¡ 101 ¡ ¡ ¡ ¡ ¡ ¡ ¡102 ¡ ¡ ¡ ¡ ¡ ¡ 103 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡104 ¡ ¡ ¡ ¡ ¡ ¡105 ¡ x ( marsupial ) 35 = ⎫ marsupial RL1 ¡Query ¡ ⎪ ⎧ x ( cartoon ) 54 = ⇒ ⎬ ⎨ #2(cartoon character) ⎩ ⎪ 8 ¡ x ( character ) 60 = ⎭ 4 ¡

  5. 11/12/12 ¡ Query ¡Expansion ¡with ¡Previous ¡Queries ¡ 1. Extract ¡nuggets ¡and ¡words ¡from ¡every ¡query ¡ q 1 , ¡ q 2 , ¡… ¡, ¡ q n ¡in ¡a ¡session ¡ 2. Combine ¡them ¡and ¡weigh ¡them ¡by ¡per-­‑query ¡ weight ¡ λ k ¡ #weight( λ 1 #combine( nugget 11 nugget 12  nugget 1 m w 11 w 12  w 1 r ) λ 2 #combine( nugget 21 nugget 22  nugget 2 m w 21 w 22  w 2 r )  λ n #combine( nugget n 1 nugget n 2  nugget nm w n 1 w n 2  w nr ) ) RL2 ¡Query ¡ 9 ¡ Query ¡Expansion ¡with ¡previous ¡queries ¡ Weigh)ng ¡Schemes ¡ • Uniform ¡ All ¡queries ¡are ¡assigned ¡the ¡same ¡weight. ¡ ¡ 1 λ = k • Previous ¡vs. ¡current ¡ All ¡previous ¡queries ¡share ¡the ¡same ¡weight ¡while ¡the ¡ current ¡query ¡uses ¡a ¡complementary ¡and ¡higher ¡ weight ¡ k 1 , 2 ,  n 1 λ ⎧ = − p ¡ 0 . 4 λ = λ = ⎨ p k 1 k n − λ = ¡ ⎩ p • Distance-­‑based ¡ The ¡weights ¡are ¡distributed ¡based ¡on ¡how ¡far ¡a ¡query’s ¡ posi)on ¡in ¡the ¡session ¡is ¡from ¡the ¡current ¡query ¡ λ ⎧ p k 1 , 2 ,  n 1 ⎪ = − 0 . 4 λ = λ = n k ⎨ − p k 1 k n ⎪ − λ = 10 ¡ ⎩ p 5 ¡

Recommend


More recommend