query processing over incomplete autonomous databases
play

Query Processing over Incomplete Autonomous Databases - PowerPoint PPT Presentation

Query Processing over Incomplete Autonomous Databases


  1. Query Processing over Incomplete Autonomous Databases ��������������������������������������� ������������������������������ ������ �!�� ������������������������������ "��������#����������� $��!������������������������������ ��%%��������%���&������������������������������ �������� �����������������������������������������������������

  2. Introduction � �������'������'�������%������(��������%�������)�%� ��������)�����������&&����'�%��%�� ��'�'���%���� – *+(+��!���+���,�-������+���,����(�������,�*��+ �������� �����������������������������������������������������

  3. Incompleteness in Web Databases ���������������������� � � !���������� ���������������� � "�������������#�$���� � %���&'�(���'�#�$���� � 8������ 7��(����������� 6�����6����� �����������- ��'��#�����- �������- ����6��'��+��� *. 10*1� ..+/�- .+/- ,+*- 5���������+��� *4 .10/4 ),+�4- 00+�- 00+,- 3���������� 1�.2 0,�)). *��- ,.+./- )*+),- �������� �����������������������������������������������������

  4. Problem !������������������'���%������������������������ �����������9��� ,� � �������������)������.���������������������������/����������������+ High Precision Low Recall "�9�������������������������������� ����������������:�'�(��$���; Want a ‘Honda Accord’ with a ‘sedan’ body style for under ‘$12,000’ <�:� <�:� <�:� <�:� <�'�� <�'�� <�'�� <�'�� =��� =��� =��� =��� ����� ����� ����� ����� 5���� 5���� 5���� 5���� ��'� ��'� ��'� ��'� ���'� ���'� �����' �����' 4223 4223 032,522 032,522 ������ ������ ; ; ���'� ���'� �����' �����' 4223 4223 032,522 032,522 ������ ������ ��'�� ��'�� Many entities corresponding to tuples with missing values might ; ; �����' �����' 4224 4224 033,422 033,422 ����� ����� ��'�� ��'�� ���'� ���'� �����' �����' 4224 4224 033,422 033,422 ����� ����� ��'�� ��'�� be relevant to the user query ���'� ���'� �����' �����' 3111 3111 ; ; ����� ����� ��'�� ��'�� ���'� ���'� �����' �����' 3111 3111 01,222 01,222 ����� ����� ��'�� ��'�� �������� �����������������������������������������������������

  5. Possible Naïve Approaches �������>�?��'��#�����@�5����A �������>�?��'��#�����@�5����A 3+� 5 �!6��B C B�= > -�����������������)���� Low Recall ���� ���������'��������'���%����,�������� �����������(���'��������6�!���� 4+� � �� ! �6%!B�� > �������������������������� Low Precision, �����,���������������������)���������(� Infeasible ��'��������6�!���� ����(�)�������)���� �����(�%�'��������������� 7+� � �� ! �BD�� > -�������������)���������(� Costly, ��'��������6�!���� +�� �''���������,���� ���� Infeasible ���)���������(�%�'��������������� %�� &��'�����(�����������(����������'�������� ���������������� �������� �����������������������������������������������������

  6. Outline � 5����6��$��E��� � 8���&������9�����/��� � :�&������������;�*��������� � !����������;�#��������� �������� �����������������������������������������������������

  7. The QPIAD Solution 3�������E������>?� ��'�@5���� A����������������������������� Base Result Set �' <�:� <�'�� =��� ��'�� �' <�:� <�'�� =��� ��'�� 3 ��'� �? 4223 !���� 3 ��'� �? 4223 !���� 4 ��� @? 4224 !���� 4 ��� @? 4224 !���� 7 8������ ��.���� 4225 !���� 7 8������ ��.���� 4225 !���� ? ��� @? 4227 B%�� 5 ���'� !���� 422? B%�� LEARN LEARN A 9����� !���� 4224 ��'�� AFD: Model~> Body style B ��'� �? 422A B%�� ����������������������� Select Top K Rewritten Queries ���������������������� Ranked Relevant RANK RANK < 3 =>���'��6�? Uncertain Answers REWRITE REWRITE < 4 =>���'��6@? �' <�:� <�'�� =��� ��'�� 5��(�'���� < 7 =>���'��6��.���� ? ��� @? 4227 B%�� 2+B B ��'� �? 422A B%�� 2+7 EXPLAIN EXPLAIN �������� �����������������������������������������������������

  8. LEARN LEARN REWRITE REWRITE RANK RANK EXPLAIN EXPLAIN �������� �����������������������������������������������������

Recommend


More recommend