Strong Asymptotic Assertions for Discrete MDL in Regression and Classification or A Strange Way of Proving Consistency of MDL Learning Jan Poland and Marcus Hutter IDSIA � Lugano � Switzerland
2 Focus of this Talk Regression Classification this talk this paper Sequence Prediction COLT‘04
3 Why Consistency? � ���������� �������� ���� ����� ��� ����� ����� ��� ������ �� ��� ����� � ��� ��� �������� ��� ���������� � ��� ������� ������ ���� �� ����� ��� ������ �� �� ���������� ������� ��������� � ����������� �� � ��������� �������� ���� �� ��������� ��� ����� ������� � �������� ��� ����� ���� ���������� ������������ � ����� ��� ���������� ������������
4 Setup � ���� ��!� �������� ���� � x �� n , y �� n � � ����� x i � � ��� y i � � � , � � ��� � � i � n � ���� � ��� ����� x � � " ���� �� ��� �����# �������� ������ y � � $��� �������� %�������& ���� �� ��� �����# ������ ���� y � x � � � � � '�������& ����� � '($" � ������ ���" )))
5 Bayesian Framework � * ����� �� � �������� ν ���! � �� ��� �����# ������ !������� �� � � , � � � ��� � �� � ��������� !���� ����� � +��� ν � � �� �������� � ����� ������ w ν > � � ,���� ���%������& � ν ∈C w ν � � � +��!���& � ���� � � � � �� ��� ����� �� �������� ������ ���������� �� ��� �����
6 Proper/Online Learning .����� �������� ����!�����& � ��� ������ x � � ��� ��������� �� ��!� ��������� !�������! � ��� ������� y ��� ��������� �� � ������# ������ � � � -����� ��������& ����� ���������� ������������ � � �� x �� t , y <t � ��� ���������� ���� � x <t , y <t �
7 Bayes Mixture � ����" ����� � x �� n , y �� n � " ������� ��������� �� ��� ����� ������� � � n �� t �� ν � y t � x t � ν w ν � � n ξ � y n �� � x �� n �� , y �� n � � t �� ν � y t � x t � ν w ν � ��� /���� !������ �� ��� ���� �� ��� �� ����� ��� /������� ����!������" ���� � �� �� ������ �� �������� ��� �� ����������� � �� ��� ������ � ������������ ��� ������ � ��� ���������� ��� �����������
8 Static MDL ���������" �� !���� ������ ��� ��� $*.�& ̺ ������ � y n �� � x �� n �� , y �� n � � ν ∗ � x �� � ,y �� � � � y n �� � x n �� � ����� ν ∗ ν ∈C � w ν ν � y �� n � x �� n � � � x �� � ,y �� � � � ��� ��� 0����!��� ��� ��� ��� ���� ��������� ����� ���! � )
9 Dynamic MDL ��� ���! ������ $0� �� ������� �� ���#���!���1�� ��� ���!���1�� ������� ��� " ����� �� ���� ��� ��� ������& ̺ � y n � , y <n � � ̺ � y �� n � x �� n � ̺ � y <n � x <n � ̺ � y �� n � x �� n � � ̺ � y n � , y <n � � � y � ̺ � y �� n � x �� n � ���� ̺ � y �� n � x �� n � � ��� ν ∈C � w ν ν � y �� n � x �� n � � . ���� !����& ��!���� � ��� ����!��� ��� ���� �������� y n ) ���� ���� ��� ����!�� $0� ��������� !�� �� ��� � ����������� ������� �!��� !��� ���� 2�)
10 Distance and Convergence ��������� �������� �� ��� ���������� �������������& �� � � � � h � � � y t � x �� t , y <t � � ψ � y t � x �� t , y <t � t � �, ψ � � . y � ∈{ � , � } ���� ��� ψ #����������� �������� �� ��� � #����������� �� ��������� ��� �� � ∞ H � � � h � t � �, ψ �� < � . x � ∞ � �, ψ � � t �� ���� �!����� h � t � � ������ ������ )
11 Other Distance Measures � � � � � � y t � x �� t , y <t � � ψ � y t � x �� t , y <t � s t � �, ψ � � y � ∈{ � , � } �%���� �������� � � � � � � � � y t � x �� t , y <t � � ψ � y t � x �� t , y <t � a t � �, ψ � � � y � ∈{ � , � } �������� �������� � � � y t � x �� t , y <t � � �� � � y t � x �� t , y <t � d t � �, ψ � � ψ � y t � x �� t , y <t � y � ∈{ � , � } ,������3#������� ����������
12 Distance Measures: Properties � � �������� ���%������ � � � a t � 4�������� �������� h t & � d t � � � �!����� ��������� ���� ������ � � �������� ���%������ � � � a t � 5�������� �������� s t & � d t � � � �!����� ��������� ���� ������ � �������� ���%������ � *������� �������� a t & � d t � �������� ���%������ � ,������3#������� ���������� d t & � a t
13 Convergence Theorem 6����� � � � ������� ���������" ��� w � �� ��� ����� ������ �� � " ���� ̺ ������ ̺ ̺ � � � � � t a t � � w − � t a t � � w − � t d t � � w − � � � � � H � � �,̺ ������ � � �� w − � �
14 Properties of the Proof � .����� ��������� � �� ������ -#���!� � �������� �� '���!���7� ����� ��� ������# ��� ���������
15 Loss bounds � *���!� ���� ����������� ������ � ���� ℓ � y, � y � x � � ���� ������� �� ����� x " ���� ������ �� y " ��� ���# ������� � y � ���� �� ������ ������� �� ����� �� �������� �������� ���� ���) ��� ������� ������� �/����#����!��� � L ������� ��!������� �������� ���� � ���� ����� & � L � ̺ � � L � � � � �� w − � �� w − � � � � � L � � � � � �������� ���#����� ������ ��������� �� 1��� ��# !��� ������
Recommend
More recommend