Résumé 114 :

Margin conditions for vector quantization
Levrard, Clément
Université Paris Sud & UPMC

Le point de vue adopté durant cette présentation est celui de la classification non supervisée: étant donné une distribution de probabilité sur un espace de dimension finie, le but est de déterminer une suite finie de points représentant au mieux cette distribution. N'ayant accès qu'à un échantillon tiré suivant la distribution source, la stratégie adoptée est celle de la minimisation d'un critère empirique de type moindre carré, dont le pendant implémenté est la procédure des k means introduite par Hartigan. En inscrivant le problème théorique des k means dans le contexte plus général des procédures de minimisation de fonctions de contraste, certaines conditions apparaissent comme favorables pour la vitesse de convergence de cette procédure en la taille de l'échantillon. Dans un premier temps, nous montrerons que ces conditions peuvent être vues comme l'analogue des conditions de marge introduites par Mammen et Tsybakov dans le domaine voisin de la classification supervisée. Nous discuterons ensuite de l'influence des autres paramètres introduits par ces conditions de marge sur la vitesse de convergence au travers d'inégalités oracles et de résultats de type minimax.