Résumé 173 :

Clustering par quantification en présence de censure
Gribkova, Svetlana
LSTA UPMC

Les méthodes de clustering ont pour but de déterminer au sein d'une population hétérogène plusieurs groupes d'objets homogènes avec une séparation maximale entre les groupes. Cette problématique appara\^it dans de nombreux domaines comme la biologie, la médecine ou encore l'économie et la finance. Dans cet exposé, on s'intéressera plus particulièrement au problème de clustering pour les données de survie où l'éventuelle présence de censure rend les méthodes existantes inapplicables. Le but de ce travail est de proposer une nouvelle méthode de clustering pour une configuration où les observations sont composées d'une variable de durée (éventuellement censurée) et d'un vecteur de covariables qui est observé pour tous les individus. Cette méthode utilise la notion de quantification et généralise l'algorithme classique des ``k-meansé. On étudiera théoriquement la consistance de la méthode et on présentera une inégalité exponentielle qui permet de contr\^oler la différence entre la distorsion minimale et celle d'un quantificateur empirique optimal. En conclusion on présentera des applications numériques aux données simulées et réelles.