Résumé 148 :

Classification de données de régression de grande dimension
Devijver, Emilie
Université Paris-Sud XI

Les modèles de mélange en régression sont utilisés pour modéliser la relation qui existe entre la réponse et les prédicteurs, lorsque ces données proviennent de diffèrentes classes. Avec l'augmentation des données de grande dimension, les modèles doivent aujourd'hui tenir compte des problèmes entraînés. Durant cet exposé, nous proposerons une procédure de classification non supervisée en grande dimension. Nous reprenons l'usage de la pénalisation $\ell_1$ pour sélectionner les variables pertinentes, et pour construire une collection de modèles de mélange, obtenue en faisant varier le paramètre de régularisation. Nous estimons les paramètres de chaque modèle par maximum de vraisemblance, puis nous sélectionnons un modèle grâce à un critère pénalisé $\ell_0$ non asymptotique, construit à partir des données, suivant l'heuristique de pente de Birgé et Massart. Nous validerons cette procédure sur des données fonctionnelles, exemple typique de données de grande dimension. Notre procédure est appliquée à la projection sur une base d'ondelettes de ces fonctions, de façon à garder l'aspect fonctionnel.