Résumé 175 :

Classification de variables pour la régression Probit en grande dimension
Yengo, Loïc ; Jacques, Julien ; Biernacki, Christophe
Institut de Biologie de Lille

La réduction de la dimension est une des problématiques majeures de la régression en grande dimension. Nous avons récemment introduit, dans le cadre de régression linéaire, une nouvelle approche visant la réduction de la dimension par la classification des covariables en groupes de mêmes effets. Nous proposons ici une extension de ce dernier modèle à la régression Probit pour données binaires. Les qualités de prédiction du modèle proposé sont comparées à la régression logistique pénalisée en norme L1 (LASSO) et L2 (ridge). Cette comparaison effectuée à la fois sur des données réelles et simulées, révèle les bonnes qualités prédictives de notre approche.