Résumé 269 :

Bornes de risque améliorées pour le Lasso
Dalalyan, Arnak ; Hebiri, Mohamed ; Lederer, Johannes
LAMA, Université Paris Est

Malgré le nombre important de travaux concernant l'étude théorique de l'estimateur Lasso, la relation entre sa performance statistique et les corrélations entre les variables explicatives n'est pas très bien comprise. Le but de ce travail est de fournir de nouveaux résultats sur cette relation dans le cadre de la régression linéaire multiple. D'une part, nous montrons que l'incorporation dans le paramètre d'ajustement d'un indicateur simple de corrélation entre les variables conduit à des inégalités oracles exactes avec un terme résiduel optimal même dans des cas où les variables explicatives sont fortement corrélées. D'autre part, nous exhibons un exemple révélant que pour certaines matrices de design comportant des variables modérément corrélées, la qualité de la prédiction Lasso est médiocre quelle que soit la valeur du paramètre d'ajustement.