Résumé 135 :

Construction et estimation des capacités d'un score pronostique : intérêt de la pénalisation de LASSO et de l'estimateur bootstrap 0.632+ appliqués aux courbes ROC dépendantes du temps
Fournier, Marie-Cécile ; Gillaizeau, Florence ; Le Fur, Awena ; Dantal, Jacques ; Foucher, Yohann
EA4275 ; ITUN

Les données de masse ou "big data" sont caractérisées par un petit nombre d'individus et un grand nombre de variables. Face au risque de surajustement, les méthodes de régression et de sélection classiques ne peuvent plus être utilisées. Une solution est la pénalisation de LASSO qui sélectionne les variables sur la vraisemblance pénalisée. En présence de données censurées, elle peut être appliquée au modèle de Cox pour construire un score pronostique. L'estimation des capacités prédictives du score obtenu est réalisée avec des courbes ROC dépendantes du temps et corrigée par un algorithme de rééchantillonnage : le bootstrap 0.632+. Cette méthode, publiée auparavant dans le champ des biopuces et validée par des études de simulations, est présentée ici pour une application alternative sur données cliniques réelles dans le domaine de la transplantation rénale.