Résumé 131 :

Sélection de variables pour l'imagerie hyperspectrale
Zullo, Anthony ; Fauvel, Mathieu ; Ferraty, Frédéric
INRA

l'imagerie hyperspectrale est un domaine qui s'est developpe recemment et qui necessite le developpement de nouvelles methodes statistiques specifiquement adaptees. le principal probleme engendre par ces images provient de la finesse de leur resolution spectrale, generant ainsi des donnees de grandes dimensions, et entrainant en consequence l'apparition du probleme statistique appele fleau de la dimension se referant a la situation ou le rapport nombre de variables sur taille d'echantillon est tres grand. l'objectif de cette presentation est d'evaluer la pertinence de deux methodes parcimonieuses, l'une lineaire et l'autre non lineaire, permettant de predire une reponse scalaire a partir d'un petit nombre de variables explicatives. nous nous focalisons sur la mise en oeuvre de deux techniques statistiques dites selectives dont l'objectif principal est de retenir un nombre raisonnable de variables explicatives tout en conservant un bon pouvoir predictif. l'avantage de ce type de methodes selectives est qu'il propose des modeles plus interpretables. la premiere methode selective implementee, appelee Lasso, permet de retenir les variables les plus explicatives dans le cadre d'un modele de regression lineaire. la seconde est une methode selective non-parametrique developpee recemment qui combine un algorithme pas a pas de type forward avec un outil d'estimation non-parametrique appele regression lineaire locale. l'aspect non-parametrique de cette methode autorise la prise en compte de relations non lineaires. les comportements de ces deux methodes sont compares sur un jeu de donnees hyperspectral selon un critere de validation croisee.