Résumé 155 :
Processus empirique dans les sondages
Bertail, Patrice ; Chautru, Emilie ; Clémençon, Stéphan
Université Paris-Ouest
Ce travail présente une étude du comportement du processus empirique dans le cadre des sondages et est motivé par des problèmes liés au traitement de grandes masses de données (big data). Dans certaines situations de données massives (big data), un plan de sondage peut en effet être également un moyen efficace de réduire la taille du problème. Pour étudier des procédures de minimisation de risques empiriques issues d'algorithmes complexes, il est naturel d'étudier dans un premier temps le comportement asymptotique d'une version adéquate du processus empirique. Notre but est d'étudier comment incorporer le plan de sondage dans l'estimation uniforme d'une mesure de probabilité P sur un espace mesurable, vue comme un opérateur linéaire agissant sur une classe de fonctions F afin d'obtenir des résultats de normalité asymptotique. Notre but est d'étudier des plans de sondages plus généraux proches en un certain sens des plans de sondages Poissoniens et suit plus particulièrement les approches de Hajek(1964) et Berger(1998). Ceci inclue en particulier les plans réjectifs et les plans de type Rao-Sandford. Le principal résultat de ce travail est un théorème fonctionnel donnant le comportement asymptotique du processus empirique repondéré (ou processus empirique de Horvitz-Thompson), indexé par une classe de fonction dans un modèle de superpopulation.