Résumé 83 :
Une approche PAC-bayésienne d'un problème de ranking binaire en grande dimension
Guedj, Benjamin ; Robbiano, Sylvain
UPMC
Le \emph{ranking} binaire est un problème d'apprentissage supervisé qui consiste à apprendre, d'un échantillon initial $\mathcal{D}_n=\{({\bf X_i},Y_i)\}_{i=1}^n$, à ranger des observations $\bf X_i$ dans le même ordre que leurs labels $Y_i\in\{\pm 1\}$. Nous nous situons dans le cadre de la grande dimension, en considérant des observations $\bf X_i\in\mathbb{R} ^d$, où $d\gg n$. Il est pertinent de chercher à résoudre cette tâche en définissant la notion de fonction de \emph{scoring}. Nous proposons d'approcher la fonction de \emph{scoring} optimale par une procédure basée sur la distribution \emph{a posteriori} de Gibbs, favorisant les estimateurs parcimonieux et s'écrivant de façon additive en les covariables. Ce schéma présente l'avantage de faciliter l'interprétation de l'effet de chaque covariable, tout en préservant une formulation non paramétrique. Nous proposons pour cette procédure une étude théorique à l'aide des outils PAC-bayésiens, ainsi qu'une mise en \oe uvre faisant appel à des techniques de simulation par MCMC.