Résumé 141 :
KMLCOV : K-means longitudinal avec ajustement sur covariables
Subtil, Fabien ; Ecochard, René ; Genolini, Christophe
Hospices Civils de Lyon, Service de Biostatistique, CNRS UMR 5558
La classification de données longitudinales est une méthode de plus en plus fréquemment utilisée en médecine. Les modèles de mélange permettent d’obtenir un compromis entre la classification et l’adéquation aux données. K-means est un algorithme dédié à la classification pure, mais il ne permet pas d’introduire des covariables dans la modélisation des trajectoires, et suppose que les mesures sont réalisées toutes au même temps. Le package R kmlCov propose une extension de l’algorithme du k-means en utilisant la vraisemblance comme métrique de distance. Ceci permet d’introduire des covariables dans la modélisation des trajectoires (à effet fixe ou variable d’un groupe à l’autre), de prendre en compte différentes natures de variables trajectoire (continue, binaire, comptage), et d’autoriser des mesures à des temps différents d’un individu à l’autre.