previous up next top index
Précédent : Composition de l'équipe Remonter : Avant-projet IS2 Suivant : Actions de recherche


Présentation du projet

L'avant-projet IS2 effectue des recherches en modélisation statistique. Plus spécifiquement, nous nous intéressons à la modélisation, à l'identification des modèles obtenus et à leur validation pour des systèmes ou des situations complexes pouvant intervenir dans le domaine industriel ou biomédical.

IS2 s'intéresse essentiellement aux modèles, dits à structure de données incomplètes, où intrinséquement une partie de l'information nécessaire à l'identification du phénomène étudié est manquante. Ces modèles sont courants (durées de vie censurées, modèles hétéroscédastiques, ...) et puissants (modèles à structure cachée, ...). Ils apparaissent dans de nombreux problèmes statistiques qui se posent en milieu bio-médical et en milieu industriel. Ces modèles à observation partielle sont difficiles à estimer, de par leur nature intrinsèque et aussi parce qu'ils concernent eux-mêmes des systèmes complexes (montage industriel compliqué, existence d'une structure de dépendance temporelle ou spatiale, nombreuses variables en jeu, ...). De ce fait, ces modèles sont en général faiblement identifiables en ce sens que, au vu des observations effectivement recueillies, plusieurs jeux différents de paramètres peuvent apparaître également bons. Cela se traduit par une multiplicité des extrema locaux des fonctions de contrastes utilisées pour procéder à l'identification (vraisemblance, probabilité a posteriori, ...). Ainsi, ces modèles requièrent une grande rigueur conceptuelle et méthodologique, le recours raisonné à un principe de parcimonie (retenir le modèle le moins complexe pour une qualité d'ajustement acceptable), et l'utilisation d'outils algorithmiques sophistiqués.

L'un des buts de IS2 est de proposer des méthodes d'estimation et d'évaluation efficaces de ces modèles. En particulier, nous nous intéressons à l'utilisation et à l'étude théorique d'algorithmes stochastiques (versions stochastiques de l'algorithme EM, algorithmes MCMC, algorithmes de rééchantillonnage) dont le dénominateur commun est la restauration des données manquantes par simulation.

Les modèles considéreés par IS2 sont par ailleurs souvent dictés par les problèmes qui nous sont soumis. Ainsi le choix de modèles bayésiens pour des problèmes d'analyse de défaillance s'explique par l'existence effective d'informations a priori et par la rareté des données de retour d'expérience. Dans le même ordre d'idée, notre intérêt récent pour la modélisation des événements rares vient d'un problème que nous a soumis EDF. Dans ce souci de proposer des modèles bien reliés aux préoccupations des utilisateurs, nous nous intéressons sérieusement à une stratégie de modélisation par un principe de maximum d'entropie. Ce principe produit à la fois une relecture éclairante de modèles classiques, et fournit aussi les moyens d'obtenir, plus ou moins automatiquement, des modèles réalistes à partir de quantités jugées pertinentes par les utilisateurs.

La validation des modèles construits et identifiés est bien sûr un élément important de la recherche. Nous l'abordons par des tests non paramétriques ou, dans une perspective bayésienne, par le calcul de critères de parcimonie.



previous up next top index Précédent : Composition de l'équipe Remonter : Avant-projet IS2 Suivant : Actions de recherche