Avant-projet Estime

Précédent : Présentation générale et
objectifs Remonter : Avant-projet ESTIME, Estimation de paramètres
Suivant : Grands domaines d'application
Participant : Guy Chavent , François Clément , Susana
Gómez , Michel Kern , Jean-Marc Cognet , Jérôme Jaffré , Benoît
Lavaud , Claire Leleu , Christophe Berthelot
Mots-clés : Problème inverse,estimation de
paramètre,moindres carrés
Problème mal posé: Problème dont la solution ne dépend pas
de façon continue des données
Moindres carrés: On cherche à minimiser l'erreur
quadratique entre la mesure réelle et la mesure simulée en
fonction des paramètres
Résumé : Un problème inverse, ou d'estimation de
paramètre, consiste à rechercher les coefficients d'une
équation aux dérivées partielles, à partir de mesures sur sa
solution. Une formulation aux moindres carrés utilisant les
techniques de contrôle optimal est une façon naturelle de poser
ce problème.
Les problèmes inverses sont typiquement mal posés, ce qui
donne une grande importance à leur formulation. D'autres
difficultés spécifiques sont dues à la grande taille des
problèmes rencontrés, au calcul exact du gradient de la
fonction coût, au choix de la paramétrisation,ainsi qu'aux
questions théoriques liées à l'identifiabilité.
Considérant une équation aux dérivées
partielles ou un système de telles équations, le problème direct
consiste à calculer la solution, connaissant les coefficients et
les termes sources. Cependant, ces coefficients et ces termes
sources sont souvent mal connus. Pour terminer la modélisation,
il faut donc encore résoudre le problème inverse : étant
données des mesures sur une observation de la solution, calculer
une estimation des coefficients et/ou des termes sources de
l'équation ou du système d'équations considéré.
La classe de problèmes considérés actuellement porte
essentiellement sur l'estimation de coefficients. Ceux-ci peuvent
dépendre soit de la variable d'espace, soit du temps, soit être
des fonctions de la solution (non-linéarités de l'équation). Le
problème d'estimation de paramètres est formulé comme un problème
de minimisation au sens des moindres carrés, la variable de
minimisation étant le vecteur des paramètres à estimer, et la
fonction à minimiser étant une évaluation en norme
de la différence entre l'observation calculée par le
modèle avec un jeu donné de paramètres et celle mesurée
effectivement. Dans les problèmes abordés le nombre de paramètres
sera grand (d'une vingtaine à un million), ce qui conduit à
l'utilisation pour l'optimisation de méthodes de gradient
utilisant l'état adjoint.
Les problèmes inverses tels qu'ils
viennent d'être rapidement décrits présentent de nombreuses
difficultés liées à leur non-linéarité, à leur taille, au fait
qu'ils sont très gourmands en temps de calcul et qu'ils sont
souvent mal posés. Ce sont des problèmes d'optimisation, mais les
algorithmes d'optimisation ne sont pas un objet de recherche du
projet. Pour nos besoins dans ce domaine, on s'appuie sur les
résultats et les compétences du projet Promath et on s'est assuré
la collaboration de S. Gómez.
Depuis les travaux de J.-L. Lions et de G. Chavent
au début des années 70 montrant comment résoudre les problèmes
d'estimation de coefficients par contrôle optimal, le
savoir-faire a considérablement évolué et on peut aujourd'hui
identifier les directions de recherche suivantes comme
essentielles :
- Choix de la formulation : suivant la façon dont est
formulé le problème inverse - choix des paramètres à estimer,
choix de la fonctionnelle à minimiser - le problème de
minimisation associé est plus ou moins bien posé. Une bonne
compréhension du problème physique est nécessaire pour faire
les bons choix.
- Choix de la paramétrisation : c'est souvent un
problème non trivial de choisir la représentation discrète des
paramètres à estimer. Ce choix a aussi une influence sur le
conditionnement du problème de minimisation associé et sur
l'immodalité de la fonction coût, comme l'a montré le succès
des paramétrisations multiéchelles.
- Génération automatique de logiciels : l'écriture de
programmes calculant le gradient par la méthode de l'état
adjoint est toujours longue et laborieuse, alors que cette
procédure pourrait être automatisée. Deux voies, s'appliquant à
des situations différentes sont possibles : génération
automatique simultanée des programmes de calcul de la fonction
à minimiser et de son gradient - ainsi le programme Gradj écrit
en Maple et développé au sein de Ident et Estime -, ou
génération du seul programme de calcul du gradient à partir
d'un programme déjà existant de calcul de la fonction à
minimiser - voie choisie par exemple par Odyssée développé au
sein du projet Saphir. Cette deuxième voie s'impose quand de
gros programmes de calcul existent déjà, alors que la première
est plus adaptée quand le simulateur peut être réécrit.
- Efficacité dans la résolution du problème direct :
dans les problèmes que nous considérons la résolution du
problème direct est très coûteuse. On doit donc chercher à
améliorer les techniques de résolution de ce problème -
amélioration des méthodes numériques, utilisation du
parallélisme - ou à utiliser des modèles simplifiés. Une partie
de ce travail est fait en dehors du projet (par exemple dans le
projet Ondes pour la sismique).
- Identifiabilité : la question se pose toujours, de
façon théorique et pratique, de savoir si les mesures sont
suffisantes pour estimer les paramètres que l'on cherche, et
comment l'incertitude sur les mesures se répercute sur les
paramètres estimés. Les questions de stabilité et
d'identifiabilité sont donc au coeur de l'estimation de
paramètres.
Participants : Clarisse Alboin , Guy Chavent , Jérôme
Jaffré , Michel Kern , Xueweng Wang
Mots-clés : Eléments finis, volumes finis, calcul
parallèle, décomposition de domaine
Décomposition de domaine: Technique qui consiste à
partitioner le domaine d'étude en plusieurs sous-domaines, et à
résoudre en parallèle le problème de départ sur les
sous-domaines.
MPI: Message Passing Interface. Spécification d'une
bibliothèque standard permettant de faire communiquer des
processus s'exécutant sur des processeurs différents d'une
machine parallèle.
Résumé : Les méthodes de discrétisation appropriées pour
les problèmes en milieu hétérogène sont les volumes finis
centrés sur les mailles et les éléments finis mixtes ou
mixtes-hybrides. Les méthodes de décomposition de domaine sans
recouvrement permettent de décomposer le domaine de calcul en
sous-domaines sur lesquels sont définis des modèles physiques
différents. L'implémentation parallèle est une nécessité pour
les problèmes de grande taille.
Les méthodes de volumes finis centrés sur
les mailles sont particulièrement adaptées aux problèmes où les
coefficients varient beaucoup. C'est le cas, en particulier, des
problèmes concernant les écoulements en milieu poreux. Ainsi la
composante normale vitesse de Darcy,
reste régulière même
lorsque le coefficient
, la perméabilité absolue,
varie beaucoup, pour satisfaire les propriétés de conservation
des différents fluides (phases). Cette situation se retrouve dans
d'autres applications comme la diffusion neutronique ou les
semi-conducteurs. En utilisant les moyennes harmoniques de
, les méthodes de volumes finis centrés sur
les mailles permettent d'obtenir de bonnes approximations de la
vitesse de Darcy, même lorsque
varie beaucoup,
tout en respectant les propriétés de conservation au niveau de la
maille de discrétisation.
Les méthodes d'éléments finis mixtes sont une généralisation
de ces méthodes de volumes finis centrés sur les mailles qui,
s'appuyant sur des formulations variationnelles, a permis de
traiter le cas des maillages non-structurés utilisant des mailles
triangulaires ou tétrahèdriques. Les éléments finis mixtes ont
permis aussi de traiter le cas où
n'est plus ni
un coefficient scalaire ni même une matrice diagonale, mais une
matrice pleine en dimension 2 ou 3. Cependant ces méthodes sont
plus coûteuses que les méthodes de volumes finis puisqu'il faut
résoudre un système linéaire pour déduire la vitesse
de la pression
. De plus, étant
plus abstraites car basées sur la formulation variationnelle, ces
méthodes ont moins d'attrait pour les physiciens.
Ainsi, les relations entre éléments finis mixtes et volumes
finis centrés sur les mailles peuvent être encore approfondies.
D'une part, on peut présenter les méthodes d'éléments finis
mixtes, notamment en utilisant la formulation mixte-hybride,
comme des méthodes de volumes finis en introduisant des inconnues
de maille - eventuellement plus d'une inconnue par maille - et
des inconnues d'arête, et en écrivant les équations maille par
maille, puis en explicitant les relations entre les mailles. On
obtient ainsi ce qu'on peut appeler des éléments finis
généralisés. D'autre part, on cherche à écrire des formulations
volumes finis sur des maillages de triangles ou de tétrahèdres,
de rectangles ou d'héxaèdres déformés. Même sur un maillage de
rectangles, il est difficile d'écrire une formulation volumes
finis dans le cas ou
est une matrice
non-diagonale.
Les méthodes de décomposition de domaines
peuvent être utilisées en vue d'une implémentation parallèle
efficace, mais elles peuvent être aussi un outil pour assembler
des domaines dans lesquels des modèles physiques différents
doivent être utilisés.
Pour les écoulements finis en milieux poreux, on peut être
ainsi amené à utiliser un modèle monophasique dans une partie du
domaine qui est saturée, un modèle diphasique ou triphasique dans
une région qui est non-saturée, un modèle double porosité là où
le milieu est fracturé, et des failles peuvent traverser le
milieu. Parfois, même si le modèle ne change pas, une variation
brusque du milieu - changement de type de roche - introduit des
conditions de transmission non-standard à l'interface.
Pour ce genre de problèmes, les méthodes de décomposition de
domaine sans recouvrement sont appropriées. Elles permettent de
faire coïncider les sous-domaines de calcul avec les
sous-domaines physiques. Evidemment, ces méthodes doivent pouvoir
utiliser des pas de temps locaux car les échelles de temps
associées aux différents sous-domaines peuvent varier
beaucoup.
Comme cela a été souligné plus haut, aussi bien
les problèmes inverses que la modélisation en milieu poreux sont
de gros consommateurs de calcul. Il est donc naturel de se
tourner vers les techniques utilisant le calcul parallèle, tant
pour réduire le temps de calcul, que pour accéder à une mémoire
plus importante.
Une classe de méthodes générales pour obtenir des algorithmes
parallèles pour la résolution d'équations aux dérivées partielles
sont les méthodes de décomposition de domaine. Ces méthodes ont
été étudiées de façon intensive dans le cas des problèmes
elliptiques. Elles constituent actuellement le moyen le plus
général d'obtenir des application portables et efficaces sur une
large gamme d'ordinateurs parallèles. Leur mise en oeuvre
effective est facilitée par l'existence de bibliothèques telles
que MPI. Nous étudions des extensions de leur champ d'application
dans différentes directions :
- Pour la simulation d'écoulement en milieu poreux, il s'agit
d'adapter la méthode à une discrétisation par éléments finis
mixtes, et à introduire la pression globale, ce qui conduit à
traiter un saut dans la condition de raccord à
l'interface.
- Pour le calcul de criticité dans les réacteurs
nucléaires : le facteur effectif multiplicatif est la plus
grande valeur propre d'un opérateur non symétrique. Nous
proposons d'étendre à ce cas la méthode de synthèse modale qui
n'a été analysée jusqu'ici que dans le cas des opérateurs
symétriques.
- Pour la propagation des ondes par des méthodes d'éléments
finis. L'utilisation des éléments d'ordre élevés developpés au
sein du projet Ondes conduit à une méthode explicite pour
laquelle la mise en oeuvre est plus simple que pour les
problèmes stationnaires.
Précédent : Présentation générale et
objectifs Remonter : Avant-projet ESTIME, Estimation de paramètres
Suivant : Grands domaines d'application