Précédent : Présentation générale et
objectifs Remonter : Rapport activite 1997 Suivant :
Grands domaines
d'application
Participant : Marianne Akian , Guy Cohen , Stéphane
Gaubert , Jean-Pierre Quadrat
Mots-clés : Algèbre max-plus, Systèmes à événements
discrets, Décision markovienne
Résumé : L'idée est de substituer au corps des nombres réels le demi-corps idempotent
des nombres réels auxquels on ajoute
et que l'on munit des opérations max et +. A partir de ce demi-corps, on peut développer l'analogue de l'algèbre linéaire classique, une théorie des systèmes dynamiques linéaires, un analogue du calcul des probabilités, l'analogue des espaces de Sobolev etc ...
Les nouveaux systèmes dynamiques linéaires ainsi obtenus ne sont rien d'autre que les systèmes régis par des équations de la programmation dynamique qui jouent un rôle important en ingéniérie et en physique.
Le semianneau max-plus, parfois appelé ``algèbre max-plus'',
et noté . C' est l'ensemble
,muni des lois max et +. Traditionnellement, on
note
au lieu de max (
), et
au lieu de +
.L'élément zéro, c'est-à-dire le neutre pour la loi
, est noté
(ici
). L'unité, c'est-à-dire le neutre pour la loi
,est notée e (ici e=0). Les axiomes de structure des
semianneaux sont ici satisfaits :
est
associative, commutative, a un zéro,
est
associative, a une unité, distribue par rapport à
,et zéro est absorbant. Le semianneau max-plus est très
particulier : il est commutatif
, idempotent
, et
les éléments ont un inverse, hormis zéro (on nomme
semicorps les semianneaux qui satisfont cette dernière
propriété).
Ces nouvelles notations et
sont mieux
adaptées que max et + aux réflexes de calcul qui sont liés à
l'algèbre ordinaire. Nous écrirons par exemple :
La table suivante donne une liste d'autres semianneaux
apparentés au semicorps max-plus.
Certains systèmes à événements discrets (les graphes
d'événements) se modélisent par des systèmes dynamiques sur le
semianneau max-plus, Considérons par exemple un système
comprenant n tâches répétitives (on peut penser à des
assemblages dans un atelier, à des rendez-vous dans un réseau).
L'instant de démarrage d'une tâche est conditionnée par
l'exécution d'autres tâches devant être effectuées
antérieurement. Supposons que la k-ième occurrence de la
tâche i (tir de la transition i) ne puisse commencer que
unités de temps aprés que la dernière, des
occurences
des tâches j, n'ait eu lieu.
Alors, clairement, les dates au plus tôt d'occurrence des k-ième
tâches sont données par la récurrence
qui n'est autre qu'un système linéaire stationnaire sur le
semianneau max-plus. On peut l'écrire en termes matriciels
où Fest un ensemble fini, et une famille de matrices que l'on écrira aisément.
On a obtenu un modèle linéaire pour l'évaluation de performance d'un système dans lequel les préconditions d'une tâche sont fixées a priori et invariantes en temps. En termes de système de production cela signifie à peu près qu'un ordonnancement périodique a été défini.
L'algèbre max-plus permet d'analyser complètement cette classe
de systèmes. Un des résultats intéressants obtenus consiste à
remarquer que la relation : instants d'entrée -instants de
sortie, des pièces, est max-plus linéaire et shift invariante.
C'est une inf-convolution de la suite des instants d'entrée et
d'une suite caractéristique du système (sa réponse impulsionnelle
au sens max-plus). On a donc une bonne notion de fonction de
transfert. Ce sont les séries formelles rationnelles (si le graphe
d'événement n'a qu'un nombre fini de transitions) à coefficients
dans l'algèbre max-plus. Ces résultats ont été largement
expliqués dans [8,5,12].
Cette classe est trop restreinte (dans la majorité des applications, trouver un bon ordonnancement fait partie du problème). Elle peut être élargie au prix de la perte de la linéarité max-plus.
La modélisation de réseaux de Petri temporisés généraux ne
peut pas se faire dans le semianneau ou
la multiplication est
indispensable.
On note P l'ensemble des places, Q l'ensemble
des transitions, M les multiplicités des arcs, m le
marquage initial, r les temps de séjour. À chaque place
pP on associe un compteur
,(
est le numéro du dernier
jeton entré avant l'instant t, en incluant les jetons du
marquage initial) ; de même, pour chaque transition q
Q,
note le numéro du dernier tir de
q arrivé avant l'instant t. Ces fonctions sont
croissantes, par définition. On a les bilans suivants (on note
et
les
ensembles des prédecesseurs et successeurs d'un noeud x,
respectivement):
Par exemple, pour le réseau de Petri de la Figure suivante,
traduit le fait qu'un jeton en
peut contribuer au tir d'une transition
,
et qu'il en faut deux pour tirer
.
Dans un fonctionnement au plus tôt, au moins une inégalité de
type ( est saturée (i.e. au moins une
place est indisponible) en amont de chaque transition. On a donc:
Ce problème posé dans [Lib97] est un système dynamique
(min,+,x) implicite sur lequel on ne sait à peu prés rien dire.
Résoudre ce genre de problème, même dans le cas statique, revient
à étudier les variétés algébriques max-plus. La programmation
linéaire devrait être d'une aide précieuse pour la résolution de
ces systèmes.
On peut néanmoins simplifier ce problème en forçant des
routages stationnaires : on notera alors la
proportion de fluide (cas où on ne se préoccupe pas de
l'intégrité des jetons) routé vers q par la place
p, avec
.En posant,
La modélisation de systèmes à événements discrets plus
généraux peut se faire en remplaçant (, (
par des dynamiques
qui satisfont les trois
axiomes :
Sous l'hypothèse H, on sait que les propriétés M et N sont équivalentes. Gunawardena et Keane ont proposé d'appeler ``topicales'' les applications qui vérifient ces trois propriétés dont l'importance est bien connue [Nus90,MT80].
On peut dire que H, N sont le minimum vital pour
faire une théorie de Perron-Frobenius, la propriété H
donne du sens au problème spectral ,la
propriété N garantit que la limite
, lorsqu'elle existe, est indépendante du
point de départ
.
On essaie donc dans ce cadre de généraliser la théorie de Perron-Frobenius, et de comprendre géométriquement les asymptotiques des itérées de f (qui donnent par exemple, les performances asymptotiques de systèmes à événements discrets : ateliers, circuits digitaux; la quantité X(f) donne alors l'inverse du taux de production, ou le temps de cycle).
Un système à ressources partagées peut être vu comme un empilement de tâches (représentées par les contraintes temporelles imposées sur les ressources par ces tâches) du type jeu de Tetris.
Dans l'espace temps-ressource R x R avec R = 1, ...,
n. Une tâche a est une classe d'équivalence de formes
géométriques (deux formes sont équivalentes si elles sont
superposables par une translation temporelle). D'un point de vue
physique, une tâche mobilise des ressources de façon
synchronisée. Elle peut être retardée ou avancée. La tâche a
utilise les ressources R(a). Une tâche en position
immobilise la ressource r à la date
et la libère à la date
.
d(a),f(a) : R(a)
R sont donnés.
Un travail w est un ensemble ordonné de tâches à accomplir
. On peut alors vouloir calculer les
instants de libération des ressources au plus tôt x(w)
pour un travail w donné, sachant que les ressources
étaient disponibles au départ aux instants g (g : R
R). Cela correspond au calcul du profil
haut d'un empilement de pièces si l'on donne une interprétation
spatiale à l'axe temporel. Le vecteur g est alors le
profil du sol. L'exécution au plus tôt des différentes tâches
d'un travail w revient à laisser tomber les pièces
sur le sol g, comme dans le jeu de
tétris. Ce profil haut se calcule récursivement par la
programmation dynamique.
En termes algébriques, à chaque pièce a prise dans un ensemble
de pièces T,
on associe la matrice si
,et
pour
les coefficients diagonaux hors R(a) (les autres coefficients
valent
). On a :
où désigne un vecteur de zéro et donc
y(w) représente la date de fin du travail (la hauteur du
tas).
Autrement dit, la série génératrice est reconnue par
un automate à coefficients dans le semianneau max-plus. D'après
le théorème de Kleene-Schützenberger, c'est une série
rationnelle.
Les classiques problèmes d'ordonancement reviennent alors à
minimiser la vitesse de croissance du tas par rapport à l'ordre
des lettres dans le mot w.Ils se ramènent à l'étude des
semigroupes de matrices à plusieurs générateurs .Ce travail est présenté dans [11].
La solution du système
Les problème de suivi de trajectoire consiste à rechercher
u tel que , pour
(
représente un carnet de commandes à
suivre).
Le problème d'atteignabilité en horizon k consiste à
rechercher u tel que (
est
un vecteur des dates de disponibilité des ``ressources''
internes, machines, palettes, personnel, etc.).
Ces deux problèmes sont de la forme ,ou F
est un opérateur linéaire. E.g., dans le deuxième cas,
, où
et
. Il n'est pas en général possible de résoudre
exactement
pour toute valeur de v, car
génériquement, un opérateur linéaire (max,+) n'est ni
surjectif ni injectif. Cependant, il est facile de voir que
a toujours une solution maximale,
, donnée en termes matriciels par
La version la plus achevée de ces problèmes d'atteignabilité
dans le cas classique a été donnée dans [Won79]. Elle est basée sur une
discussion des espaces invariants d'un opérateur linéaire.
L'extension de cette théorie au cas max-plus passe par une
meilleure compréhension des semi-modules (analogue sur un
semianneau des espaces vectoriels). Même lorsque les semimodules
sont finiment engendrés, trés peu de choses sont connus.
Plusieurs notions d'indépendance existent, conduisant, chacunes,
à des notions, distinctes, de rang. De plus un sous semimodule
n'a pas toujours de supplémentaire. Ces difficultés sont
répertoriés dans la théorie des modules. Cependant, une nouvelle
difficulté surgit ici : l'analogue d'un noyau doit être posé dans
un espace double . En effet, dans cette structure tous les termes
d'une équation ne peuvent pas être ramenés dans un même membre,
puisque, en général, un élément n'a pas d'opposé. Par contre, la
résiduation donne des résultats intéressants que nous sommes en
train d'explorer [28].
Dans de nombreux domaines (grandes déviations en probabilité, entropie en mécanique statistique et théorie de l'information, dualité filtrage-commande en commande, maximum de vraisemblance en statistique, passage de la mécanique quantique à la mécanique classique, méthode de Hopf pour le calcul explicite d'équation d'Hamilton Jacobi etc.) une dualité entre le calcul des probabilités et l'optimisation est utilisé implicitement.
Dans un certain nombre de travaux relativement récents, cette dualité a été explicité par divers groupes indépendamment [Mas87,Pap95,dTRS90,Qua90,AJV94]. On dispose maintenant d'une théorie trés satisfaisante [2]. Cette dualité, a pour intérêt, en dehors de son caractère esthétique et unifiant, de faire ressortir les dissymétries existantes dans le développement des deux domaines. Le calcul des probabilités contient beaucoup de résultats analytiques et conceptuels. L'optimisation est beaucoup plus développé au niveau algorithmique.
Un problème d'optimisation est souvent présenté comme le calcul de
Dans le calcul des probabilités on s'intéresse au calcul de la
probabilité d'événements c.a.d.
Il suffit d'appeler pour être dans une
situation complètement analogue au calcul des probabilités au
remplacement de l'algèbre ordinaire par
prés. Pratiquement tous les concepts des probabilités ont une
notion duale, utile en optimisation. Citons en trois. Le dual de
la loi Gaussienne
est la forme quadratique
Le dual de la transformée de Laplace est la transformée de
Fenchel. Le dual de la convolution des lois est l'inf-convolution
des coûts.
A l'opposé, aucun algorithme sérieux n'est donné, pour
calculer la probabilité d'un événement un peu compliqué de
, exceptée la méthode de Monte-Carlo.
Il existe un moyen systématique de transférer les résultats du calcul des probabilités. C'est l'utilisation de la transformée de Cramer C définie par
Des articles et documents didactiques sur le semianneau max-plus sont accessibles à partir du serveur du groupe de travail ``Algèbres Tropicales'' à l'adresse http://amadeus.inria.fr/TROPICAL/.
Participant : Agnès Sulem
Mots-clés : commande stochastique, commande singulière,
frontière libre, Hamilton-Jacobi-Bellman, inéquation
variationnelle
Résumé : La commande stochastique est l'étude des systèmes dynamiques perturbés par des événements aléatoires et que l'on peut commander dans le but d'optimiser un certain critère.
La commande stochastique est l'étude des systèmes dynamiques dont
l'état est modélisé par un processus de diffusion (avec sauts
éventuellement), sur lequel on peut agir au moyen de variables de
commande. La commande peut être continue, singulière ou
impulsionnelle. Le but est d'optimiser un critère sur un horizon
de gestion fini ou infini ou de type ergodique. La fonction
valeur, qui réalise l'optimum du critère satisfait une équation
d'Hamilton-Jacobi-Bellman ou une Inéquation variationnelle ou
Quasi-Variationnelle elliptique, parabolique ou ergodique, avec
des conditions aux limites appropriées selon le comportement du
processus au bord du domaine : arrêté, réfléchi, etc...
Soit par exemple un système dont l'état est gouverné
par une diffusion stochastique dans un ouvert
:
où est le processus de commande, et
un processus de Wiener. On cherche à optimiser un critère par
exemple de la forme
où E désigne l'espérance, et
r désigne le premier temps de sortie de
du domaine
.
Notons
La méthode de la Programmation Dynamique conduit à une
équation d'Hamilton-Jacobi-Bellman pour la fonction valeur
V :
(13)
où est un
opérateur elliptique, pouvant être dégénéré, du 2ème ordre :
avec et
Dans le cas d'une commande singulière (c'est à dire lorsque le déplacement de l'état du système dû à l'application de la commande est non différentiable par rapport au temps), l'équation de la Programmation Dynamique est une inéquation variationnelle (IV), c'est à dire un système d'inéquations aux dérivées partielles.
La commande peut être également de type impulsionnel, c'est-à-dire que l'état du système subit des sauts à certains instants, les instants d'impulsion et la taille des sauts étant des variables de décision. Dans ce cas, il faut résoudre une Inéquation Quasi-Variationnelle (IQV) pour la fonction valeur. L'étude des IV et IQV sont des problèmes de frontière libre. La théorie des solutions de viscosité fournit un cadre rigoureux pour l'étude des équations de la Programmation Dynamique. L'étude de ces problèmes, théorique et numérique est un sujet de recherche traditionnel du projet et présente de nombreuses applications en mathématiques financières.