Projet Mistral

Précédent : Logiciels Remonter : Projet MISTRAL, Modélisation en
Informatique Suivant : Actions
industrielles
Participants : Eitan Altman , Alain Jean-Marie
Mots-clés : processus markoviens contrôlés, jeu
stochastique, contrôle hybride, multimodularité
En collaboration avec M. Tidball (université
Nationale de Rosario, Argentine), A. Jean-Marie a étudié les
«Processus de Markov déterministes par morceaux» (Piecewise
deterministic Markov processes), une classe de modèles introduits
récemment par M. Davis. Dans le cadre d'une application à un
modèle d'ordonnancement de la production, ils ont en particulier
étudié l'approximation et la discrétisation de la fonction de
valeur du problème [37].
Les jeux stochastiques non-coopératifs ont
été étudiés par E. Altman dans [24], [39], [13]. Dans [13] nous considérons des jeux
stochastiques à
-joueurs ; nous obtenons des
conditions nécessaires et suffisantes pour l'existence des
fonctions de valeur et des politiques d'équilibre stationnaire,
ainsi que des algorithmes pour les calculer. Dans [24,39], nous considérons des problèmes
d'approximations dans les jeux à somme nulle. En particulier,
nous étudions la convergence des politiques optimales et des
fonctions de valeur. Nous appliquons ces résultats pour approcher
des jeux définis sur des espaces d'état infinis par des jeux à
espaces d'état finis.
Dans [12], E. Altman étudie des systèmes
stochastiques hybrides en temps continu dans un intervalle de
temps fini, dans le cas de coûts non-linéaires de l'espérance de
la trajectoire. La dynamique de l'état est non-linéaire, et les
paramètres qui déterminent la dynamique varient selon un
processus markovien de saut contrôlé. Des contrôleurs qui sont
optimaux asymptotiquement (quand le nombre de sauts devient
grand) sont obtenus en étudiant le contrôle d'un système
déterministe limite.
Dans un article datant de 1985, <<
Extremal splitting of point processes >>, B. Hajek a
introduit une propriété de convexité appelée multimodularité.
Cette notion est définie pour les fonctions sur les points
entiers d'un espace euclidien multidimensionnel. Dans une série
de quatre articles, nous présentons et caractérisons la
multimodularité et nous montrons comment elle s'applique au
contrôle optimal de files d'attentes ou de systèmes (max,+)
[4].
Ce travail, en collaboration avec le professeur Hordijk de
l'université de Leiden, a commencé par l'étude des propriétés de
couplage et de stabilité dans des systèmes non markoviens
contrôlés, en utilisant la théorie du renouvellement de
Borovkov.
Puis nous avons entamé une étude de systèmes contrôlés ayant
la propriété de multimodularité, qui a conduit à des méthodes de
contrôle des réseaux de télécommunications, en particulier pour
améliorer leur qualité de service (limitation des rafales de
trafic, taux de service équitables pour l'ensemble des
sessions).
Dans [42], qui constitue la
partie théorique de notre étude, nous montrons la relation entre
la convexité et la multimodularité. Nous obtenons ainsi des
résultats généraux pour des coûts actualisés ou moyens qui sont
des compositions convexes croissantes de fonctions
multimodulaires. En particulier, nous construisons des bornes
inférieures pour la fonction de valeur du problème actualisé et
nous montrons que le problème moyen est minimisé par une séquence
équilibrée, tant pour les problèmes avec un objectif unique que
pour ceux avec objectifs multiples.
Dans [40], nous avons
utilisé le formalisme (max,+) pour montrer que le temps de séjour
moyen d'un client dans le réseau et la charge moyenne du réseau
sont des fonctions multimodulaires de la suite des dates
d'arrivées. Nous utilisons ensuite les théorèmes généraux
introduits dans [42] pour
construire le contrôle d'admission optimal.
Dans [41], nous donnons une
vue d'ensemble de la notion de séquences équilibrées qui peuvent
être définies informellement comme répondant à la question
suivante : est-il possible de construire une suite infinie
sur
lettres dans laquelle chaque lettre est
distribuée de façon aussi régulière que possible et apparaît avec
un taux fixé ? Nous montrons aussi le lien avec la
multimodularité et nous utilisons ces deux notions a priori assez
éloignées pour optimiser le routage dans des réseaux de files
d'attente. Des résultats nouveaux, comme l'optimalité du routage
cyclique dans des systèmes homogènes très généraux (G/G/1),
deviennent de simples corollaires de ce résultat.
Finalement, dans [43], nous
considérons le problème dual des absences du serveur. Ici, le
contrôle n'a plus lieu sur les arrivées mais sur le serveur, sans
information sur l'état du système. Le problème dual est alors
celui du << polling >>, où un même serveur est
responsable de plusieurs files d'attente.
Participants : François Baccelli , Konstantin
Tchoumatchenko , Sergueï Zuyev
Mots-clés : modélisation spatiale, processus ponctuel,
géométrie aléatoire, calcul de Palm, pavage de Voronoï, arbre
couvrant
Plusieurs modèles d'arbres couvrants ont été
proposés dans [18] pour la
description de la topologie de systèmes hiérarchiques de réseaux.
Le calcul de Palm et la formule d'échange entre deux mesures de
Palm nous ont permis de calculer le coût moyen des connexions
d'un commutateur typique, en prenant en compte les fonctions de
coût de l'infrastructure et celles des communications. Parmi des
applications possibles de ces résultats, on peut citer la
répartition optimale des bases de données de localisation pour
les systèmes de télécommunications mobiles (paging) et
l'optimisation de l'architecture de réseaux hiérarchiques.
Dans le cadre d'un réseau cellulaire, le routage
peut être modélisé par un chemin sur le graphe de Delaunay,
proche de la ligne droite connectant la source et la destination.
Dans le cadre de la collaboration avec France Telecom, nous avons
étudié les propriétés markoviennes de tels chemins. Les résultats
numériques obtenus montrent que la longueur de ce chemin est
asymptotiquement 4/
fois la longueur
euclidienne entre les stations. Dans le cas poissonnien, la
représentation markovienne de ce chemin permet aussi d'étudier la
vitesse de convergence vers la constante 4/
.
Une large classe d'ensembles aléatoires
construits à partir des configurations ponctuelles forment des
ensembles d'arrêts. Cette classe contient, en particulier, la
fleur de Voronoï définissant la géométrie de la cellule de
Voronoï qui sert de modèle pour la zone de desserte d'un
commutateur. Dans [49] nous
montrons des résultats de type loi Gamma analogues à ceux obtenus
dans le passé par S. Zuyev et I. Molchanov, ainsi que des
nouveaux résultats concernant les propriétés de recouvrement des
ensembles d'arrêt.
Participants : François Baccelli , Sergueï Zuyev
Mots-clés : gradient stochastique, développement de Taylor
de fonctionnelles de processus de Poisson
Dans un travail en
collaboration avec des chercheurs de l'université d'Ulm (S.
Hasenfuss et V. Schmidt), F. Baccelli a proposé une nouvelle
méthode fondée sur le couplage pour établir la différentiabilité
en
d'une fonctionnelle quelconque d'un
processus de Poisson homogène d'intensité
[44]. Cette méthode permet de
donner des conditions moins contraignantes que celles des
méthodes classiques (la méthode d'admissibilité de Reiman et
Simon, la méthode de B
aszczyszyn et celle de
Zazanis fondée sur les dérivées de Radon-Nikodym), notamment pour
la différentiabilité infinie au point
.Plusieurs applications ont été étudiées en détail,
notamment celle des systèmes (max +)-linéaires avec des entrées
formant un processus de Poisson ([16], [15]).
En collaboration avec le professeur I.
Molchanov, de l'université de Glasgow, S. Zuyev a aussi continué
les travaux sur la technique des gradients stochastiques qui est
à la base du simulateur ARC de réseaux de télécommunications
décrit dans [26]. De
nouvelles applications des résultats théoriques concernant
l'optimisation sur l'espace de mesures de masse totale tendant
vers l'infini, présentés dans le journal Adv. in Appl. Probab.
(J. Møller et S. Zuyev, 1996) nous ont permis d'exprimer la
densité asymptotiquement optimale des stations pour une densité
démographique donnée des abonnés du réseau.
Participants : Eitan Altman , François Baccelli , Thomas
Bonald
Mots-clés : stabilité de systèmes de files d'attentes,
stabilité dans des systèmes non markoviens
Le contrôle de flux à fenêtre, utilisé par
exemple par le protocole TCP sur le réseau Internet, consiste à
limiter le nombre de paquets que peut envoyer une source sans
avoir reçu d'acquittement de la destination. Dans [34], F. Baccelli et T. Bonald
s'intéressent au débit maximal d'une connexion contrôlée par un
tel mécanisme, lorsque chaque routeur est modélisé par une file
d'attente recevant un flux exogène stationnaire et ergodique. En
établissant des conditions nécessaires et une condition
suffisante de stabilité de ce système, ils obtiennent des bornes
sur ce débit maximal. Certains phénomènes contre-intuitifs, comme
la non-monotonie du débit maximal en l'intensité des flux
exogènes, sont également mis en évidence.
Eitan Altman a considéré deux problèmes de
stabilité de files d'attentes. Dans [11], des systèmes de polling
markoviens ont été analysés. Les temps de services, de
déplacement du serveur, et les temps entre les arrivées sont
indépendants, et leurs espérances sont supposées être finies. Des
conditions nécessaires et suffisantes de stabilité sont obtenues.
Dans [32] nous avons
considéré des files d'attentes où des clients qui trouvent le
serveur occupé ou la file pleine, reviennent plus tard (<<
retrial queues >>). Sous plusieurs types d'hypothèses
(markoviennes et non markoviennes), des conditions nécessaires et
suffisantes de stabilité sont obtenues. Des méthodes de
renouvellement ont été utilisées pour le cas non markovien, y
compris dans le cas contrôlé [14].
Participants : François Baccelli , Zhen Liu , Philippe
Nain
Mots-clés : qualité de service, borne, distribution
sous-exponentielle, rareté et exponentialité
Kielson (1979) et Aldous (1989) ont donné des expressions pour
le comportement asymptotique du temps moyen jusqu'à l'occurrence
d'un événement rare dans le cadre de processus markoviens. Dans
un travail en collaboration avec le professeur David Mac Donald
de l'université D'Ottawa [45],
F. Baccelli a généralisé ces résultats du cadre markovien au
cadre stationnaire grâce à la théorie des processus ponctuels, et
notamment la formule d'échange entre deux mesures de Palm
[3]. Deux notions
d'indépendance et d'exponentialité asymptotiques sont introduites
qui permettent d'étudier le comportement asymptotique de ce temps
moyen sous diverses lois de probabilité.
Participants : Zhen Liu , Alain Jean-Marie , César
Jalpa-Villanueva , Vincent Morgera , Philippe Nain , Nicolas
Niclausse , Jérôme Talim
Mots-clés : multimédia, serveur Web, HTTP, modèle de
trafic, cache, politique de remplacement, moteur de recherche,
ordonnancement
Dans le cadre de la thèse de C.
Jalpa-Villanueva, nous nous sommes intéressés aux problèmes liés
à la modélisation des transactions HTTP. Afin de trouver des
modèles statistiques adéquats du trafic de la nouvelle version du
protocole de transport HTTP1.1, C. Jalpa-Villanueva a installé un
serveur Web supportant HTTP1.1 pour y effectuer des mesures. Les
expériences sur ce serveur nous ont permis d'analyser son
comportement (consommation de CPU, accès au disque, etc) et
d'observer l'effet de certains paramètres sur la durée des
transactions et le taux de requêtes servies. De plus, une analyse
des traces de trafic HTTP/1.1 sur TCP a mis en évidence
l'évolution de ces connexions TCP. La phase initiale, qui joue un
rôle important sur la durée des transactions, ne ressemble pas à
ce qu'on observe usuellement dans les autres applications TCP.
Des études plus approfondies sont en cours.
Z. Liu s'est intéressé aux problèmes
d'optimisation des moteurs de recherche sur le Web tels que Alta
Vista, Lycos, etc. Ces moteurs utilisent des robots qui sont
envoyés à travers le réseau, pour sonder les différentes pages
Web et pour rapatrier des informations aux moteurs de recherche
qui effectuent l'indexation. Les pages Web étant modifiées plus
ou moins régulièrement, le travail des robots assure la mise à
jour des bases de données. En collaboration avec Ed. Coffman
(Bell Labs), Z. Liu a entamé une étude [47] du problème d'ordonnancement du
robot pour minimiser les fractions
du temps
où les pages ne sont pas à jour, en supposant des processus
poissonniens indépendants de changement de pages, et une
distribution générale pour les durées d'accès de pages
.Nous montrons que si
décroit dans le sens de l'ordre convexe-croissant, alors
décroit pour toutes les pages
sous n'importe quelle politique
d'ordonnancement. Nous montrons aussi que pour maximiser
l'espérance de la fraîcheur d'une page, l'accès à cette page par
le robot doit être équitablement espacé en temps. Nous étudions
ensuite le problème d'ordonnancement pour minimiser la fonction
de coût
où les
sont des coefficients proportionnels aux taux de
changement des pages
.Nous donnons une borne
sur la performance de la politique optimale et montrons que la
fréquence optimale avec laquelle le robot accède à la page
est proportionnelle à
, où
Notons que cette dernière
devient proportionnelle à
seulement
quand
est une constante. Nous évaluons les
politiques d'accès aléatoires de distribution
.Nous montrons que, quand les
sont
des coefficients proportionnels aux taux de changement des pages
,le coût minimum est atteint si
est proportionnel à
.Finalement, nous présentons et analysons une
heuristique pour le cas d'un grand nombre de pages.
Afin d'appliquer tels résultats, il reste à estimer la
distribution de
ainsi que les paramètres
. Ceci a fait l'objet du stage de
DEA de V. Morgera [50].
Dans ce stage, V. Morgera (sous la direction de Z. Liu) a
installé un robot de moteurs pour effectuer des mesures
statistiques. Les données collectées sont stockées dans une base
de données afin d'en faciliter la réutilisation.
L'étude rapportée dans [47] a été poursuivie dans le cadre de
la thèse de J. Talim. Le modèle utilisé est celui d'une file
d'attente où les clients représentent les documents rapatriés par
les robots, et les services les opérations d'indexation de ces
documents. Le buffer est de capacité finie. L'objectif consiste à
optimiser la quête des données à travers le réseau afin d'assurer
une mise à jour aussi fréquente que possible des bases de
données. Plus précisément, nous nous sommes intéressés au nombre
de robots, à savoir comment le fixer de manière à éviter que le
buffer ne soit plein et à maintenir le serveur en activité. Dans
cet état d'esprit, nous avons considéré différentes distributions
de service (exponentielle, ou fonction plus générale) d'une part,
l'aspect statique (où le nombre de robots est constant) et
l'aspect dynamique (où suivant la charge du serveur, nous
régulons ce nombre), d'autre part. Nous proposons des techniques
de calcul de ce nombre optimal de robots dans le cas
statique ; et surtout nous avons étudié, sur des exemples,
la structure de cette quantité en fonction de certains paramètres
du modèle (tels que la taille du buffer, ou bien le temps moyen
de service). Dans le cas dynamique, nous prenons en compte à la
fois le nombre de robots en activité et la file d'attente dans le
buffer ; le champ des actions consiste à déterminer le
nombre optimal de robots à mettre en activité.
Participants : Alain Jean-Marie , Zhen Liu , Philippe
Nain
Mots-clés : qualité de service, modèle de trafic,
mémoire longue, dimensionnement, multiplexage
La mise
en évidence récente, par expérimentation, de la nature <<
fractale >> du trafic (on parle aussi de mémoire longue)
dans les réseaux mobilise en ce moment de nombreuses équipes
autour de la recherche de nouveaux modèles mathématiques de
trafic susceptibles de reproduire ce type de comportement
statistique. Trois classes de modèles sont principalement à
l'étude : ceux basés sur le mouvement brownien
fractionnaire, le processus de Cox et les sources on/off
avec périodes d'activité à << queue lourde >>. En
1997 les membres du projet MISTRAL se sont intéressés aux modèles
issus des deux dernières classes et ont obtenu des résultats
parmi les plus généraux de ceux publiés à ce jour.
Un processus de Cox
est défini comme le
processus du nombre de clients dans une file d'attente
M/G/
. C'est un processus fortement corrélé
(ses composantes sont des variables aléatoires associées) et
stationnaire. Sa fonction d'autocorrélation est une fonction
explicite de la loi de service
, ce qui en fait
tout l'intérêt. Par exemple, ce processus sera à << mémoire
longue >> (c'est-à-dire que
)si
suit une loi de Pareto de paramètre
.Si
est une
loi lognormale ou une loi de Weibull, alors le processus de Cox
n'est pas à << mémoire longue >> ; cependant, sa
fonction d'autocorrélation décroîtra beaucoup plus lentement dans
ce cas (comme
) que dans le cas où
est une variable exponentielle
(décroissance exponentielle). Ces quelques éléments montrent donc
que l'on peut modifier la structure de corrélation du processus
de Cox de façon explicite en faisant varier
.
Un problème particulièrement intéressant dans le cadre des
réseaux est l'étude du comportement d'une file d'attente
(routeur) alimentée par un tel processus et qui transmet les
clients (paquets) à débit constant (appelée file Cox/D/1 dans la
suite). En collaboration avec D. Towsley (univ. Massachusetts) et
Z.-L. Zhang (univ. Minnesota), Z. Liu et P. Nain ont étudié
[21] le comportement
asymptotique de la charge stationnaire (
) d'une
file Cox/D/1 sous l'hypothèse où
est une loi
sous-exponentielle (par exemple, Pareto, lognormale, Weibull).
Des bornes asymptotiques inférieures et supérieures ont été
obtenues pour
pour
ainsi que le comportement asympotique exact
de cette quantité lorsque
est une loi de
Pareto ou lognormale, sous une condition particulière qui
s'exprime en fonction des intensités d'arrivée et de service. Une
conséquence directe de ces résultats est que la probabilité de
perte d'un paquet peut être de plusieurs ordres de grandeur
supérieure à celle calculée dans les modèles markoviens ou à base
de processus de renouvellement. Traduit en termes de réseaux,
cela signifie qu'en présence de trafic de nature <<
fractale >>, les mémoires doivent être surdimensionnées
sous peine d'une forte dégradation de la qualité de service.
true cm Les sources on/off sont utilisées depuis très
longtemps dans le monde des télécommunications, car
particulièrement bien adaptées à la modélisation du trafic généré
par les usagers. Une source on/off est un processus
stochastique qui génére un << fluide >> (par exemple,
des bits) à débit constant quand elle est active (on) et
rien du tout quand elle est inactive (off). En
téléphonie traditionnelle, les périodes on et
off sont bien modélisées par des lois exponentielles.
Parmi les raisons avancées pour expliquer le comportement fractal
du trafic dans les réseaux il y a le caractère sporadique de
certains trafics (rafales de paquets) ainsi que la co-existence
dans le réseau d'applications aux << échelles de temps
>> différentes (quelques minutes en téléphonie, de l'ordre
de l'heure pour la vidéo à la demande ou la vidéoconférence). Ces
phénomènes et leurs conséquences peuvent être reproduits et
étudiés à partir de la superposition de sources on/off
avec des périodes d'activités à << queue lourde >>.
Un problème naturel est l'étude du comportement de la charge
(
) d'un multiplexeur/routeur alimenté par
plusieurs sources on/off de ce type. En collaboration
avec R. Agrawal (univ. Wisconsin) et A. Makowski (univ.
Maryland), tous les deux visiteurs de MISTRAL en 1997, P. Nain a
obtenu des bornes asymptotiques inférieures pour
sous l'hypothèse où au moins une source a des
périodes d'activité à << queue lourde >> et montré
que
héritait de cette propriété de
queue lourde. Dans le cadre des réseaux ceci signifie que c'est
le trafic le plus sporadique (bursty) qui causera les
phénomènes d'attente et de rejet, et qui déterminera donc le
niveau des performances. Ces recherches se poursuivent
actuellement dans le but de calculer une borne asymptotique
supérieure.
true cm A. Jean-Marie, Z. Liu et P. Nain, jointement avec D.
Towsley (univ. Masachussetts), ont étudié le modèle de files
d'attente MMPP/GI/1 où les clients arrivent selon un processus de
Poisson modulé. En partant de résultats connus sur les modèles
fluides de trafic, une analyse fine des propriétés spectrales des
matrices impliquées a pu être effectuée. Il est ainsi possible de
calculer numériquement la distribution de la quantité
d'informations en attente dans les tampons, pour des routeurs
soumis à des trafics provenant de sources diverses avec des
caractéristiques (débit moyen, débit des rafales) très
diverses.
Dans un travail joint avec M. May, C. Diot et J.-C. Bolot
(projet RODEO), A. Jean-Marie a étudié les mécanismes de
discrimination de service basés sur 1 bit, pour le traitement des
informations dans l'Internet. Ces protocoles, dérivés de ceux
proposés dans les réseaux ATM, visent à proposer mieux que la
simple garantie du «meilleur effort» qui prévaut actuellement,
sans trop compliquer les protocoles. Des modèles simples de files
d'attente multiclasses ont été établis afin d'illustrer les
bénéfices apportés par ces mécanismes, ainsi que leurs limites
[48].
Participants : Alain Jean-Marie , Jörn Migge
Mots-clés : ordonnancement, temps réel, faisabilité,
vidéoconférence
Dans le cadre d'une convention conclue avec EDF, les études
sur les systèmes temps-réel cycliques ont été poursuivies par J.
Migge. L'élaboration d'un modèle général, de type stochastique, a
été entamée. Il permet de représenter des systèmes sous
différentes politiques d'ordonnancement qui peuvent être
basées sur des priorités, des dates d'échéances ou d'autres
critères. Ce modèle constitue une base pour l'analyse de ces
politiques. Il a permis d'élaborer une meilleure méthode pour
déterminer des bornes stochastiques sur les temps de
réponse des tâches dans le cas à priorités préemptives fixes.
Une deuxième application des méthodes mises au point a
également été l'élaboration et l'implémentation par J. Migge et
F. Lyonnet d'une politique d'ordonnancement pour le coeur du
logiciel de vidéo-conférence Rendez-Vous, developpé par le projet
RODEO.
Précédent : Logiciels Remonter : Projet MISTRAL, Modélisation en
Informatique Suivant : Actions industrielles