Précédent : Logiciels Remonter : Rapport activite 1997 Suivant :
Actions industrielles
Participants : Evelyne Lutton , Benoît Leblanc
Mots-clés : algorithme génétique, analyse de déceptivité,
exposant de Hölder
Résumé : L'analyse présentée ici fait suite à une analyse de déceptivité sur des fonctions Höldériennes menée précédemment, et qui avait permis de donner un modèle simplifié du comportement de certains des paramètres de l'AG simple, dit ``canonique'' (sélection proportionnelle, croisement à un point et mutation). Nous dérivons ici une mesure de la régularité qui se révèle plus adaptée aux structures manipulées par un AG (des chaînes binaires de taille fixe), les coefficients de régularité bit à bit, qui peuvent de la même façon que les exposants de Hölder être reliés à la déceptivité. Nous présentons ensuite le même type d'analyse sur un AG avec croisement uniforme. Ces analyses nous permettent finalement de proposer une méthode d'évaluation de la qualité d'un codage pour un AG.
Cette analyse permet de relier une mesure d'irrégularité d'une
fonction de fitness à une notion de difficulté (ou déceptivité)
pour les AG. Dans des travaux antérieurs, nous avions développé
une analyse de la déceptivité des fonctions Höldériennes, qui ont
permis de donner un modèle du comportement de certain des
paramètres de l'AG. Ces travaux étaient fondés sur l'hypothèse
que la fonction manipulée par l'algorithme génétique pouvait être
considérée comme l'échantillonnage d'une fonction Höldérienne, ce
qui permet donc de caractériser l'irrégularité de la fonction
selon la distance Euclidienne sur . Cette hypothèse
est bien sûr toujours valide, et est bien adaptée à des fonctions
de fitness qui sont monodimensionnelles. Il est moins évident
cependant que dans le cas de fonctions ``multidimensionnelles''
l'exposant de Hölder de la fonction monodimensionnelle
sous-jacente (et dépendant du mode d'échantillonnage adopté)
reflète d'une façon simple le comportement de la fonction de
fitness.
La présente analyse en est une généralisation selon deux voies:
Cette analyse a permis d'obtenir des résultats plus précis car les nouveaux coefficients considérés permettent de modéliser plus finement le comportement de la fonction.
Cette approche nous a permis enfin de proposer l'emploi des coefficients de régularité bit à bit comme outil d'évaluation de l'influence du codage des chromosomes sur l'efficacité de l'AG. Des expérimentations sur les permutations de bits et le codage de Gray ont été menées [31].
Participants : Bertrand Guiheneuf , Jacques Lévy Véhel ,
en collaboration avec Stéphane Jaffard (Université Paris XII-Val
de Marne)
Mots-clés : exposant de Hölder, singularités oscillantes,
transformée en ondelettes
Résumé : La régularité 2-microlocale étend la notion de régularité Hölderienne et est beaucoup plus robuste vis à vis de nombreuses opérations mathématiques ``standards''. Une étude systématique de la caractérisation des exposants 2-microlocaux au travers de conditions de décroissance sur la transformation en ondelettes continue du signal a été effectuée, aboutissant à des résultats de prescription et d'estimation en un point.
La définition de l'exposant de Hölder (voir section ), facile à appréhender, reproduit
de façon assez fidèle la notion intuitive de régularité
ponctuelle. Toutefois, trop attaché aux valeurs ponctuelles de la
fonction, l'exposant de Hölder ne se comporte pas correctement
sous l'action des opérateurs (pseudo-)différentiels. En
particulier, le numéricien comme le traiteur de signaux
aimeraient disposer de relations du type
où désigne la transformation de Hilbert. La
caractérisation de la régularité par la seule donnée des
exposants Hölderiens dévoile alors ses limites car les
relations précédentes ne sont pas vérifiées. On introduit
alors les espaces 2-microlocaux
qui,
par l'adjonction d'un deuxième indice permettent de prendre en
compte un comportement au voisinage du point. Bénéficiant
d'une caractérisation simple au travers de conditions de
décroissance portant sur des décompositions de type
Littlewood-Paley (Fourier) ou ondelettes (temps-échelle), les
espaces 2-microlocaux, définis par J.-M. Bony, jouissent des
propriétés suivantes:
Une étude extensive des conditions 2-microlocales exprimées dans
le plan temp-échelle a été réalisée, aboutissant à un résultat de
prescription de régularité 2-microlocale arbitraire en un point.
Les travaux en cours visent à établir des conditions
d'admissibilité permettant de généraliser le résultat précédent à
des domaines d'interieur non vide de la droite réelle. Des
méthodes d'estimation de ces nouveaux indices sont parallèlement
en cours d'élaboration.
Participants : Christophe Canus , Jacques Lévy Véhel ,
Claude Tricot
Mots-clés : analyse multifractale, exposant de Hölder de
grain, spectre de grandes déviations
Résumé : Le spectre de grandes déviations
d'une mesure à support réel compact se calcule à partir d'un réseau d'intervalles disjoints et de même longueur sur lesquels est calculé un exposant de Hölder de grain. Le spectre
mesure la vitesse de décroissance du nombre d'intervalles ayant un exposant de Hölder de grain proche de
lorsque la résolution tend vers l'infini. Il existe des limitations dues aux difficultés algorithmiques d'estimation de ce spectre. Une manière élégante de contourner ces difficultés consiste à calculer le spectre de Legendre, qui est la transformée de Legendre d'une certaine quantité
. Le formalisme multifractal en particulier cherche des conditions sous lesquelles cette approche est valide: elles correspondent à des hypothèses de régularité très restrictives. Nous introduisons ici une nouvelle définition de spectre multifractal proche de
et dont les qualités simplifient l'estimation: elle utilise toutes les valeurs possibles de la mesure sans référence à un réseau particulier d'intervalles.
Afin de caractériser l'irrégularité d'une mesure ,
on définit l'exposant de Hölder de grain
où
sont les dyadiques de
et le spectre
de grandes déviations:
où . (
) reflète la décroissance du nombre
d'intervalles dyadiques
ayant un exposant de Hölder de grain
proche de
l'exposant de Hölder
à la ``précision''
lorsque la ``résolution''
.
Malheureusement, cette définition ne peut être directement
transposée en algorithme d'estimation. Afin de pallier cette
limitation et pour pouvoir analyser pleinement la complexité de
signaux réels, il semble indispensable de conserver l'approche
``grandes déviations'' en facilitant son estimation. Nous
introduisons ici le spectre de grandes déviations continu:
où .(
) est bien sûr proche de (
).
est une
fonction continue log-linéaire par morceaux, calculée à partir
d'une fonction
obtenue en tout point de
l'intervalle
en intégrant la densité de la mesure
pré-multifractale correspondant à la résolution du
-échantillon sur l'intervalle
.
étant difficile à estimer, nous l'avons
remplacé dans (
) par
,où:
où , la fonction
est un noyau symétrique
par rapport à , à support compact et dont l'intégrale sur ce
support est finie. Les résultats d'estimation obtenus sur la
mesure binomiale ou sur des signaux réels montrent une faible
dépendance vis à vis de la précison et de la forme du noyau. Nous
avons étendu les résultats trouvés aux spectres de fonction. Les
travaux en cours visent à mettre en place une méthode de
détermination de la gamme de résolution sur laquelle le spectre
peut être estimé.
Participants : Christophe Canus , Jacques Lévy Véhel ,
Claude Tricot , en collaboration avec Serguei Zuyev (projet
MISTRAL)
Mots-clés : analyse multifractale, exposant de Hölder
ponctuel, spectre de Hausdorff
Résumé : Le spectre de Hausdorff
mesure la raréfaction des ensembles de points ayant même exposant de Hölder ponctuel. Il est fondé sur la dimension de Hausdorff
dont l'estimation se révèle extrêmement délicate. Nous proposons ici deux méthodes d'estimation. Une démarche alternative consiste à généraliser ce spectre à toute dimension
respectant certaines hypothèses et de définir un spectre de dimension
. Une étape supplémentaire consiste à évaluer la vitesse avec laquelle les exposants de grain convergent vers les exposants ponctuels par le biais d'un nouveau spectre, le spectre
.
Une autre caractérisation de l'irrégularité d'une mesure est de
définir en tout point l'exposant de Hölder ponctuel
puis l'ensemble
iso-Hölder
et le spectre de Hausdorff:
où est la dimension de Hausdorff. Si
cette dimension possède de nombreuses qualités (elle est fondée
sur une mesure extérieure), son calcul pose parfois des
problèmes et elle est extrêmement difficile à estimer. Nous avons
cependant proposé deux estimateurs basés sur un théorème de
Lyons, qui donne
avec
.
est la
limite d'une suite de recouvrements aléatoires
définis par l'union des
intervalles dyadiques de
acceptés avec la
probabilité
et rejetés avec la probabilité
.
Construire un estimateur à partir de ce résultat s'avère encore
une fois un travail difficile puisqu'à la finitude de la
résolution de l'ensemble
sur lequel on travaille s'ajoute
celle de l'ensemble des recouvrements aléatoires
. Il est cependant possible de dériver des résultats
intéressants pour la contruction d'un estimateur
semi-paramétrique de
(cf. rapport d'activité
96). Serguei Zuyev a proposé un autre algorithme dont l'argument
est le suivant: considérons la suite de v.a. i.i.d.
sur
, l'intervalle dyadique
est accepté si
,rejeté sinon. La probabilité d'accepter
est donc toujours égale à
. Pour qu'un intervalle dyadique
qui intersecte
soit recouvert, il suffit qu'au moins un des
noeuds sur le chemin
qui mène de la racine à la feuille
correspondant à cet intervalle soit recouvert, c'est à dire qu'il
suffit que la plus petite des v.a. i.i.d. tirées sur ce chemin
soit inférieure à
. Pour que tous les intervalles
dyadiques qui intersectent
soient recouverts, il
suffit que la plus grande des plus petites valeurs obtenues pour
chaque feuille soit inférieure à
. Nous obtenons comme
estimateur de
:
Ces problèmes d'estimation peuvent être esquivés en changeant la
méthode de mesure. Nous appelons alors dimension toute fonction
croissante telle que
,
et telle que si
alors
. Enfin la condition de sigma-stabilité
impose que la dimension d'une réunion dénombrable d'ensemble
soit égale au supremum des dimensions. La dimension de
Hausdorff respecte bien évidemment ces conditions, ainsi que la
dimension de Packing
. La
dimension de Minkowski-Bouligand (ou dimension de boîte)
ne respecte pas la dernière condition mais son
estimation est aisée. À partir de ces dimensions, on peut définir
le spectre de dimension:
Enfin, il est possible de définir l'exposant ponctuel comme la limite quand
d'un exposant de grain
où
est l'intervalle dyadique qui
contient
et d'étudier le rang à partir duquel
est ``proche'' de
. Pour cela,
nous avons définit l'ensemble
et le spectre:
Les avantages de cette nouvelle définition sont nombreux. A la
différence des ensembles , les ensembles
ne sont pas denses dans
et leur
dimension de boîte n'est pas égale à
, ce qui permet son
utilisation dans le calcul de
. Les
travaux en cours visent à mettre en place un estimateur robuste
et à obtenir des relations d'ordre du type formalisme
multifractal pour ce nouveau spectre.
Participants : Jacques Lévy Véhel , Rolf Riedi
Les propriétés multifractales de plusieurs processus
aléatoires ont récemment été étudiées par divers auteurs. Compte
tenu de son importance dans les applications, nous nous sommes
intéressés au mBf et à quelques unes de ses généralisations. Si
le spectre de Hausdorff est trivial et apporte peu d'information,
les spectres de grandes déviations et de Legendre sont plus
riches. Ils décrivent la vitesse avec laquelle la probabilité de
rencontrer, à une résolution donnée, une régularité
supérieure à (qui est l'exposant du mBf) tend vers
0 quand la résolution tend vers l'infini. Des estimations ont
aussi été obtenues pour des collages de mBf, des ``Cantor
Browniens'', et le mouvement Brownien multifractionnaire.
Participants : Paulo Gonçalvès en collaboration avec R.
Baraniuk (Rice Univ, USA)
Mots-clés : classe affine, ondelettes, temps-échelle
Résumé : Les distributions pseudo Wigner affines sont des versions à temps glissant des distributions de Wigner affines. Ces distributions vérifient asymptotiquement les mêmes propriétés théoriques que les distributions de Wigner affines mais offrent la possiblité de supprimer les termes interférentiels. D'un point de vue pratique, elles présentent l'avantage d'une programmation en ligne.
Les distributions de Wigner affines sont des représentations
temps-fréquence de la classe affine et ont pour
expression
Participants : Paulo Gonçalvès en collaboration avec P.
Abry (ENS-Lyon)
Mots-clés : auto-similarité, ondelettes, régularité
Hölderienne
Résumé : Nous proposons une transformation en ondelettes multi-fenêtres destinée à identifier des structures auto-similaires non stationnaires dans des processus aléatoires et à estimer l'exposant d'échelle local
qui contrôle la régularité ponctuelle du processus.
Nous considérons des processus stochastiques localement
auto-similaires, c'est à dire vérifiant l'égalité (en loi)
suivante: où
est
l'exposant local d'échelle (ou exposant de Hölder) à estimer.
Moyennant un choix judicieux de
, la transformée
en ondelettes
reproduit le même
comportement local en loi d'échelle selon:
Participants : Jacques Lévy Véhel , Rolf Riedi
Mots-clés : analyse multifractale, mouvement Brownien
fractionnaire, trafic sur les réseaux d'ordinateurs
Résumé : Pour modéliser la forte non-stationnarité des trafics et rendre compte de leur caractère multifractal, nous avons considéré diverses extensions du mouvement Brownien fractionnaire, qui autorisent des variations instantanées de la régularité ponctuelle.
Poursuivant les travaux commencés l'année dernière, nous avons
entrepris de construire des généralisations du mBf qui puissent
rendre compte du caractère multifractal des données de trafic LAN
à Berkeley et au CNET. Une particularité du mBf est que le même
exposant décrit la mémoire longue et l'irrégularité locale.
Or, cette dernière varie fortement au cours du temps sur les
traces réelles. C'est pourquoi, nous nous sommes tournés vers le
mouvement Brownien multifractionnaire (mBm), qui est une sorte de
mBf où
dépend du temps. En choisissant de façon adéquate
la fonction
, on peut faire en sorte que, à toute
résolution finie, les spectres de grandes déviations et de
Legendre du mBm et des traces réelles aient la même allure.
L'utilisation du mBm nécessite que
soit une fonction
continue. Pour prendre en compte des variations brusques de
l'irrégularité, nous avons proposé un autre modèle, qui est une
superposition finie de mBf, l'un défini sur la droite réelle, les
autres sur des ensembles de Cantor de structure particulière. Il
est alors possible d'ajuster les différents paramètres pour que
les propriétés multifractales obtenues coïncident avec celles des
données. Nous disposons ainsi de deux modèles qui possèdent la
plupart des caractéristiques fractales du trafic et qui,
physiquement, pourraient rendre compte de la forte non
stationnarité observée sur les réseaux (heures pleines/creuses,
hétérogénéité des types de trafic) conduisant à des trajectoires
dont l'irrégularité varie soit lentement, soit de façon
discontinue.
Participants : Lotfi Belkacem ,Jacques Lévy Véhel, en
collaboration avec TREFIMETAUX
Etant acheteur d'une grande quantité de cuivre pour le processus de fabrication des produits et semi-produits, la société TREFIMETAUX s'intéresse de près aux changements brusques des prix de ce métal sur le marché des matières premières. Le but de cette étude est d'évaluer le risque, encouru par l'acheteur au comptant, dû aux variations des prix comptant et des prix à terme (3 mois).
Nous disposons de deux signaux: prix comptant ou ``spot'' et le prix à terme (maturité 3 mois) ou ``forward'' de cuivre soit deux séries de taille 4765 points.
Le test de Kolmogorov sur les séries des variations relatives
des prix rejette l'hypothèse de normalité de taux de rendement et
conclut à l'adéquation à une loi stable. Les valeurs estimées des
paramètres à différentes échelles suivent une loi d'échelle: le
diagramme en du paramètre d'échelle en fonction de
la résolution fait apparaître une droite décroissante de pente
0,6. Cet exposant est différent de la valeur théorique
, ce qui pourrait être le signe de l'existence
d'un effet de longue mémoire.
Quand le prix comptant est supérieur à celui à terme, on dit
que le marché est en situation de ``backwardation''. Dans le cas
contraire, on dit que le marché est en situation de ``cantango''.
Dans la situation de cantango, le risque est borné par un niveau
financier. Dans la situation de ``backwardation'', les prix sont
plus volatiles et le risque est infini. Pour ce cas, nous
construisons un autre signal qui représente la différence des
deux signaux de départ:
Nous avons modélisé cette série de deux manières:
Nous avons proposé dans ce cas un modèle de ``Var'' extrême pour quantifier le risque extrême.
Participants : Bertrand Guiheneuf , Jacques Lévy Véhel ,
en collaboration avec le CNET
Mots-clés : bases de données d'images, indexation,
recherche par le contenu, reconnaissance de textures
Résumé : Les textures sont des composantes essentielles de la description sémantique des images naturelles présentant souvent des caractéristiques ``fractales''. Profitant de l'expérience acquise lors du développement du logiciel Arthur, nous avons mis au point des méthodes permettant de rechercher rapidement des zones présentant une texture spécifique dans une base de données d'images.
``Je ne vois rien que le soleil qui poudroie et l'herbe qui
verdoie''. En décrivant ainsi le panorama qui s'offre à elle du
haut de la tour du château de Barbe Bleue, Soeur Anne illustre
involontairement la motivation de notre travail. La description
sémantique des scènes naturelles fait en effet très souvent appel
à la notion de texture. Supposons que Soeur Anne ait disposé
d'une base de données d'images. Elle aurait alors formulé une
requête du type [ ``Herbe'' ET ``Poussière'' ET NON ``Frères'' ]
afin de montrer à sa soeur une image ressemblant à ce qu'elle
voyait du haut de la tour.
Notre travail a consisté à se charger des recherches concernant les deux premières assertions de la requête. Poursuivant les travaux effectués dans le cadre du développement du logiciel Arthur, nous avons développé des méthodes permettant la recherche de zones texturées à partir d'un modèle dans des bases de données d'images. En pratique, chaque image de la base est partitionnée en zones sur lesquelles sont calculés des attributs fractals de régions en nombre limité. Afin d'élargir la classe des textures auxquelles peut s'appliquer cette méthodes, nous avons aussi intégré des paramètres de régions plus classiques (matrice de cooccurrence, atomes temps-fréquence).
Ces attributs sont les index des zones. Leur diversité permet de mettre en évidence les caractéristiques particulières d'une texture par rapport à l'ensemble des textures présentes dans la base.
Quand l'utilisateur pointe une région, on évalue les attributs
sur celles ci et on les compare aux valeurs statistiques des
index calculés sur l'ensemble des images de la base. Pour rendre
la recherche plus robuste, on attribue ainsi des notes aux
différents attributs. Une distance inter-index, pondérée par les
notes obtenues par les differents attributs, fournit une liste
ordonnée d'images de la base classée par ordre de ressemblance
(voir figures et
).
Figure: Image
fournie par l'utilisateur. Une recherche est lancée dans la base
pour trouver des zones similaires à la zone pointée par
l'utilisateur (encadrée sur l'image)
Figure: Image de
la base dont une zone ressemble le plus à la texture pointée par
l'utilisateur. La zone la plus pertinente est encadrée
Participant : Paulo Gonçalvès
Mots-clés : détection M-aire, maximum de vraisemblance,
texture
Résumé : Nous considérons le problème classique de détection M-aire (choix multiples) visant à décider parmi
hypothèses. Pour chacune des hypothèses, nous disposons de séquences d'apprentissage enregistrées. Etant donné la séquence observée d'origine a priori inconnue, il s'agit de l'assigner à l'une des
classes avec une probabilité d'erreur minimale.
Le terme de ``Type'' est défini en théorie de l'information et
désigne l'histogramme renormalisé qui estime la densité de
probabilité d'une variable discrète. Etant donnée une série
stochastique , issue d'un alphabet
discret de taille finie
, le type
est
donné par:
Participants : Evelyne Lutton , Frédéric Raynal
Mots-clés : algoritme génétique, IFS mixtes
Résumé : Nous présentons ici une application de la programmation génétique interactive à la génération d'images d'attracteurs d'IFS mixtes. La PG intervient comme une aide à l'exploration d'un espace d'images, la fonction implicitement optimisée par l'algorithme est la ``satisfaction de l'utilisateur''.
Cette application se place dans le cadre d'une pré-étude pour la
société Colornet, qui a pour but le développement d'une
application interactive (en JAVA) de génération d'images
artistiques en accord avec des profils psycho-colorimétriques
donnés. Il est prévu que ce logiciel sera utilisé de façon
expérimentale sur un site WEB pour aider à recueillir des données
de type profil de clientèle pour le marketing.
Le logiciel est fondé sur l'emploi d'un algorithme de programmation génétique (à l'aide du logiciel PROGON), qui vise à optimiser une fonction de fitness qui est l'appréciation de l'utilisateur. A ce titre, l'on peut parler de programmation génétique interactive: l'utilisateur donne une note aux images présentées par l'algorithme, et c'est cette note qui sert de base au calcul de la fonction de fitness que l'algorithme cherche à optimiser. Cette approche n'est pas nouvelle et a été pour la première fois proposée par Karl Sims [Sim91]. Elle permet de guider une recherche aléatoire dans l'espace des formes possibles (représentées par les individus de l'AG), de façon à optimiser la ``satisfaction'' de l'utilisateur.
L'originalité de notre approche réside essentiellement dans le fait que nous manipulons des structures ``fractales'', les IFS mixtes [15] représentées par des arbres de tailles variables, qui nécessitent donc l'emploi de la programmation génétique. Un première version de cette application sera disponible sur le site WEB du projet à la fin de 1997.
Figure: Quelques exemples d'attracteurs
d'IFS mixtes générés par programmation génétique
interactive