Projet Repco

previous up next contents
Précédent : Composition de l'équipe Remonter : Rapport activite 1997 Suivant : Fondements scientifiques



Présentation générale et objectifs

Le projet Repco s'est arrêté en décembre 1997. Ce rapport d'activité est donc un peu particulier en ce qu'il doit à la fois rendre compte du passé récent du projet et présenter l'évolution et la thématique actuelle de celui-ci. Notre présentation tente de distinguer au mieux ces deux aspects. Tout d'abord, on y trouve le cadre de la nouvelle action que nous développons et les recherches s'inscrivant dans ce cadre (§[*], [*], [*]). Les fondements scientifiques sont développés uniquement pour cette partie et probablement de façon encore imparfaite.
Les autres actions de recherche sont, dans la mesure du possible, l'occasion d'un rapide bilan. On y trouve des recherches qui seront progressivement arrêtées (§[*], [*]) ou orientées vers les nouvelles applications envisagées (§[*]). Les principaux résultats marquants sont les logiciels Mentoniezh et Sarah présentés en §[*], [*].

Nous développons une nouvelle action dont la problématique générale est de fournir une assistance intelligente à un utilisateur confronté à l'analyse de données complexes et de taille importante. Par assistance intelligente, nous entendons le développement de capacités automatiques de modélisation, de reconnaissance de situations intéressantes et d'élaboration de recommandations d'actions adaptées et explicables. Ces capacités sont de nature abductive ou inductive, c'est-à-dire que le problème central est celui de la sélection d'une ou de plusieurs hypothèses pertinentes pouvant expliquer au mieux un ensemble d'observations. Nous nous situons dans une perspective intelligence artificielle. Le but est de rendre l'utilisateur autonome face à l'analyse de ses données, i.e. de ne pas requérir la présence d'un tiers (spécialiste d'analyse des données, spécialiste de traitement du signal ou autre) pour l'interprétation des résultats fournis. Respecter cet objectif suppose de fournir des résultats facilement interprétables et donc travailler sur des modèles conceptuellement simples.

Les thèmes scientifiques sur lesquels se focalisent le projet sont les suivants:

Nous décrivons maintenant un peu plus précisément les études qui nous intéressent dans ce contexte. Les aspects plus techniques sont développés dans la partie didactique.

Aide à la surveillance de systèmes physiques

Un système physique évolue dans le temps, soit du fait de sa dynamique propre, soit sous l'effet d'actions ou d'événements extérieurs. La surveillance d'un tel système consiste à analyser les observations issues de capteurs, à en inférer l'état courant du système afin de détecter un éventuel dysfonctionnement, à caractériser ce dysfonctionnement en localisant le ou les composants défectueux, et éventuellement à préconiser l'action (ou la suite d'actions) qui semble la plus appropriée au maintien ou au rétablissement des fonctionnalités du système.

Nous nous limitons aux systèmes de surveillance dans lesquels un opérateur est impliqué ; il s'agit donc plus précisément d'aide à la surveillance d'un système.

Nous nous intéressons à la supervision par gestion d'alarmes, qui est pratiquée dans la gestion des réseaux de transmission de données ou de distribution d'électricité. L'opérateur chargé de la surveillance reçoit des événements (les alarmes) datés et émis par les composants eux-mêmes en réaction à des événements extérieurs. Les observations recueillies sur le système sont des informations discrètes, correspondant à un événement ponctuel ou à une propriété associée à un intervalle de temps. Nous ne traitons pas ici les signaux continus issus des capteurs.

Aide à l'interprétation de séquences

Nous considérons ici deux types très différents de séquences naturelles : les textes (documents) et les séquences biologiques (ADN, ARN, protéines), vues comme des textes sur un alphabet généralement réduit. Dans les deux cas, on s'intéresse prioritairement à l'analyse de contenu et le but est de modéliser la connaissance incluse dans les textes, en passant par une phase d'indexation automatique, qui consiste à traduire le contenu de ces textes en une structure de données facilitant la recherche au moment des requêtes adressées sur celui-ci. Le filtrage de termes pertinents nécessite de plus l'emploi d'outils d'analyse syntaxique ou statistique. Ces études peuvent être rattachées au domaine récent du «text mining» (fouille de textes). Parmi les recherches menées actuellement en analyse de documents, on peut distinguer essentiellement trois familles[JR94] : la catégorisation de textes, dont le but est de trier les documents traités en les séparant en groupes pertinents ; l'extraction de données, qui, à partir d'un ensemble de documents d'un domaine donné, produit un ensemble de structures capturant l'information-clé de ces textes, en vue d'un remplissage automatique d'une base de données ; la recherche d'informations (recherche documentaire) enfin, qui nous concerne et qui consiste, à partir d'un ensemble de documents et d'une requête d'un utilisateur, à proposer à ce dernier les textes adéquats.

Apprentissage automatique de modèles

Un des points clés dans les approches s'appuyant sur des modèles est l'acquisition de ces modèles. La solution étudiée dans le projet est celle consistant à acquérir ces modèles et à les mettre au point de manière automatique à partir d'un ensemble d'observations sur leur comportement. Cette automatisation pose des problèmes de filtrage, de structuration des observations puis de spécification de critères de généralisation, c'est-à-dire de la manière dont vont être définis puis calculés les modèles acceptables au vu des observations. Le projet s'appuie pour cela sur les techniques issues de l'apprentissage, de la classification et de l'analyse des données. Plus précisément, nous nous intéressons à un apprentissage de type structurel, qui cherche à faire émerger des relations entre données parmi lesquelles les dépendances ne sont pas connues.

previous up next contents Précédent : Composition de l'équipe Remonter : Rapport activite 1997 Suivant : Fondements scientifiques