Projet Sherpa

previous up next contents
Précédent : Fondements scientifiques Remonter : Projet SHERPA, Modèles et bases Suivant : Logiciels



Grands domaines d'application

Le projet Sherpa cultive trois grands domaines d'expérimentation : la biologie moléculaire, les mémoires d'entreprise et l'aide au diagnostic médical. Un thème plus récent concerne l'aide à l'élaboration et à l'utilisation de modèles dynamiques de systèmes complexes, en particulier socio-économiques.

Biologie moléculaire

Résumé : De plus en plus de séquences de génomes complets sont maintenant disponibles, en particulier d'organismes bactériens. Ces «textes» doivent être interprétés afin d'identifier des objets biologiquement significatifs. Le rôle de l'informatique est ici prépondérant, tant en ce qui concerne les méthodes d'analyse de séquences que la représentation et la gestion des connaissances que ces analyses permettent d'obtenir.

La macro-molécule d'ADN, principal constituant du génome, est le support matériel de l'hérédité et la mémoire du processus d'évolution. Sous la forme d'une séquence d'acides nucléiques, elle contient l'information nécessaire au développement et au maintien de tout organisme vivant. Certains fragments de la molécule d'ADN jouent un rôle particulièrement important : ce sont les gènes, qui codent les protéines. Ces dernières, qui assurent la plupart des fonctions enzymatiques et de structure dans les cellules, sont également des macro-molécules constituées par l'enchaînement de vingt acides aminés différents.

Le contenu informationnel d'un brin d'ADN peut être décrit par une séquence des lettres A, C, G et T, qui symbolisent les quatre acides nucléiques : adénine, cytosine, guanine et thymine. Un génome peut ainsi être abstrait sous la forme d'un ``texte'' écrit dans un alphabet de quatre lettres. Ces textes se prêtent particulièrement bien aux traitements informatiques. Il faut en effet les interpréter, c'est-à-dire déterminer les gènes, comprendre les mécanismes qui régulent leur traduction en protéines, identifier et caractériser ces protéines, rechercher des similarités entre séquences d'espèces différentes, etc. Cette démarche exploratoire fait un usage intensif de l'informatique, tant pour ses possibilités de stockage, de gestion des données et de calcul, que de représentation d'objets complexes et de leurs relations.

Dans ce contexte, le projet Sherpa travaille en étroite collaboration avec plusieurs laboratoires de biologie moléculaire (laboratoire de biométrie, génétique et biologie des populations, université Claude Bernard, Lyon; équipe d'Antoine Danchin à l'institut Pasteur de Paris et Atelier de Bio-Informatique (ABI) de Paris 6; laboratoire de génétique et physiologie du développement de Marseille) sur le développement de bases de connaissances sur les génomes et d'environnements d'aide à l'analyse de séquences.

Mémoire d'entreprise

Résumé : Une mémoire d'entreprise est techniquement vue comme l'association de connaissances formelles et de documents plus ou moins structurés. Les objectifs de recherche sont ici de gérer cette association de façon adéquate, et en particulier d'offrir des outils de construction incrémentale et coopérative de telles mémoires techniques.

Le terme ``mémoire d'entreprise'' participe de la problématique de la gestion des connaissances (knowledge management); il désigne des systèmes informatiques susceptibles d'accroître les capacités de capitalisation et de gestion des connaissances et des expériences au sein des entreprises. On parlera ici plutôt de ``mémoire technique'' destinée à recevoir la connaissance technique utilisée par les ingénieurs de l'entreprise. Cette mémoire se doit d'être vivante parce qu'elle est utilisée et enrichie de manière quotidienne. Elle doit donc être cohérente et intelligible.

Notre approche de la mémoire technique est nourrie de notre expérience de la construction de bases de connaissances. Trois principes la gouvernent :

1.
les mémoires techniques seront d'autant plus utiles qu'elles seront exprimées dans un langage formel permettant un certain nombre de vérifications,
2.
tout ne pouvant s'exprimer de manière formelle, il est nécessaire de lier cette connaissance aux documents informels qui la concernent (bibliographie, lexique),
3.
les ``rédacteurs'' de cette mémoire technique doivent être aidés dans cette démarche.

Les deux premiers principes justifient les développements (lexique, déploiement sur le réseau) et études autour de notre système de représentation de connaissances Tropes. Ceux-ci contribuent à atteindre les objectifs d'intelligibilité en fournissant un modèle clair et accessible par n'importe quel client HTTP de la mémoire. Ce contenu est relié directement, par le même moyen, à des bases de données, des pages de documentation et des lexiques.

Le troisième principe nécessite le développement de recherches et d'outils nouveaux pour la révision et la construction coopérative de bases de connaissance, qui permettent de renforcer la cohérence des mémoires ainsi mises en oeuvre.

Aide au diagnostic médical

Résumé : L'électromyographie est une technique de diagnostic des maladies neuro-musculaires. Elle impose des examens parfois douloureux au patient. Il est donc intéressant d'aider un praticien à choisir les examens les plus pertinents pour une situation donnée.

Dans le cadre d'une collaboration étroite avec le service d'électromyographie du CHU de Grenoble (Prof. A. Vila), le projet Sherpa développe le système Myosys destiné à conseiller le praticien dans le choix et l'enchaînement des examens. Pour ce faire, Myosys exploite une base de connaissances à objets sur l'anatomie, les pathologies, les symptômes et les protocoles d'examens. Le processus de raisonnement d'un médecin spécialiste est représenté à l'aide d'un modèle basé sur le concept de tâche. L'interface avec l'utilisateur permet à celui-ci de suivre et de comprendre la démarche du système dans les phases de décomposition de tâche en sous-tâches et de caractérisation par classification. Des planches anatomiques annotées permettent de comprendre le contenu de la base de connaissances et aident l'utilisateur à répondre correctement aux questions qui lui sont posées lors de la progression du diagnostic.

Le développement de Myosys s'est également inscrit dans le cadre d'un projet européen AIM, qui a abouti à la réalisation d'une plate-forme opérationnelle composée notamment d'une base de données EMG, d'interfaces avec un équipement de traitement du signal, d'un module de télécommunication multi plate-forme et de systèmes à base de connaissances (dont Myosys). Cette plate-forme permet maintenant à un consortium d'experts de renommée internationale de sept nationalités différentes d'établir un standard européen pour la détection et le suivi des maladies neuromusculaires.

Une nouvelle base de connaissances formée de cas médicaux est en cours d'élaboration au sein du projet Sherpa et sera prochainement intégrée à la plate-forme européenne. Cet outil reposera à terme sur les 2000 cas jugés intéressants qui ont déjà été collectés et en permettra leur consultation par un navigateur Web. Il s'agit donc de mettre à disposition un serveur de connaissances permettant la capitalisation de ce savoir-faire européen consensuel. Chaque partenaire pourra ainsi disposer de sa base de cas locale complète, des bases de cas publiques des autres partenaires, ainsi que de la base de cas consensuelle. Ce serveur, basé sur le système d'indexation FUSIN développé au sein du projet, aura la particularité de permettre des recherches de cas médicaux similaires à un modèle de cas donné.

Modélisation et simulation de systèmes technico-économiques

Résumé : L'adjonction de connaissances à des modèles mathématiques favorise leur réutilisation dans des contextes différents de ceux de leur élaboration.

La modélisation et la simulation de systèmes technico-économiques constituent le terrain d'expérimentation des travaux menés dans le projet sur la simulation à base de connaissances. Il s'agit de modéliser des phénomènes économiques complexes sous forme d'équilibres offre-demande, afin d'en réaliser des simulations.

Les modèles de ce type sont en général de grande taille et sont souvent déclinés en de nombreuses versions. Il est dans ces conditions intéressant de représenter explicitement les connaissances des modélisateurs (hypothèses sous-tendant les équations, choix des équations appropriées en fonction du contexte, par exemple) dans une base de connaissances de sorte que les modèles construits soient réutilisables. Deux applications bâties sur ce principe sont actuellement traitées, dans les domaines de la planification des ressources en eau et de la simulation de l'évolution de la consommation en énergie.



previous up next contents Précédent : Fondements scientifiques Remonter : Projet SHERPA, Modèles et bases Suivant : Logiciels