Précédent : Grands domaines d'application
Remonter : Projet SHERPA, Modèles et bases
Suivant : Résultats nouveaux
Résumé : Les logiciels développés mettent en oeuvre les modèles de connaissances et de raisonnement étudiés au sein du projet Sherpa : Tropes pour la modélisation des connaissances descriptives, PowerTasks pour la modélisation des connaissances méthodologiques, ImaGene et son interface Isea pour une application de PowerTasks à l'analyse de séquences génomiques, et Amia pour la modélisation et la simulation à base de connaissances.
Tropes est un système de gestion de bases de connaissances dans lequel les connaissances sont principalement représentées sous forme d'objets. Parmi les points originaux, il intègre une notion de points de vue permettant de définir plusieurs hiérarchies de classes sur le même ensemble d'objets.
Tropes sert de support à diverses applications et constitue la base sur laquelle de nouvelles recherches sont effectuées. La version 1.1 de Tropes est mise à disposition sur le réseau. Elle intègre des développements effectués ces deux dernières années :
L'environnement PowerTasks a été construit dans le cadre d'un transfert technologique auprès de la société Ilog. Cet outil générique de résolution de problèmes a été conçu autour d'un nouveau modèle à objets et tâches issu des expériences précédentes (deux environnements ont été précédemment proposés et une dizaine de systèmes basés sur ces environnements ont été élaborés dans des domaines aussi variés que l'analyse de données, le traitement du signal, l'interprétation de courbes en automatique, la résolution d'équations aux dérivées partielles, le diagnostic médical et l'analyse de séquences génomiques). PowerTask dispose d'un moteur de résolution associant à chaque tâche les méthodes possibles et d'une interface graphique qui permet à l'utilisateur :
PowerTasks a été diffusé auprès de laboratoires de biologie, et notamment du laboratoire de bio-informatique de l'université Pierre et Marie Curie et de l'institut Pasteur. Ces équipes ont ainsi conçu le système ImaGene, qui aide un biologiste lors de l'analyse de séquences génomique. Imagene est en particulier destiné à l'annotation de chromosomes bactériens complets. Il permet de représenter et de gérer de manière uniforme les connaissances biologiques produites au cours de l'analyse d'un génome (gènes, signaux de régulation...), ainsi que les connaissances méthodologiques attachées à cette analyse, à savoir les méthodes d'analyse proprement dites et les conditions de leurs mises en oeuvre.
Par ailleurs, ImaGene dispose également d'une interface ``cartographique'' permettant d'afficher, sur le même écran, l'ensemble des résultats produits par une ou plusieurs stratégies (objets biologiques, courbes de prédiction, etc.) afin de les comparer.
ImaGene a été utilisé dans le projet de séquençage du génome de la bactérie B. subtilis. Il a en particulier permis d'expérimenter différentes stratégies de détection des erreurs de séquençage (erreurs de cadre de lecture). Il a ainsi contribué à identifier les régions contenant de telles erreurs.
Au cours des années 94-95, le projet Sherpa a participé au développement de l'environnement de travail coopératif ImaGene destiné à l'analyse des séquences génomiques. En particulier, une première interface graphique, permettant aux biologistes de visualiser les connaissances produites par le système sous la forme de cartes (génétique, physique...) et de naviguer entre ces cartes, a été développée en C++ en utilisant la bibliothèque IlogViews. Outre la visualisation, cette interface offre des fonctions de manipulation permettant d'explorer et de comparer les résultats des analyses.
Ce travail sur les interfaces se poursuit actuellement au travers de l'interface cartographique Isea (Interface for Sequence Exploration and Analysis), développée en Java. Si ce nouveau système reprend les points forts de son prédécesseur, à savoir sa généricité à la fois d'un point de vue graphique et biologique (le système est multi-organisme), sa portabilité et son extensibilité ont été très sensiblement accrues. Concernant la portabilité, Isea est entièrement écrit en Java ce qui permet d'envisager une plus vaste diffusion du système. L'extensibilité du système est assurée grâce à l'adoption d'une technologie à base de composants qui permet de spécialiser l'interface en fonction de la tâche d'analyse qui est à accomplir, ce qui est un point crucial si l'on veut que la généricité du système ne soit pas réalisée au détriment de sa facilité d'utilisation.
Développé en collaboration avec l'université Pierre Mendès France de Grenoble, Amia est un logiciel pour la modélisation et la simulation à base de connaissances. L'objectif visé à travers ce logiciel est double. Le premier est d'étudier comment améliorer l'intelligibilité et la généralité des modèles numériques par l'apport et l'exploitation de connaissances de nature symbolique. De telles connaissances s'avèrent en effet nécessaires pour :
Pour ce faire, Amia dispose d'un langage de modélisation algébrique, un formalisme d'écriture des équations proche des notations algébriques utilisées en mathématiques, qui a été étendu pour permettre l'expression des connaissances ci-dessus.
Le second objectif est l'expérimentation des algorithmes de simulation adaptés à ce type de langage qui ont été développés dans le projet. Ils sont en cours de validation sur des applications complexes.