Précédent : Fondements scientifiques
Remonter : Projet SHERPA, Modèles et bases
Suivant : Logiciels
Résumé : De plus en plus de séquences de génomes complets sont maintenant disponibles, en particulier d'organismes bactériens. Ces «textes» doivent être interprétés afin d'identifier des objets biologiquement significatifs. Le rôle de l'informatique est ici prépondérant, tant en ce qui concerne les méthodes d'analyse de séquences que la représentation et la gestion des connaissances que ces analyses permettent d'obtenir.
Le contenu informationnel d'un brin d'ADN peut être décrit par une séquence des lettres A, C, G et T, qui symbolisent les quatre acides nucléiques : adénine, cytosine, guanine et thymine. Un génome peut ainsi être abstrait sous la forme d'un ``texte'' écrit dans un alphabet de quatre lettres. Ces textes se prêtent particulièrement bien aux traitements informatiques. Il faut en effet les interpréter, c'est-à-dire déterminer les gènes, comprendre les mécanismes qui régulent leur traduction en protéines, identifier et caractériser ces protéines, rechercher des similarités entre séquences d'espèces différentes, etc. Cette démarche exploratoire fait un usage intensif de l'informatique, tant pour ses possibilités de stockage, de gestion des données et de calcul, que de représentation d'objets complexes et de leurs relations.
Dans ce contexte, le projet Sherpa travaille en étroite collaboration avec plusieurs laboratoires de biologie moléculaire (laboratoire de biométrie, génétique et biologie des populations, université Claude Bernard, Lyon; équipe d'Antoine Danchin à l'institut Pasteur de Paris et Atelier de Bio-Informatique (ABI) de Paris 6; laboratoire de génétique et physiologie du développement de Marseille) sur le développement de bases de connaissances sur les génomes et d'environnements d'aide à l'analyse de séquences.
Résumé : Une mémoire d'entreprise est techniquement vue comme l'association de connaissances formelles et de documents plus ou moins structurés. Les objectifs de recherche sont ici de gérer cette association de façon adéquate, et en particulier d'offrir des outils de construction incrémentale et coopérative de telles mémoires techniques.
Notre approche de la mémoire technique est nourrie de notre expérience de la construction de bases de connaissances. Trois principes la gouvernent :
Les deux premiers principes justifient les développements (lexique, déploiement sur le réseau) et études autour de notre système de représentation de connaissances Tropes. Ceux-ci contribuent à atteindre les objectifs d'intelligibilité en fournissant un modèle clair et accessible par n'importe quel client HTTP de la mémoire. Ce contenu est relié directement, par le même moyen, à des bases de données, des pages de documentation et des lexiques.
Le troisième principe nécessite le développement de recherches et d'outils nouveaux pour la révision et la construction coopérative de bases de connaissance, qui permettent de renforcer la cohérence des mémoires ainsi mises en oeuvre.
Résumé : L'électromyographie est une technique de diagnostic des maladies neuro-musculaires. Elle impose des examens parfois douloureux au patient. Il est donc intéressant d'aider un praticien à choisir les examens les plus pertinents pour une situation donnée.
Dans le cadre d'une collaboration étroite avec le service d'électromyographie du CHU de Grenoble (Prof. A. Vila), le projet Sherpa développe le système Myosys destiné à conseiller le praticien dans le choix et l'enchaînement des examens. Pour ce faire, Myosys exploite une base de connaissances à objets sur l'anatomie, les pathologies, les symptômes et les protocoles d'examens. Le processus de raisonnement d'un médecin spécialiste est représenté à l'aide d'un modèle basé sur le concept de tâche. L'interface avec l'utilisateur permet à celui-ci de suivre et de comprendre la démarche du système dans les phases de décomposition de tâche en sous-tâches et de caractérisation par classification. Des planches anatomiques annotées permettent de comprendre le contenu de la base de connaissances et aident l'utilisateur à répondre correctement aux questions qui lui sont posées lors de la progression du diagnostic.
Le développement de Myosys s'est également inscrit dans le cadre d'un projet européen AIM, qui a abouti à la réalisation d'une plate-forme opérationnelle composée notamment d'une base de données EMG, d'interfaces avec un équipement de traitement du signal, d'un module de télécommunication multi plate-forme et de systèmes à base de connaissances (dont Myosys). Cette plate-forme permet maintenant à un consortium d'experts de renommée internationale de sept nationalités différentes d'établir un standard européen pour la détection et le suivi des maladies neuromusculaires.
Une nouvelle base de connaissances formée de cas médicaux est en cours d'élaboration au sein du projet Sherpa et sera prochainement intégrée à la plate-forme européenne. Cet outil reposera à terme sur les 2000 cas jugés intéressants qui ont déjà été collectés et en permettra leur consultation par un navigateur Web. Il s'agit donc de mettre à disposition un serveur de connaissances permettant la capitalisation de ce savoir-faire européen consensuel. Chaque partenaire pourra ainsi disposer de sa base de cas locale complète, des bases de cas publiques des autres partenaires, ainsi que de la base de cas consensuelle. Ce serveur, basé sur le système d'indexation FUSIN développé au sein du projet, aura la particularité de permettre des recherches de cas médicaux similaires à un modèle de cas donné.
Résumé : L'adjonction de connaissances à des modèles mathématiques favorise leur réutilisation dans des contextes différents de ceux de leur élaboration.
Les modèles de ce type sont en général de grande taille et sont souvent déclinés en de nombreuses versions. Il est dans ces conditions intéressant de représenter explicitement les connaissances des modélisateurs (hypothèses sous-tendant les équations, choix des équations appropriées en fonction du contexte, par exemple) dans une base de connaissances de sorte que les modèles construits soient réutilisables. Deux applications bâties sur ce principe sont actuellement traitées, dans les domaines de la planification des ressources en eau et de la simulation de l'évolution de la consommation en énergie.