Team ACACIA

Members
Overall Objectives
Scientific Foundations
Application Domains
Software
New Results
Contracts and Grants with Industry
Other Grants and Activities
Dissemination
Bibliography
Inria / Raweb 2002
Project: ACACIA

Project : acacia

Section: New Results


Keywords : mémoire d'entreprise , sciences cognitives , acquisition de connaissances , ingénierie des connaissances , gestion de connaissances , ontologie , assistance à l'utilisateur , psychologie cognitive , communication , coopération .

Aide à la modélisation et construction de mémoire d'entreprise

L'objectif de cette action est de proposer des aides méthodologiques et logicielles pour la construction d'une mémoire d'entreprise, grâce à une approche centrée utilisateur. Nous étudions en particulier la construction d'un Web sémantique d'entreprise et la construction d'ontologies à partir de sources d'expertise humaines et textuelles.

Méthodologie de construction de mémoire d'entreprise

Keywords : capitalisation des connaissances , gestion des connaissances , mémoire d'entreprise , mémoire de projet .

Participants : Rose Dieng, Olivier Corby, Fabien Gandon, Alain Giboin.

L'objectif de cette action est de proposer une synthèse des apports méthodologiques du projet Acacia pour l'ade à la construction et diffusion de mémoires d'entreprise.

L'approche méthodologique d'Acacia repose sur la matérialisation de la mémoire d'entreprise sous forme d'un « Web sémantique d'entreprise », constitué d'ontologies, de ressources (i.e. des documents éventuellement XML, des personnes, des services, des logiciels) et d'annotations sémantiques sur ces ressources (i.e. sur le contenu des documents, sur les compétences des personnes, sur les caractéristiques des services ou des logiciels), ces annotations utilisant le vocabulaire conceptuel défini dans les ontologies. Notre méthode pour la construction d'une telle mémoire hybride intègre une méthode de construction d'ontologies (tant à partir de sources humaines que de sources textuelles), une méthode d'acquisition et modélisation des connaissances à partir de plusieurs experts, ainsi qu'une méthode de construction d'une mémoire de projet. Au niveau des architectures proposées par l'équipe Acacia, une architecture du Web sémantique comprendra documents + ontologies + annotations (comme dans le projet CoMMA) ou base de données + ontologies + annotations (comme dans le projet SAMOVAR). Pour prendre en compte la distribution des sources de connaissances et des populations d'utilisateurs dans l'entreprise, on peut adopter une architecture du Web sémantique distribué, où la gestion et l'exploitation de la mémoire reposeront sur un système multi-agents comme dans CoMMA.

On peut généraliser cette approche Web sémantique à une architecture comprenant les composants principaux de la mémoire (i.e. les composants devant être accessibles aux utilisateurs : ces composants pourront être des documents, mais aussi les experts eux-mêmes ou des bases de cas, des bases de connaissances, voire des ontologies) + une ontologie de référence + des annotations de ces composants principaux en utilisant le vocabulaire conceptuel de cette ontologie. Cette généralisation permet de prendre en compte diverses ressources hétérogènes pouvant constituer la mémoire et d'offrir, grâce à l'ontologie, un accès « intelligent » à une mémoire documentaire, à une mémoire à base de cas, à une mémoire à base de connaissances, voire à une mémoire incluant diverses ontologies locales ou diverses bases de données.

Adaptation de modèles des sciences humaines et sociales pour la conception de mémoires d'entreprise

Participant : Alain Giboin.

Cette action a pour but d'adapter des modèles issus des sciences humaines et sociales - en particulier des modèles psychologiques - à la conception de systèmes de gestion de mémoires d'entreprise, ces modèles pouvant alors servir de cadres pour comprendre et interpréter les pratiques réelles des membres de l'entreprise, pour définir des spécifications, pour élaborer des architectures de systèmes ou pour évaluer les systèmes et leur usage. L'adaptation des modèles repose sur des analyses des pratiques réelles des membres des organisations étudiées dans le cadre des contrats de l'équipe.

Nous avons poursuivi notre étude des approches dialogiques de la mémoire organisationnelle (cf. ). Dans ces approches, on considère

  1. la mémoire organisationnelle comme un processus de dialogue entre membres (présents, passés et futurs) de l'entreprise, mais aussi entre membres de l'entreprise et artefacts disponibles dans l'entreprise (documents, logiciels, etc.), et

  2. la construction de systèmes de mémoire organisationnelle comme une construction de systèmes assistant le processus de mémoire dialogique.

    Nous avons étendu l'étude de ces approches à l'apprentissage organisationnel.

Adaptation de la méthode des scénarios à la conception et à l'évaluation des mémoires d'entreprise

Participants : Alain Giboin, Fabien Gandon, Olivier Corby, Rose Dieng.

Cette action a pour objectif d'adapter à la conception de mémoires d'entreprise la méthode des scénarios utilisée par les communautés HCI (Human-Computer Interaction) et CSCW (Computer-Supported Cooperative Work). La finalité de cette adaptation est en particulier d'adapter les interfaces homme-machine (IHM) de nos systèmes aux utilisateurs et aux contextes d'usage, et de rendre ces IHM plus adaptables.

Parmi nos expériences de construction de systèmes de mémoire d'entreprise basés sur des ontologies, CoMMA a été la première pour laquelle nous avons dû prendre impérativement en considération les questions d'utilisabilité du système, des tests avec les utilisateurs finals ayant été programmés. Un enseignement majeur que nous avons tiré de l'expérience CoMMA est l'intérêt de la méthode (ou approche) des scénarios d'utilisation pour réduire le fossé entre développeurs du système (ontologistes en particulier) et utilisateurs, et donc éviter le rejet du système par ces utilisateurs .

Les scénarios d'utilisation sont des descriptions (textuelles, graphiques, etc.) des actions et des impressions des utilisateurs face aux systèmes informatiques (cf. . Des scénarios ont été déjà employés pour concevoir et évaluer des outils à base d'ontologies. Par exemple, les « scénarios de motivation » sont un composant central de la méthode TOVE de « génie ontologique » . Nous avons employé nous-mêmes une « approche des scénarios » pour concevoir et évaluer CoMMA. Notre approche est inspirée des approches des scénarios classiques dans les communautés HCI et CSCW, que nous considérons comme plus « orientées par les usages » que l'approche des « scénarios de motivation » classique dans la communauté du « génie ontologique ». Nous avons entrepris cette année une action visant à systématiser cette approche et proposé plusieurs directions pour cette systématisation, à partir de notre expérience de CoMMA .

Langages de représentation des connaissances pour le Web sémantique

Keywords : Web sémantique , Langages de représentation des connaissances , Logiques de description , Graphes Conceptuels , RDF(S) .

Participants : Alexandre Delteil, Catherine Faron-Zucker.

L'objectif de ces travaux est de proposer des langages de représentation des connaissances, adaptés au Web sémantique.

Ces travaux se sont déroulés dans le cadre de la thèse d'Alexandre Delteil . La vision du Web Sémantique repose sur l'utilisation d'un langage de représentation des connaissances commun pour exprimer la sémantique des informations sur le Web et rendre ainsi le Web compréhensible à des agents logiciels. RDF(S), le langage actuellement proposé par le W3C, a un pouvoir d'expression limité à un simple raisonnement hiérarchique sur des classes et des propriétés primitives. Nous avons proposé différents langages de représentation des connaissances pour le Web Sémantique, dans l'objectif de fournir une expressivité supérieure aux formalismes actuels tout en conservant une simplicité d'utilisation. Nous nous sommes pour cela inspirés des Logiques de Description (formalismes possédant une très forte expressivité) et des Graphes Conceptuels Simples (formalisme de syntaxe graphique possédant une très bonne lisibilité).

Le premier langage, DRDF(S), est une extension de RDF(S) possédant l'expressivité des Graphes Conceptuels Simples .

Le second langage, ???? ???? , intègre à la fois les caractéristiques des Graphes Conceptuels (GCs) et des Logiques de Description (LDs). Par rapport aux GCs, ce langage peut être vu comme la clôture des GCs sous les opérateurs booléens. Par rapport aux LDs, ???? ???? peut être vu comme la généralisation de ALC permettant de définir n'importe quel motif graphique dans les définitions de rôles. Une extension de ???? ???? , notée ???? ???? permet d'utiliser des prédicats binaires dans les conclusions des règles, avec la restriction consistant dans le fait que deux noeuds reliés dans la conclusion doivent l'être aussi dans l'hypothèse. ???? ???? constitue un langage décidable d'une très grande expressivité, supérieure à celles des logiques de description car offrant la possibilité d'utiliser des variables, et relativement simple à utiliser, car possédant une syntaxe graphique .

Apprentissage de concepts et d'ontologies pour le Web sémantique

Keywords : Web sémantique , Apprentissage symbolique relationnel , Ontologies , Apprentissage d'ontologies , RDF(S) .

Participants : Alexandre Delteil, Catherine Faron-Zucker.

L'objectif de ces travaux est de proposer des algorithmes pour apprendre et enrichir une ontologie, dans le cadre du Web sémantique.

Dans l'objectif de mettre à jour et enrichir les ontologies, nous proposons un algorithme d'apprentissage de concepts et d'ontologies pour le Web Sémantique . Notre algorithme classe les objets d'une façon systématique selon les motifs relationnels qui les décrivent. Il est incrémental par rapport à la taille des motifs appris où la taille est définie comme étant le nombre d'arcs d'un motif. Notre algorithme peut être vu comme la généralisation de l'Analyse Formelle de Concepts à des données relationnelles.

Notre approche est semi-automatique : la décision d'ajouter ou non un concept appris dans l'ontologie est laissée à l'ontologiste. Nous explicitons un opérateur de raffinement, i.e. un critère de formation des motifs de taille n + 1 à partir des motifs de taille n , ce qui permet de limiter le nombre de motifs considérés.

Comparaison de multiples ontologies dans le cadre du Web sémantique

Participants : Thanh-Le Bach, Fabien Gandon, Rose Dieng-Kuntz.

L'objectif de ces travaux est de permettre de comparer plusieurs ontologies dans le cadre du Web sémantique.

Ce travail s'est déroulé dans le cadre du stage de Thanh-Le Bach . Récemment, dans le cadre du Web sémantique, les nouvelles ontologies sont de plus en plus proposées et utilisées par/dans des communautés Web différentes. Les Web communautaires distincts préfèrent utiliser leurs propres ontologies et employer leurs propres présentations d'ontologie. Donc, si l'on vise un Web sémantique partagé entre plusieurs entreprises, la manipulation de plusieurs ontologies sera nécessaire. Il faudra donc pouvoir comparer, intégrer, faire des correspondances entre plusieurs ontologies.

Nous avons étudié des problèmes de comparaison et d'intégration de plusieurs ontologies, représentées dans des langages actuellement proposés pour le Web sémantique, tels que RDFS, OIL, DAML, Graphes conceptuels... Nous avons choisi le formalisme de représentation d'ontologie RDF(S) (recommandé par W3C) pour proposer, appliquer des algorithmes, des critères de comparaison entre deux ontologies et de mise en correspondance entre les concepts, relations et hiérarchies constituant ces ontologies. Nous avons développé plusieurs algorithmes de comparaison entre ontologies représentées dans le langage RDF(S) : simple « matching », TF/IDF modifié, adaptation des deux algorithmes précédents pour intégrer le dictionnaire sémantiquement structuré WordNet, prise en compte d'une comparaison tant terminologique que structurelle. Une application en Java a été développée et implémentée pour expérimenter ces algorithmes sur les ontologies O'CoMMA et Aprobatiom (de plus de 450 concepts chacune). Les résultats obtenus seront utilisés pour des étapes suivantes de la construction d'un Web sémantique multi-points de vue de l'équipe ACACIA .

Mémoire d'expériences sur les puces à ADN

Keywords : mémoire d'expériences , ontologie .

Participants : Leila Alem, Cyril Dejonghe, Rose Dieng, Olivier Corby, Alain Giboin.

L'objectif de cette action est de proposer une architecture et une méthode pour la capitalisation et la valorisation des connaissances dans le contexte d'une mémoire des expériences sur les biopuces.

Ces travaux ont eu lieu en collaboration avec Pascal Barbry de l'Institut de Pharmacologie Moléculaire et Cellulaire (IPMC), dans le cadre de l'accueil de Leila Alem et du stage de DEA de Cyril Dejonghe .

Une analyse de l'activité du biologiste utilisateur des biopuces, nous a permis de définir les deux besoins suivants :

  1. Besoin d'assistance lors des activités de recherche d'information :

    • Lors de la recherche d'information dans les sites Web tels que Ensembl, PubMed, NCBI etc. Le but ici est de rechercher ce qui est connu sur un gène donné, sur les interactions possibles de ce gène avec un autre, sur sa contribution à une fonction moléculaire, etc.

    • Lors de la recherche d'information dans la base des expériences sur les biopuces. L'objectif ici est de répondre aux questions suivantes : disposons-nous d'une biopuce contenant les gènes qui nous intéressent, si oui, quels sont les résultats d'expériences dont nous disposons ?

  2. Besoin de gérer les connaissances créées au cours de l'activité du biologiste. Ces connaissances sont cruciales mais ne sont pas pour le moment capitalisées. Elles prennent la forme de synthèse de résultats expérimentaux ou synthèse des recherches d'information.

Il est à noter que :

  1. La recherche d'information sur les bases de connaissance théoriques sur le génome telles que les sites NCBI (site américain sur le génome), ENSEMBL (BD génome humain), MEDLINE (BD des publications médicales), OMIM (BD des maladies génétiques), Homologene (qui permet de faire le lien vers d'autres espèces) peut être améliorée par l'exploitation de l'ontologie du domaine Gene Ontology (GO) via l'utilisation du moteur de recherche LocusLink. Il est à noter que l'évolution de l'ontologie est un problème important pour l'IPMC qui travaille en production.

  2. Les expériences sur les biopuces sont actuellement stockées sous la forme de documents XML dans la base de données MGED (Microarray Gene Expression Database). Ces expériences pourraient être annotées avec GO afin d'améliorer la recherche d'information dans MGED et de permettre le lien avec les bases de données théoriques.

  3. Les connaissances créées pourraient être annotées en utilisant une ontologie appropriée de manière à faciliter leur réutilisation.

Ces propositions sont au coeur de notre démarche de capitalisation et valorisation qui se conjugue en trois temps :

Nous avons, pour ce faire :

  1. défini un scénario centré sur les besoins identifiés ;

  2. proposé un formalisme pour le modèle des expériences. Ce dernier ainsi que le scénario d'utilisation permettront de délimiter l'ontologie à développer ;

  3. étudié l'ontologie Gene Ontology à des fins de réutilisation.

L'objectif est de développer un démonstrateur autour de CORESE pour explorer l'ontologie représentée en RDF(S).


previous
next