previous up next top index
Précédent : Acquisition des connaissancesdocuments structurés Remonter : Acquisition des connaissancesdocuments structurés Suivant : Graphes conceptuels et raisonnement


Outil d'aide à la construction de graphes conceptuels en exploitant des documents structurés : CGKAT

Participants : Philippe Martin, Olivier Corby, Rose Dieng

Mots-clés : acquisition de connaissances, capitalisation des connaissances, mémoire d'entreprise, document structuré, hypertexte, graphe conceptuel, point de vue

Ces travaux se déroulent dans le cadre de la thèse de Philippe Martin [3]. Nous avons conçu et développé un outil d'aide à l'acquisition de graphes conceptuels à partir de documents électroniques : CGKAT (Conceptual Graph Knowledge Acquisition Tool) [3, 22, 7]. Cet outil permet au cogniticien de construire une base de connaissances représentées dans le formalisme des graphes conceptuels, avec maintenance de liens hypertextes avec les documents d'expertise et aide à la recherche de connaissances dans la base ou d'informations dans les documents.

Lors de la construction d'une mémoire d'entreprise ou d'un système à base de connaissances, le cogniticien effectue des recherches d'informations contenues dans des documents (par exemple, des retranscriptions d'interviews d'experts) ; il peut représenter les connaissances sous-jacentes, créer, rechercher et exploiter ces connaissances (en particulier, pour les valider), manipuler des documents tels que de la documentation technique. Afin de faciliter l'exécution de telles tâches par un cogniticien, CGKAT permet l'utilisation combinée : a) des techniques avancées de structuration et de gestion de documents offertes par l'éditeur de documents structurés et hypertextes THOT (développé par le projet Opera, à l'INRIA-Grenoble), et b) des techniques de représentation et d'organisation de connaissances permises par le formalisme des graphes conceptuels.

Les connaissances représentées peuvent ainsi être stockées, recherchées et gérées dans des documents via l'éditeur THOT, et être exploitées pour permettre la recherche des informations qu'elles indexent dans des documents. De telles recherches peuvent s'effectuer par navigation le long des liens hypertextes ou par requête. CGKAT offre un langage de commandes : à partir des « graphes requêtes » formulés par l'utilisateur, CGKAT exploite entre autres l'opérateur de projection sur les graphes de la base. Le résultat de la requête est généré sous forme d'un document virtuel qui constitue une vue sur des parties de documents ou de la base sélectionnées sur les critères conceptuels indiqués par l'utilisateur.

De plus, afin de guider et faciliter le travail du cogniticien dans la représentation et la recherche de connaissances et d'informations, nous avons constitué une ontologie comprenant : a) des types de relations élémentaires usuelles (relations rhétoriques, spatiales, temporelles, mathématiques, etc.) et b) des types de concepts généraux que nous avons spécialisés par les 90.000 types de concepts de la base générale de connaissances terminologique WORDNET, ainsi que des types de concepts utiles pour la tâche de modélisation des connaissances. Par exemple, dans cette ontologie nous avons représenté sous forme de types de concepts (avec les définitions associées) plusieurs modèles génériques de la bibliothèque de la méthodologie COMMONKADS.

CGKAT est implémenté en C/C++, au-dessus de THOT, de la plate-forme de gestion de graphes conceptuels COGITO (développée par le LIRMM, Montpellier) et de WORDNET (développé par Princeton University).

Certaines fonctionnalités de CGKAT ont été testées pour la modélisation des connaissances d'experts en analyse d'accidents de la route [29] (cf. notre collaboration avec l'INRETS).



previous up next top index Précédent : Acquisition des connaissancesdocuments structurés Suivant : Graphes conceptuels et raisonnement Remonter : Acquisition des connaissancesdocuments structurés