Sous-sections

Actions nationales

Action de recherche coopérative ESCRIRE



Participants :

Olivier Corby, Rose Dieng, Jérôme Euzenat [action XMO, INRIA-Rhône-Alpes], Cédric Hébert, Amédéo Napoli [avant-projet ORPAILLEUR, INRIA-Lorraine], Yannick Toussaint [avant-projet ORPAILLEUR, INRIA-Lorraine].

Mots clés : représentation par objets, graphe conceptuel, logique de description, document, intranet, XML .

Nous participons à une Action de Recherche Coopérative (ESCRIRE) avec J. Euzenat (projet SHERPA/XMO, INRIA-Rhône-Alpes) A. Napoli et Y. Toussaint (avant-projet ORPAILLEUR, INRIA-Lorraine).

Un intranet (ou, plus généralement, l'utilisation des technologies de l'Internet) est l'occasion pour les entreprises d'accéder et de partager des connaissances bien souvent difficilement accessibles sous forme documentaire. Les documents numériques et numérisés peuvent être rendus accessibles de manière standard et transparente auprès de tous les utilisateurs concernés. L'ambition, à terme, est de réaliser de véritables serveurs de connaissances permettant la recherche et la manipulation des ressources de l'entreprise. Cependant, les limites de cette approche apparaissent rapidement : l'organisation des sites se révèle une tâche coûteuse et la recherche plein texte peu efficace. La recherche et l'interrogation d'un site, en s'appuyant sur le contenu des documents, est une nécessité et les formalismes de représentation de connaissances sont de bons candidats pour représenter ce contenu. La représentation du contenu permettra de le manipuler pour faire de la recherche par analogie, par spécialisation, par similitude, etc. Mais il existe différents formalismes de représentation de connaissances et nul ne connaît exactement leurs qualités respectives. Le but de l'ARC Escrire consiste donc à comparer trois types de représentations de connaissances (graphes conceptuels, représentations de connaissances par objets et logiques de descriptions) du point de vue de la représentation du contenu de documents et de sa manipulation. Pour cela elle s'appuie sur les compétences, dans chacune des représentations, des projets Acacia, Sherpa et Orpailleur respectivement. L'objectif de l'action consiste à comparer les apports de chacun des types de représentation pour la représentation du contenu dans les serveurs de connaissances. La mise à l'épreuve de ces différents formalismes pour le traitement d'un jeu de documents (fourni sans doute par un partenaire industriel) nécessite de mener une réflexion méthodologique sur le passage des textes à leur représentation formelle (de façon suffisamment indépendante des formalismes employés) en lien avec le type d'accès que l'on veut avoir sur ces documents. Cette représentation formelle sera définie conjointement et introduite dans un format XML. Un ensemble de requêtes définies de manière coordonnée sera évalué dans chacun des contextes. À l'issue de ce travail, les différents formalismes seront comparés entre eux (mais aussi à la recherche plein-texte) selon un protocole prédéfini. Celui-ci devra apprécier des critères tant qualitatifs (expressivité des requêtes, accessibilité/lisibilité des informations, etc.) que quantitatifs (temps de réponse à une requête, taux de précision/rappel des réponses, etc.). Cette évaluation proposera une grille d'analyse des avantages et inconvénients d'un langage de représentation formel vis-à-vis de la recherche d'informations sur le Web.

Autres collaborations nationales

Notre collaboration avec J. Quinqueton (LIRMM, Montpellier) s'est traduite par une réponse commune à l'appel d'offres RNRT et à l'appel d'offres européen IST.

Nous participons à divers groupes de travail :