Précédent : Logiciels Remonter : Projet DIALOGUE, Dialogue à
forte Suivant : Actions
industrielles
Le problème principal que suscite la référence, c'est que, dans la mesure où celle-ci consiste, très grossièrement, à employer des expressions linguistiques pour désigner des objets, sa résolution de la référence, c'est-à-dire la détermination de l'objet auquel le locuteur veut référer, ne peut se contenter de l'exploitation des données linguistiques : il lui faut aussi des données non-linguistiques, connaissances générales sur le monde (données encyclopédiques), perception de la situation de communication.
Partant de cette constatation, le projet CERVICAL propose de développer une approche pragmatico-sémantique, centrée sur de deux notions principales, la notion de représentation mentale et la notion de domaine de référence. Le choix est de considérer qu'à chaque expression référentielle doit correspondre une et une seule représentation mentale qui rassemble toutes les informations (hétérogènes) sur l'objet correspondant. A partir de là, pour chaque nouvelle expression référentielle, que ce soit dans un texte ou dans un dialogue homme-machine, il faut arriver à déterminer si cette expression référentielle correspond à un nouvel objet (non identifié préalablement) auquel cas il faut construire une nouvelle représentation mentale ou si elle correspond à un objet déjà identifié auquel cas il faut identifier la représentation mentale existante qui y correspond. Une suggestion, pour simplifier le problème et pour réduire le nombre des représentations mentales disponibles pour la coréférence à un moment donné, est que, pour chaque nouvelle expression référentielle, on a le droit de construire un nouveau domaine de référence (sous-ensemble de l'ensemble des représentations mentales existant à ce moment), exploitable pour la résolution de cette expression référentielle, ce domaine de référence rassemblant des pointeurs vers les représentations mentales qu'il regroupe. Ces deux notions, ainsi que les opérations que l'on peut appliquer sur les représentations mentales et sur les domaines de référence, donnent lieu à un important rapport interne représentant l'état actuel des travaux, qui sera mis à jour régulièrement.
Au sein de l'équipe, les études fondamentales sur la pragmatique sont essentiellement menée par Anne Reboul, médaille de bronze du CNRS en linguistique cette année. Elle nous permet tout à la fois de construire des propositions sur le traitement de la référence valides d'un point de vue de la langue et continue à apporter à la communauté des résultats nouveaux dans le champ de la pragmatique et de l'analyse du discours. Ainsi on peut noter pour cette année :
Pour mettre en oeuvre des systèmes de reconnaissance automatique fiables et efficaces, il est impératif de restreindre la combinatoire des énoncés pouvant être reconnus. Dans le cadre d'applications de commande vocale, cela conduit à concevoir des interfaces fondées sur des langages artificiels dont l'usage est souvent très limité. Nous proposons de tenir compte de l'état de l'application et du dialogue pour définir dynamiquement le langage acceptable : un énoncé comme « efface le cube vert » n'est prioritaire pour être reconnu que s'il y a un cube vert dans l'application ; un énoncé comme « l'effacer » ne peut apparaître que si l'usage du pronom est pertinent dans le contexte de dialogue. Guider la reconnaissance par ces considérations d'ordre pragmatique permet de mettre à disposition de l'utilisateur un langage moins contraint dans sa forme et donc plus naturel. Pour ce faire nous avons défini une nouvelle architecture dans laquelle le niveau syntaxique est indépendant de l'application et les restrictions sémantiques et pragmatiques sont traitées par les modules en charge de l'interprétation de l'énoncé : référence aux objets d'une part, référence aux actions d'autre part. Ainsi pour la référence aux objets nous avons implanté un algorithme capable de prévoir, dans le contexte de dialogue, les expressions référentielles compatibles avec l'usage du français. Les principes retenus ont été validés par la mise en oeuvre du système COMPPA sur une application réaliste issue de notre collaboration avec Thomson-DASM. L'architecture proposée, plus modulaire et plus générique que les architectures traditionnelles, peut servir de base à la mise au point de systèmes acceptant des langages encore plus naturels.
En 1994, dans le cadre du projet IRMA, un corpus de type Magicien d'Oz a été élaboré. Le but de cette expérience était d'étudier les dialogue d'assistance. Dans cette optique, le protocole d'expérimentation inclut :
Ce corpus a été analysé en collaboration avec des psychologues du GRC (Groupe de Recherche sur les Commununication de l'Université Nancy 2). Ce travail a abouti à la définition d'un modèle du dialogue d'assistance fondé sur un ensemble de procédures (on en identifie 4 grandes classes) déterminées à partir de schémas de dialogues. Ce modèle a permis l'implémentation d'une composante d'un système de dialogue homme-machine qui a fait l'objet de la thèse de Laurent Chapelier en Juin 1996.