previous up next top index
Précédent : La terminologie Remonter : Traitement automatique de textes techniques Suivant : Les méthodes informatiques et linguistiques


l'analyse de l'information

Nous cherchons à mettre en oeuvre des outils infométriques et linguistiques d'analyse de textes. L'analyse est définie comme la phase suivant la recherche d'information : un usager consulte une base documentaire et en extrait un certain nombre de références. Les résumés sont traités dans leur ensemble pour construire une base de connaissance partielle représentant les connaissances qui ont pu être extraites des textes. Actuellement, un environnement ouvert est réalisé pour identifier les termes importants dans les textes, les classer (en clusters) par infométrie et cartographier les résultats. Il fonctionne aussi bien sur des textes anglais que sur des textes français. La poursuite des travaux porte sur une analyse linguistique fine des structures prédicatives qui ont été considérées comme importantes à la suite de l'étape de clusterisation afin de faire émerger des informations pouvant être consignées dans la base de connaissances.