Intégration neurosymbolique



Participants : Frédéric Alexandre, Yann Boniface, Laurent Bougrain, Hervé Frezza-Buet, Jean-Charles Lamirel, Bruno Scherrer, Georges Schutz.

Ces travaux correspondent à l'extension de modèles classiques du connexionnisme pour l'extraction de connaissances expertes, mais aussi pour mieux comprendre leur fonctionnment du point de vue de l'apprentissage statistique. La thèse de Laurent Bougrain, soutenue l'année dernière, a en particulier permis d'explorer en profondeur les liens entre ces modèles neuronaux et les modèles statistiques les plus classiques de régression, de catégorisation ou en core d'analyse factorielle. Sur la base de ces travaux, nous avons entrepris l'extraction de régularités dans des phénomènes temporels. Ainsi, nous nous sommes intéressé au contrôle de machines industrielles ( cf. § 7.3) [21] d'une part et à l'étiquettage automatique des états de la vigilance à partir de signaux physiologiques d'autres part ( cf. § 7.4). Ce type d'étude nécessite une analyse des données à des échelles de temps différentes afin de comprendre quelles informations permettent d'optimiser une production ou de prévenir un trouble du sommeil.

Par ailleurs, l'intégration de la théorie systémique de la communication dans le fonctionnement propre d'un système de recherche d'information/fouille de données est une contribution originale des travaux de recherche de l'équipe. Elle s'avère notamment particulièrement adaptée au traitement de média complexes, comme les images. Cette approche a impliqué cependant la conception de modèles spécifiques susceptibles de développer des propriétés d'interaction forte avec un utilisateur, ainsi que des propriétés d'adaptation étendues [15]. Un exemple important de tel modèle est le modèle de conjonction de cartes, ou de classification multicritères, que nous avons développé. Ce modèle, qui porte le nom de MicroNOMAD-MultiSOM représente une extension importante du modèle SOM de Kohonen (cf. § 5.4). Les capacités de déduction automatique du modèle représentent notamment un sérieux atout par rapport aux méthodes de classification usuelles utilisées en analyse de données. Ces dernières ne permettent en effet pas d'exploiter dynamiquement plusieurs points de vue, qui peuvent être considérés comme plusieurs dimensions, relatives à la même information. Les expériences que nous avons menées sur l'analyse de brevets ont révélé la supériorité manifeste de la méthode MicroNOMAD-MultiSOM relativement aux méthodes de type k-means, classification de type simple lien, ou perceptron neuronal élémentaire [13] [12] [2]. Une évaluation et une validation théorique approfondies du modèle MultiSOM sont en cours actuellement. Cette démarche se verra facilitée par les nombreux contextes expérimentaux d'application dont nous disposons.

Les limitations des méthodes numériques, telles que MicroNOMAD-MultiSOM, sont liées aux erreurs d'interprétation qu'elles peuvent générer si elles sont utilisés sans précaution préalable par des non spécialistes pour des tâches d'analyse fine d'un domaine. De leur coté, les méthodes symboliques qui peuvent être utilisées dans le même but, telles que les treillis de Gallois, présentent l'inconvénient de fournir des résultats souvent inexploitables car trop touffus et/ou trop détaillés. Nous avons montré qu'il était possible de faire collaborer ces deux types de méthodes en définissant des équivalences entre les treillis de Gallois et les cartes topographiques [22] . Ces équivalences permettent de générer des interprétations strictes et hiérarchisées sur les cartes, et permettent également, à l'inverse, de définir des points focaux d'entrée dans les treillis de Gallois. Nous prolongeons nos études sur les correspondances entre les deux types de méthodes afin d'utiliser les treillis de Gallois en tant qu'outils de validation des déductions thématiques produites par l'interaction entre les cartes dans le modèle MicroNOMAD-MultiSOM.

Enfin, nous essayons également de maîtriser le fonctionnement et plus particulièrement l'apprentissage de cartes auto-organisatrices en utilisant, dans le cadre d'une collaboration avec Supélec et l'équipe MAIA, des modèles de décision markoviens pour guider les stratégies d'apprentissage ( cf. § 7.1) de ces modèles neuronaux.

Nous avons mis au point une technique qui permet de nous intéresser à des modèles de décision markoviens ayant une taille très grande voire infinie: nous les approximons par des modèles de décisions de taille réduite fixée (cette taille réduite fait que l'on peut aisément calculer des solutions). Nous avons dérivé des critères qui permettent de déterminer les zones de l'espace d'état qui nécessitent d'être décrites avec plus de précision ou qui a contrario ne sont pas nécessaires pour l'approximation. Ainsi, de manière progressive, nous pouvons faire évoluer le modèle abstrait approximant le modèle réel : nous mettons à jour la représentation, ce qui permet d'améliorer les performances sans changer la complexité de résolution.

A l'aide de la technique décrite au paragraphe précédent, qui peut être vue comme un apprentissage de haut niveau, nous abordons un problème difficile de la modélisation d'agents intelligents : de manière analogue aux êtres vivants, nous essayons de modéliser des agents dont le système de décision est modulaire et distribué. Ce genre d'architecture pose deux problèmes fondamentaux : l'émergence des modules et leur coopération. Nous utilisons une abstraction de nombreux algorithmes de classification pour proposer un mécanisme qui fait émerger des modules automatiquement. Enfin, la nature explicite de la fonction de valeur des modèles de décision markoviens nous permet de facilement recombiner les calculs effectués par des modules distincts et ainsi de les faire coopérer.