Team AXIS

Members
Overall Objectives
Scientific Foundations
Application Domains
Software
New Results
Contracts and Grants with Industry
Other Grants and Activities
Dissemination
Bibliography
Inria / Raweb 2002
Project: AXIS

Project : axis

Section: New Results


Keywords : hiérarchie , clustering , CAH , lien minimum , complexité .

Extensions du modèle de la classification hiérarchique

Participants : Patrice Bertrand, Sergiu Chelcea, Gentian Guscho, Laurent Jullien, Brigitte Trousse.

La Structure 2-3 hiérarchique

P. Bertrand s'est intéressé à un type particulier de classification pyramidale : la classification 2-3 hiérarchique . Plus précisément, une collection ???? de parties non vides d'un ensemble fini E est appelée 2-3 hiérarchique si pour chaque partie X ???? , il existe au plus une partie Y ???? telle que X Y { , X , Y } , autrement dit si pour tout X ???? , il n'existe pas plus d'un élément Y ???? tel que X Y , X - Y et Y - X ne soient pas vides. Nous avons déterminé quelques propriétés des collections 2-3 hiérarchiques, en particulier nous avons montré que ce sont des collections d'intervalles pour au moins un ordre total défini sur E , et que le nombre maximal d'éléments (non réduits à des singletons) d'une collection 2-3 hiérarchique est égale à 3 2 ( E - 1 ) .

Nous avons également proposé le principe d'un algorithme de Classification Ascendante 2-3 Hiérarchique (2-3 CAH) qui est naturellement associé à ce type de structure et qui généralise l'algorithme bien connu de la CAH. Finalement, nous avons prouvé une extension de la bijection de Johnson-Benzécri (entre hiérarchies indicées et ultramétriques) au cas des 2-3 hiérarchies indicées au sens large.

Lien minimum pour l'Algorithme de Classification 2-3 hiérarchique

Le stage de Laurent Jullien (avril - septembre 2002) (responsable : P. Bertrand) a porté essentiellement sur l'étude des propriétés de l'algorithme de 2-3 CAH avec le lien simple. Il a été montré notamment qu'en introduisant un nouvel indice du lien simple (appelé indice du "double lien" minimum"), l'algorithme de 2-3 CAH conduit à une 2-3 hiérarchie indicée au sens large qui induit une 2-3 ultramétrique qui est inférieure à la dissimilarité initiale et supérieure à l'ultramétrique sous-dominante.

Etude des dissimilarités induites par les 2-3 hiérarchies

Le stage de Gentian Guscho (responsable : P. Bertarnd) avait pour objectif d'étudier la structure de classification 2-3 hiérarchique, en examinant plus particulièremement les dissimilarités appelée 2-3 ultramétriques, qui sont induites par ce type de classifications. L'étude avait aussi pour objectif de situer les 2-3 ultramétriques dans le cadre général du treillis des dissimilarités définies sur un meme ensemble de données. On a ainsi a pu mettre en évidence l'existence d'une sous-dominante pour une classe particulière de 2-3 ultramétriques.

Complexité et implémentation de l'Algorithme de Classification 2-3 hiérarchique

Dans le cadre de l'encadrement de stage de DEA de Sergiu Chelcea (responsables : P. Bertrand et B. Trousse), nous avons étudié le nouvel algorithme de classification, appelé Classification Ascendante 2-3 Hiérarchique, proposé par Patrice Bertrand dans Bertrand (2002), et nous l'avons implémenté et intégré dans la boite à outils de Raisonnement à Partir de Cas (RàPC), CBR*Tools, développée à l'INRIA. L'étude théorique de la classification 2-3 hiérarchique a révélé quelques propriétés concernant ce nouvel algorithme, et une reformulation de l'algorithme a permis de proposer un algorithme en ???? ( n 2 log n ) au lieu de ???? ( n 3 ) . Une modification de la phase de fusion a aussi été proposée afin d'obtenir un indiçage strict de la structure de classes générées après chaque fusion de deux classes. L'algorithme a été testé dans le cadre d'une application de RàPC pour la détermination de facteurs de risque d'assurance des voitures." Actuellement nous nous focaliserons sur l'utilsiationd e cet algorithme pour la classification de comportement utilisateurs sur le Web.


previous
next