Project : axis
Section: New Results
Keywords : analyse de séquences , motifs séquentiels , sous-séquences fréquenetes .
Analyse comparative de méthodes d'extraction de séquences
Participants : Doru Tanasa, Florent Masséglia, Brigitte Trousse.
On peut distinguer deux types de séquences fréquentes en termes de fouille de données : les sous-séquences fréquentes et les motifs séquentiels. Nous avons récemment implémenté une nouvelle version de l'index « Arbres de Suffixes » (cf.. STIndex) plus performante du point de vue « occupation de la mémoire ». Cette étape va nous permettre de lancer une étude comparative des méthodes d'extraction de séquences fréquentes sur deux plans :
-
La qualité des résultats (en comparant la pertinence des séquences obtenues par une méthode d'extraction de sous-séquences ou de motifs séquentiels).
-
La rapidité d'extraction.
Pour amorcer ces travaux de comparaison différentes méthodes d'extraction de séquences ont déjà été appliquées sur des données de type access log.