Mots clés : Web, hypermedia, fouille
de données, extraction de connaissances à partir de données,
KDD, raisonnement à partir de cas, CBR filtrage collaboratif,
calcul de recommandations .
L'objectif d'un système de recommandations est d'aider les
utilisateurs à faire leurs choix dans un domaine où ils
disposent de peu d'informations pour trier et évaluer les
alternatives possibles [SM95,RV97,KMM+97].
Un système de recommandations peut être décomposé en trois
entités de base (cf figure 1) : le groupe
d'agents producteurs de recommandations, le module
de calcul de recommandations et le groupe de
consommateurs des recommandations.
Figure 1: Architecture générale d'un
système de recommandation
|
Un défi majeur dans le domaine de la conception de
systèmes de recommandations est le suivant :
Comment produire des recommandations
personnalisées et de haute qualité tout
en minimisant l'effort requis de la part des
producteurs et des consommateurs.
Deux grandes approches complémentaires sont proposées dans
la littérature : 1) l'approche basée sur le contenu et
fondée sur l'apprentissage automatique de profils
utilisateurs et 2) l'approche dite de filtrage collaboratif
fondée sur des techniques de fouille de données. Le profil
utilisateur est une structure de données qui décrit les
centres d'intérêts d'un utilisateur dans l'espace des objets
à recommander. Celui-ci est une structure construite dans la
première approche ou donnée dans la seconde par l'utilisateur
. ce profil est utilisée soit pour filtrer les objets
disponibles (on parle alors de filtrage basé sur le contenu),
soit pour recommander à l'utilisateur ce qui a satisfait
d'autres utilisateurs ayant un profil similaire (on parle
alors de filtrage collaboratif) [RV97].
Dans l'action AID, nous poursuivons le développement d'une
approche hybride de calcul de recommandations basée sur
l'analyse du contenu visité et centrée fouille de données où
les comportements passés d'un groupe d'utilisateurs
sont utilisés pour calculer les recommandations (cf. filtrage
collaboratif). La plupart des autres approches fondées sur la
fouille de données sont principalement des approches
statistiques où l'ordre d'occurrence d'événements dans
l'historique n'est pas pris en compte lors du calcul de
recommandations. Citons comme exemple, dans le domaine d'aide
à la navigation sur le Web, le système FootPrints [WM97] et le système de Yan et al [YJGMD96].
Les problèmes difficiles pour la mise en oeuvre de notre
approche concernent les aspects suivants :
- fournir des techniques d'identification et d'extraction
de comportements pertinents (i.e. des enseignements ou des
cas) à partir des données brutes des historiques,
- définir des méthodes et des techniques de mesure de
similarités entre comportements,
- définir des techniques d'inférence de recommandations
personnalisées à partir des comportements pertinents passés
identifiés (ou à partir des cas remémorés).
Nous étudions l'ensemble des trois problèmes ci-dessus en
explorant la possibilité d'application des techniques RàPC et
plus généralement de l'ECD.
Nous étudions la classe de systémes de recommandations
s'appuyant sur une réutilisation d'expériences passées
issues d'un groupe d'utilisateurs utilisant des techniques de
raisonnement à partir de cas (RàPC). Dans cette classe de
systèmes, nous privilégions les deux types de systèmes
suivants :
- ceux dont le calcul de recommandations se base sur une
réutilisation d'expériences d'un groupe d'utilisateurs
recherchant de l'information dans un système
d'informations hypertexte comme le Web ou dans un site
internet/intranet. Ces systèmes visent une aide
personnalisée à l'activité de recherche d'informations
;
- ceux dont le calcul de recommandations s'appuie sur une
réutilisation d'expériences passées issues
d'experts en vue de fournir un aide à des activités
de conception.