Projet Movi

Précédent : Présentation générale et
objectifs Remonter : Projet MOVI, Modélisation pour la
Suivant : Résultats nouveaux
Les domaines d'application habituels de la vision
tridimensionnelle par ordinateur ont été liés à la robotique ou à
la défense. Notre projet continue à être bien présent dans ce
domaine. Il est cependant de nouveaux domaines en émergence et
liés aux médias. Dans ces créneaux, nous nous positionnons dans
la problématique de la synthèse d'images à partir d'images, et de
façon plus conséquente, sur le problème de l'indexation de bases
d'images à partir de leur contenu.
Résumé : On s'intéresse aux problèmes d'étalonnage et
d'auto-étalonnage d'ensemble de caméras et de robots, qu'ils
soient liés rigidement ou non, ainsi qu'au problème de guidage
visuel d'un robot mobile ou manipulateur.
Les domaine d'applications de l'intégration vision-robotique sont
les suivants :
- la robotique spatiale, le problème étant de ré-étalonner un
ensemble robot et caméras dans l'espace car, suite au «
launching stress » l'étalonnage effectué au sol n'est plus
valide ; ce problème a été abordé dans le cadre du projet
CALVIN (Calibration of vision
systems) financé par l'ESA ;
- l'auto-étalonnage d'une tête stéréoscopique fixée sur un
robot mobile ; ce problème est abordé dans le cadre du contrat
de collaboration que nous avons avec la Société Aérospatiale
(1997-99) ;
- le guidage visuel d'un robot à plusieurs degrés de liberté
à l'aide d'une ou plusieurs caméras non étalonnées ; ce
problème est abordé dans le cadre du projet
LTR
VIGOR en collaboration avec deux
industriels, Groupe Sinters GIE et
Odense Steel Shipyard (1998-2001).
Résumé : Les secteurs de la presse et de l'audiovisuel,
ceux de l'industrie (imagerie scientifique), de la médecine ou
encore ceux de la propriété industrielle collectent des
quantités impressionnantes d'images qu'il faut pouvoir gérer.
Souvent le processus d'acquisition est plus rapide et simple
que celui de l'indexation, ce qui fait naître un besoin urgent
d'indexation automatique par le contenu.
Les applications des bases d'images peuvent être divisées dans
les segments suivants :
- agence de presse et de l'audiovisuel : ce segment se
caractérise par un énorme volume de données d'images, de
plusieurs millions pour les images fixes à des centaines de
milliers de vidéos pour les images animées ; les besoins en
consultation sont complexes, les requêtes sont souvent de haut
niveau et elles requièrent une forte interactivité avec
l'utilisateur ;
- les secteurs médicaux scientifiques et industriels ont des
besoins plus spécifiques, très liés aux différents domaines
concernés ; les volumes dépassent parfois les centaines de
milliers d'images et les types d'interrogation sont très
variables ;
- les demandes de la propriété industrielle correspondent à
une interrogation bien plus précise : « quelles sont les
archives similaires à tout ou partie d'un motif présenté? ».
Pour cette classe d'application, la réponse exacte, si elle
existe, ne doit pas être manquée. Le volume d'images traité
peut atteindre celui des agences de presse.
A la différence de l'indexation automatique des textes, les
images n'apportent pas directement d'information conceptuelle de
haut niveau sémantique. Il faut donc développer, pour les
différentes classes d'application, des index qui soient
pertinents pour permettre une recherche efficace et permettre une
interaction proche des concepts de l'utilisateur.
Précédent : Présentation
générale et objectifs Remonter : Projet MOVI, Modélisation pour
la Suivant : Résultats nouveaux