Travaux de Recherches
SUJET DE THÈSE
Détection et analyse du mouvement sur système de vision à base de rétine numérique
Domaines : |
Sous-Domaines : |
- Vision par ordinateur
- Rétines numériques
- Algorithmique
- Perception du mouvement
|
- Détection de mouvement
- Flot optique
- Codage et compression
- Vision active
|
La rétine numérique est un circuit qui combine fonctions d'acquisition et de
traitement des images. C'est une grille bidimensionnelle de
"cellules", chaque cellule étant formée de l'association d'un élément
photosensible (photorécepteur), et d'un élément de calcul (processeur). Du
point de vue algorithmique, la rétine numérique est une machine massivement
parallèle de type réseau d'automates cellulaires, caractérisée par des éléments
de calcul de capacité très limitée. Dans un système de vision, la rétine est
associée à un hôte appelé cortex, typiquement composé d'un processeur scalaire
(microprocesseur basse puissance ou DSP) et d'un circuit de logique programmable
(FGPA). Le cortex a deux fonctions : (1)Contrôler la rétine, en lui envoyant
les séquences de commandes. (2)Effectuer les taches de haut niveau du problème
de vision, à partir des informations extraites de la rétine. Un système de
vision à base de rétine doit permettre d'atteindre de grandes performances en
termes de vitesses, grâce au parallélisme massif de la rétine, et aussi en
terme de consommation d'énergie, de par la réduction drastique du flux
d'information au sein du système : l'entrée est optique, et les traitements
rétiniens permettent d'agréger les données images en une information
"pré-symbolique", peu coûteuse à extraire, et à laquelle le cortex va
donner une structure, une signification, par des calculs de faible volume.
De par ses avantages, le couple (rétine, cortex) est particulièrement adapté
aux systèmes de visions portables, mobiles, autonomes. Cela implique que la
perception du mouvement doit être une caractéristique forte du système à base
de rétine. Les applications sont nombreuses et variées : systèmes de
télésurveillance, capteurs de robots mobiles, systèmes de poursuite
automatique, caméras compressives...
Si les rétines sont adaptés à ces applications, la petite capacité des
éléments de calcul, et en particulier leur faible mémoire constitue une réelle
difficulté pour la perception du mouvement. Mais cette difficulté donne à cette
thèse son caractère fondamental : les solutions apportées aux différents
problèmes d'analyse du mouvement apporteront une innovation radicale, parce que
dans un système à base de rétine, l'algorithmique "commence" dès
l'acquisition et se poursuit dans la manière de coder une donnée, et de
l'extraire. Ainsi, dans le cadre de cette thèse, l'étudiant qui abordera un
problème d'analyse du mouvement devra appréhender "toute la hauteur"
de la chaîne algorithmique, de l'acquisition à la compréhension : Comment coder
l'information image dans le circuit, en ne conservant que les caractéristiques
pertinences du point de vue de l'application ? Comment à partir de ces données,
calculer l'information de mouvement de manière massivement parallèle dans
l'image ? Quels données pré-symboliques extraires, et comment ? Comment les
exploiter ? Quels dialogues entre la rétine et son cortex ?
Telles sont les questions qui forment la substance de ce travail de thèse.
L'étudiant abordera dans ce travail l'implantation de différents problèmes liés
au mouvement : détection, calcul du flot optique, s'efforcera de mettre en
oeuvre une démarche globale, forcément originale, de perception du
mouvement sur système à base de rétine.
STAGE DE DEA 2002
Lors de mon arrivée en stage de DEA dans les laboratoires de l'ENSTA, j'ai
mené des travaux sur l'élaboration d'un logiciel de reconnaissance de plaques
d'immatriculation sur un système de vision à base de rétines artificielles. Le
projet se découpe en deux parties , une partie détection de plaques
d'immatriculations à base d'outils de morphologie mathématique et une
partie reconnaissance de formes à base de réseau de neurones.