Travaux de Recherches

SUJET DE THÈSE

Détection et analyse du mouvement sur système de vision à base de rétine numérique

Domaines :

Sous-Domaines :

  • Vision par ordinateur
  • Rétines numériques
  • Algorithmique
  • Perception du mouvement
  • Détection de mouvement
  • Flot optique
  • Codage et compression
  • Vision active
La rétine numérique est un circuit qui combine fonctions d'acquisition et de traitement des images. C'est une grille bidimensionnelle de "cellules", chaque cellule étant formée de l'association d'un élément photosensible (photorécepteur), et d'un élément de calcul (processeur). Du point de vue algorithmique, la rétine numérique est une machine massivement parallèle de type réseau d'automates cellulaires, caractérisée par des éléments de calcul de capacité très limitée. Dans un système de vision, la rétine est associée à un hôte appelé cortex, typiquement composé d'un processeur scalaire (microprocesseur basse puissance ou DSP) et d'un circuit de logique programmable (FGPA). Le cortex a deux fonctions : (1)Contrôler la rétine, en lui envoyant les séquences de commandes. (2)Effectuer les taches de haut niveau du problème de vision, à partir des informations extraites de la rétine. Un système de vision à base de rétine doit permettre d'atteindre de grandes performances en termes de vitesses, grâce au parallélisme massif de la rétine, et aussi en terme de consommation d'énergie, de par la réduction drastique du flux d'information au sein du système : l'entrée est optique, et les traitements rétiniens permettent d'agréger les données images en une information "pré-symbolique", peu coûteuse à extraire, et à laquelle le cortex va donner une structure, une signification, par des calculs de faible volume.
De par ses avantages, le couple (rétine, cortex) est particulièrement adapté aux systèmes de visions portables, mobiles, autonomes. Cela implique que la perception du mouvement doit être une caractéristique forte du système à base de rétine. Les applications sont nombreuses et variées : systèmes de télésurveillance, capteurs de robots mobiles, systèmes de poursuite automatique, caméras compressives...
Si les rétines sont adaptés à ces applications, la petite capacité des éléments de calcul, et en particulier leur faible mémoire constitue une réelle difficulté pour la perception du mouvement. Mais cette difficulté donne à cette thèse son caractère fondamental : les solutions apportées aux différents problèmes d'analyse du mouvement apporteront une innovation radicale, parce que dans un système à base de rétine, l'algorithmique "commence" dès l'acquisition et se poursuit dans la manière de coder une donnée, et de l'extraire. Ainsi, dans le cadre de cette thèse, l'étudiant qui abordera un problème d'analyse du mouvement devra appréhender "toute la hauteur" de la chaîne algorithmique, de l'acquisition à la compréhension : Comment coder l'information image dans le circuit, en ne conservant que les caractéristiques pertinences du point de vue de l'application ? Comment à partir de ces données, calculer l'information de mouvement de manière massivement parallèle dans l'image ? Quels données pré-symboliques extraires, et comment ? Comment les exploiter ? Quels dialogues entre la rétine et son cortex ?
Telles sont les questions qui forment la substance de ce travail de thèse. L'étudiant abordera dans ce travail l'implantation de différents problèmes liés au mouvement : détection, calcul du flot optique, s'efforcera de mettre en oeuvre une démarche globale, forcément originale, de perception du mouvement sur système à base de rétine.

STAGE DE DEA 2002

Lors de mon arrivée en stage de DEA dans les laboratoires de l'ENSTA, j'ai mené des travaux sur l'élaboration d'un logiciel de reconnaissance de plaques d'immatriculation sur un système de vision à base de rétines artificielles. Le projet se découpe en deux parties , une partie détection de plaques d'immatriculations à  base d'outils de morphologie mathématique et une partie reconnaissance de formes à base de réseau de neurones.