Section 07 Sciences de l'information : traitements, systèmes intégrés matériel-logiciel, robots, commandes, images, contenus, interactions, signaux et langues

III. Traitement des images et vision numérique

La distinction entre le traitement du signal et le traitement des images est actuellement moins marquée qu'auparavant. Cette convergence est liée au développement d'outils mathématiques récents fonctionnant aussi bien sur les signaux que sur les images (techniques de restauration basées sur la parcimonie par exemple), ainsi qu'à l'accroissement des capacités de calcul qui permet de les utiliser dans les deux contextes. Ainsi, un certain nombre de points qui vont être abordés dans cette section ont déjà été évoqués en section II. Il subsiste bien entendu des différences importantes entre les problématiques signal et images et vision, notamment la prise en compte de divers aspects géométriques dans le domaine des images et de la vision.

A. Les grandes avancées actuelles et les thèmes émergents

Le contexte des « Big Data » conditionne, encore une fois, beaucoup les avancées actuelles. Nous les synthétiserons par trois avancées fondamentales sur le plan méthodologique et théorique : le développement des approches d'apprentissage supervisé, semi-supervisé, transductif, « profond », pour répondre aux problèmes de reconnaissance, de recherche, et d'interprétation ; la prise en compte de très grandes masses de données et de données de très grandes dimensions avec la multiplication des capteurs, la disponibilité de grandes collections de données hétérogènes ; et la fusion dans le processus de reconnaissance (noyaux multiples, sélection des caractéristiques). Certaines de ces avancées s'appuient sur la construction de dictionnaires et de représentations creuses des données. Par ailleurs, les images couleur, spectrales, multi- ou hyperspectrales nécessitent des approches vectorielles tant dans la représentation que dans le traitement et l'analyse, favorisant des recherches interdisciplinaires avec les équipes de mathématiques. Ces spécificités des données, à la fois géométriques et multivaluées, ont été le point de départ de nouvelles familles de méthodes comme les modèles de représentation par graphes et par algèbres vectorielles. De plus, des outils de traitements, comme les opérateurs de morphologie mathématique, ont été généralisés aux images multi-composantes en s'appuyant sur de nouvelles relations d'ordre, qui sont encore à l'étude. On notera également que les problèmes inverses en imagerie posent encore de nombreuses difficultés, liées à la dimensionnalité des données et à leur caractère souvent non régulier. De nombreux travaux (algorithme Proximal par exemple) offrent néanmoins maintenant des solutions dans différents cadres applicatifs comme l'inpainting, la restauration et l'échantillonnage comprimé. Outre l'intérêt des problèmes inverses, on peut souligner celui des représentations parcimonieuses, en particulier pour la co-conception de systèmes d'imagerie intelligents, alliant acquisition et traitements (avec les aspects théoriques, algorithmiques, méthodologiques, et hardware), en s'appuyant sur la super-résolution, l'échantillonnage comprimé, l'acquisition 3D ou 4D (voir les nombreux systèmes d'imageries médicales et biologiques, les caméras plénoptiques, panoramiques, etc.). Les réflexions sur les capteurs de demain posent des questions ouvertes notamment sur la notion de « bon modèle » pour une image.

Sur le plan de l'analyse, on ne peut que répéter l'importance de l'apprentissage statistique par analyse de masses d'images acquises dans des conditions non contrôlées pour répondre à des problèmes de reconnaissance d'objets, et aussi d'évaluation de la qualité des images sans référence. Cette prise en compte de la qualité est devenue un leitmotiv des constructeurs comme des utilisateurs, au même titre que les enjeux de sécurité, prérequis indispensable à l'exploitation des masses de données, y compris en conditions de mobilité. Dans ce contexte, des recherches originales continuent d'émerger sur la définition de nouveaux protocoles d'identification de la source d'acquisition d'une image ; de nouvelles techniques de cryptographie et de tatouage de grandes masses de données visuelles 2D, 3D, 4D, à haute résolution ; de schémas robustes d'authentification et de vérification de l'intégrité des contenus. Les protocoles de sécurité, développés avec les informaticiens et les mathématiciens, doivent également être pensés avec les nouvelles approches de compression d'images et de vidéos ultra haute définition, multivues et multi-profondeurs, 3D voxelliques, surfaciques, 4D, holographiques, etc. Pour tous ces types de données en émergence, des approches de compression en rupture telles que le codage bio-inspiré suscitent l'intérêt. D'une façon générale, les modèles bio-inspirés sont amenés à prendre une place importante dans le développement des nouveaux outils de traitements d'images en dimension N. En ce qui concerne le 3D, les techniques de reconstruction de scènes statiques à partir d'images ou de photographies sont passées au stade industriel (e.g. Autodesk et Acute3D en France). L'introduction ou le développement de nouvelles caméras non-standard apporte à la fois de nouvelles applications et de nouveaux problèmes scientifiques, avec notamment le fort développement de la photographie computationnelle. Les efforts de recherche en vision 3D se focalisent donc soit sur la reconstruction 3D+t de scènes non rigides, soit sur l'utilisation de ces nouvelles modalités d'imagerie optique. Le principal verrou de l'utilisation massive de ces technologies repose sur l'appréhension du système visuel humain qui nécessite, là encore, une approche pluridisciplinaire.

B. Interactions avec d'autres disciplines

Le traitement des images et la vision numérique sont, comme le traitement du signal, en interaction avec un grand nombre d'autres disciplines : sciences physiques et sciences de la vie, mathématiques, informatique, neurosciences computationnelles (modèles du système visuel humain, notamment de saillance visuelle de plus en plus étudiée), informatique graphique (rendu basé image, réalité augmentée, cf. section IV), automatique, robotique. Notons que le fort développement des applications où robots et humains partagent le même espace exige de nouvelles capacités de perception, notamment avec des capteurs visuels (reconnaissance de gestes et d'actions, navigation visuelle, etc.). On peut insister également sur l'importance croissante du traitement des images (et des signaux en général) pour les secteurs applicatifs du biomédical, de la santé, des problèmes liés au vieillissement, au handicap et au bien-être, contribuant au développement de la télémédecine et de la e-santé. L'imagerie joue également un rôle primordial pour l'observation de la Terre que ce soit pour des applications spatiales, environnementales, écologiques ou encore de sécurité des biens, des lieux et des personnes. L'habitat, les transports, que l'on veut désormais durables, sont aussi impactés par des applications de vision numérique. Par ailleurs, la priorité donnée aux objets connectés rend indispensable l'existence de liens forts avec les chercheurs des sciences humaines et sociales pour étudier les verrous essentiels au couplage entre l'homme et les dispositifs technologiques. Les plates-formes de réalité virtuelle, champ exploratoire en pleine expansion, sont des outils de simulation et de démonstration très propices à ces interactions (cf. section IV).

C. Place de la France dans le contexte mondial

La France est présente dans les comités d'organisation ou de programme des meilleures conférences du domaine, dans les comités techniques IEEE, et les comités éditoriaux des grands journaux internationaux. Elle est aussi représentée dans des campagnes d'évaluation internationales (telles que TRECVID) et participe activement aux standards (ISO, compression image – JPEG, vidéo – MPEG ou 3D – MPEG4). On notera enfin qu'en analyse d'images biomédicales, et notamment cérébrales, la France est très visible au travers de grosses structures. Elle est également pionnière en indexation multimodale pour la santé.

D. Points forts/points faibles de la recherche en France

Les points forts et points faibles sont ceux cités en section II. On peut ajouter d'une part un soutien institutionnel marqué (GDR ISIS et MIA), et d'autre part le retard de la France dans le domaine de la photographie computationnelle qui requiert, là encore, de la transdisciplinarité comme au sein du MIT Media Lab.

E. Retombées sociales, économiques (valorisation), culturelles

Le monde du numérique est présenté comme la « troisième révolution industrielle » et les dernières études sectorielles montrent que la dématérialisation et la valorisation des ressources numériques présentent des perspectives de croissance très élevées sur tous les secteurs. Ceci est particulièrement vrai pour les images, dans des secteurs variés : vision et robotique, automobile, éducation, culture, etc.