Premier workshop sur la vision par ordinateur

Le 14 janvier dernier, des chercheurs des écoles de l’Institut Polytechnique de Paris ont organisé la première édition d’un workshop consacré à la vision par ordinateur, un domaine clé de l’intelligence artificielle. Gianni Franchi, enseignant-chercheur à l’Unité d’informatique et d’ingénierie des systèmes de l’ENSTA, faisait partie du comité d’organisation.

Réunissant les compétences de 6 écoles d’ingénieurs parmi les meilleures de France, l’Institut Polytechnique de Paris compte une forte communauté de chercheurs reconnus internationalement dans le domaine de la vision par ordinateur, comme en témoigne l’octroi en mai dernier de 70 millions d’euros au projet Hi ! PARIS Cluster 2030.

Dans la perspective de faire vivre cette communauté et de faciliter les échanges entre chercheurs, enseignants-chercheurs, doctorants et industriels, Enzo Tartaglione, Gianni Franchi, Fanny Sabatier, Vicky Kalogeiton et David Picard ont organisé le 14 janvier 2025 le premier workshop sur le sujet.

Vicky Kalogeiton (École polytechnique) a ouvert les sessions en présentant ses travaux sur les modèles de génération d’images multimodaux, qu’il s’agisse de produire des images à partir de textes, de sons ou bien de données visuelles elles-mêmes préalablement interprétées par ordinateur.

Sa présentation a été suivie par celle d’Enzo Tartaglione (Telecom Paris) pendant laquelle il a exposé ses travaux sur les techniques de « pruning » (élagage) afin que les réseaux de neurones soient plus légers et plus efficaces énergétiquement tout en minimisant la perte de performance.

Gül Varol (ENPC) a enchaîné avec ses travaux sur les estimations par ordinateur du mouvement humain 3D suite à une description textuelle de la modification souhaitée.

David Filliat (ENSTA) a pris la suite avec une présentation de la vision par ordinateur pour les tâches de robotique avant de céder la place à Renaud Marlet (ENPC) qui a présenté ses travaux sur les véhicules autonomes.

Après une poster session et la pause déjeuner, les présentations ont repris avec Gianni Franchi (ENSTA) qui a parlé d’algorithmes robustes en intelligence artificielle par rapport aux problématiques d’incertitude. Son intervention s’est notamment focalisée sur la quantification des incertitudes dans les IA génératives.

David Picard (ENPC) a pris sa suite en présentant une nouvelle opération qu’il a développée sur la meilleure manière d’améliorer les couches d’attention, un processus fondamental en deep learning, afin qu’elles soient plus efficaces.

Il a été suivi par Titus Zaharia (Télécom SudParis) et ses travaux menés avec France Télévision d’analyse d’image par IA afin de générer sous-titres et bandeaux d’information en continu.

 

Puis Loïc Landrieu (ENPC) a parlé des tentatives de produire une représentation universelle des données géospatiales, avant que Christope Kervazo (Telecom Paris) ne close les présentations avec ses méthodes d'apprentissage profond interprétables et évolutives pour les problèmes inverses de l'imagerie.

Ces présentations étaient pour la plupart issues de publications dans des conférences de rang A*, permettant aux doctorants assistant au workshop d’y avoir accès gratuitement.

Devant le succès qu’a rencontré ce workshop, une deuxième édition est en préparation pour début 2026.