Comment Jean Zay a entraîné Deepfaune, une IA de reconnaissance d’images d’animaux sauvages européens

21 octobre 2024

Numérique Terre et environnement

L’observation de la biodiversité passe notamment par l’analyse d’images prises par des pièges photos installés au cœur des écosystèmes étudiés. Cependant, avec des dizaines de milliers d’images récupérées quotidiennement à travers l’Europe, la quantité de données recueillies est trop grande pour un traitement manuel. Afin de reconnaître automatiquement les espèces animales européennes figurant sur les clichés, des scientifiques ont développé une intelligence artificielle de reconnaissance d’images spécifique et ils ont fait appel à l’expertise de l’IDRIS¹ et l'IRIT² pour entraîner l’IA sur le supercalculateur Jean Zay.

Chaque jour, des dizaines de milliers d’images sont prises par des pièges photos posés dans des parcs nationaux, réserves naturelles ou simples zones géographiques d’intérêt. La quantité d’images collectées est trop importante pour identifier à la main les animaux, une photo à la fois. La nécessité de recourir à une d’intelligence artificielle capable d’automatiser ce travail s’impose. Cependant, ces images sont d’une typologie singulière, car souvent prises dans des conditions de faible luminosité, dans un environnement particulier ou bien encore sur un fond difficilement distinguable. Le projet Deepfaune a vu le jour en 2020 afin de répondre à cet enjeu. Il est porté par Simon Chamaillé-Jammes, directeur de recherche CNRS au Centre d'écologie fonctionnelle et évolutive³, et Vincent Miele, ingénieur de recherche au Laboratoire d’écologie alpine⁴.

Les modèles d’IA actuels ont besoin d’un grand nombre de données pour s’entraîner. Pour Deepfaune, cela a été possible grâce à plus d’une cinquantaine d’organismes contributeurs qui ont envoyé aux scientifiques de nombreuses images où l’identification animale avait déjà été faite. Grâce à cette masse de données, les chercheurs ont pu entraîner l’IA de Deepfaune sur Jean Zay, le supercalculateur le plus puissant de France, avec l’accompagnement des experts de l’Institut du développement et des ressources en informatique scientifique (IDRIS¹).

« Le soutien apporté par l’IDRIS et l'IRIT a été très précieux pour le projet, notamment en nous aiguillant sur la faisabilité de nos différentes idées de modèles, ainsi que leurs performances » détaille Gaspard Dussert, doctorant au Laboratoire de Biométrie et Biologie Evolutive⁵. « Grâce à l’aide des collègues de l’IDRIS et de l'IRIT, notre modèle a pu passer à moins d’un tiers de seconde de calcul pour la détection des animaux sur les clichés. Leur expertise pour l’IA est visible dès le début, ils ont des environnements déjà préparés exprès pour les IA. »

Par ailleurs, trois ingénieurs membres du Réseau d’ingénieurs CNRS du Programme national de recherche en IA ont collaboré avec les chercheurs pour leur fournir un environnement de calcul python optimisé pour le supercalculateur avec lequel le modèle a été testé et entraîné.

Les ingénieurs de l’IDRIS et l'IRIT ont travaillé notamment sur la détection de la zone englobante contenant l’animal, c’est-à-dire la zone que le logiciel va pré-sélectionner afin de préparer le travail pour la reconnaissance spécifique des animaux. « L’enjeu était de passer très en-dessous de la seconde de détection » explique Pierre Cornette, ingénieur technicien à l’IDRIS. « Plusieurs modèles de détection d’animaux existent déjà, mais ils sont trop coûteux en ressource de calcul pour être utilisables sur n’importe quel appareil » complète Antoine Régnier, ingénieur technicien à l’IDRIS. « Deepfaune a pour vocation d'être utilisé par des chercheurs, des parcs nationaux ou bien encore des particuliers, trouver un modèle qui soit à la fois performant et léger en ressources a été un défi central à relever ! » conclut Julien Rabault, ingénieur technicien à l'IRIT.

Après cette étape, les chercheurs ont développé le modèle pour la phase de reconnaissance d’animaux. L’IA a été entraînée avec des espèces animales européennes (cerf, sanglier, chamois, etc), ce qui contraste avec la plupart des IA actuelles qui reconnaissent des animaux du continent africain (avec les espèces iconiques comme le lion, l’éléphant ou la girafe). Pour chacune des 64 epochs (itération du modèle basés sur le jeu de données) de Deepfaune, il aura suffi de seulement deux jours à Jean Zay pour effectuer les entraînements contre une année entière si cela avait été réalisé sur un ordinateur classique.

Disponible gratuitement dans sa dernière version depuis février 2024, Deepfaune compte déjà plusieurs centaines d’utilisateurs. Les utilisateurs sont d’horizons multiples : particuliers, parcs nationaux et régionaux, réserves naturelles ou bien encore des structures de surveillance de la biodiversité. Disponible en français, anglais, italien et allemand, Deepfaune est utilisé dans quasiment toute l’Europe, principalement en Allemagne et Italie. Les chercheurs comptent cependant continuer à améliorer leur outil, notamment en intégrant encore plus d’espèces animales d’Europe dans le modèle.

1 Institut du développement et des ressources en informatique scientifique (CNRS) à Orsay

2 Institut de recherche en informatique de Toulouse (CNRS/Institut national polytechnique de Toulouse/Université Toulouse Paul Sabatier)

3 CEFE (CNRS/École Pratique des Hautes Études - Université PSL/Institut de Recherche pour le développement/Université de Montpellier) à Montpellier

4 LECA (CNRS/Université Grenoble Alpes/Université Savoie Mont-Blanc) à Grenoble/Chambéry

5 LBBE (CNRS/Université Claude Bernard/Vetagro SUP) à Lyon