Comment Jean Zay a entraîné Deepfaune, une IA de reconnaissance d’images d’animaux sauvages européens

L’observation de la biodiversité passe notamment par l’analyse d’images prises par des pièges photos installés au cœur des écosystèmes étudiés. Cependant, avec des dizaines de milliers d’images récupérées quotidiennement à travers l’Europe, la quantité de données recueillies est trop grande pour un traitement manuel.  Afin de reconnaître automatiquement les espèces animales européennes figurant sur les clichés, des scientifiques ont développé une intelligence artificielle de reconnaissance d’images spécifique et ils ont fait appel à l’expertise de l’IDRIS1 pour entraîner l’IA sur le supercalculateur Jean Zay.

Chaque jour, des dizaines de milliers d’images sont prises par des pièges photos posés dans des parcs nationaux, réserves naturelles ou simples zones géographiques d’intérêt. La quantité d’images collectées est trop importante pour identifier à la main les animaux, une photo à la fois. La nécessité de recourir à une d’intelligence artificielle capable d’automatiser ce travail s’impose. Cependant, ces images sont d’une typologie singulière, car souvent prises dans des conditions de faible luminosité, dans un environnement particulier ou bien encore sur un fond difficilement distinguable. Le projet Deepfaune a vu le jour en 2020 afin de répondre à cet enjeu. Il est porté par Simon Chamaillé-Jammes, directeur de recherche CNRS au Centre d'écologie fonctionnelle et évolutive2, et Vincent Miele, ingénieur de recherche au Laboratoire d’écologie alpine3

Les modèles d’IA actuels ont besoin d’un grand nombre de données pour s’entraîner. Pour Deepfaune, cela a été possible grâce à plus d’une cinquantaine d’organismes contributeurs qui ont envoyé aux scientifiques de nombreuses images où l’identification animale avait déjà été faite. Grâce à cette masse de données, les chercheurs ont pu entraîner l’IA de Deepfaune sur Jean Zay, le supercalculateur le plus puissant de France, avec l’accompagnement des experts de l’Institut du développement et des ressources en informatique scientifique (IDRIS1).

« Le soutien apporté par l’IDRIS a été très précieux pour le projet, notamment en nous aiguillant sur la faisabilité de nos différentes idées de modèles, ainsi que leurs performances » détaille Gaspard Dussert, doctorant au Laboratoire de Biométrie et Biologie Evolutive4. « Grâce à l’aide des collègues de l’IDRIS, notre modèle a pu passer à moins d’un tiers de seconde de calcul pour la détection des animaux sur les clichés. Leur expertise pour l’IA est visible dès le début, ils ont des environnements déjà préparés exprès pour les IA. » 

Par ailleurs, en collaboration avec les chercheurs et un autre collègue du Plan national de recherche en IA du CNRS, les ingénieurs ont fourni un environnement de calcul python optimisé pour le supercalculateur avec lequel le modèle à été testé et entraîné. 

Les ingénieurs de l’IDRIS ont travaillé notamment sur la détection de la zone englobante contennant l’animal, c’est-à-dire la zone que le logiciel va pré-sélectionner afin de préparer le travail pour la reconnaissance spécifique des animaux. « L’enjeu était de passer très en-dessous de la seconde de détection » explique Pierre Cornette, ingénieur de recherche à l’IDRIS. « Plusieurs modèles de détection d’animaux existent déjà, mais ils sont trop coûteux en ressource de calcul pour être utilisables sur n’importe quel appareil, ce qui est un prérequis dans le projet Deepfaune qui est utilisé par des chercheurs, des parcs nationaux ou bien encore des particuliers…» complète Antoine Régnier, ingénieur de recherche à l’IDRIS. 

Après cette étape, les chercheurs ont developpé le modèle pour la phase de de reconnaissance d’animaux. L’IA a été entraînée avec des espèces animales européennes (cerf, sanglier, chamois, etc), ce qui contraste avec la plupart des IA actuelles qui reconnaissent des animaux du continent africain (avec les espèces iconiques comme le lion, l’éléphant ou la girafe). Pour chacune des 64 epochs (itération du modèle basés sur le jeu de données) de Deepfaune, il aura suffi de seulement deux jours à Jean Zay pour effectuer les entraînements contre une année entière si cela avait été réalisé sur un ordinateur classique.

Disponible gratuitement dans sa dernière version depuis février 2024, Deepfaune compte déjà plusieurs centaines d’utilisateurs. Les utilisateurs sont d’horizons multiples : particuliers, parcs nationaux et régionaux, réserves naturelles ou bien encore des structures de surveillance de la biodiversité. Disponible en français, anglais, italien et allemand, Deepfaune est utilisé dans quasiment toute l’Europe, principalement en Allemagne et Italie. Les chercheurs comptent cependant continuer à améliorer leur outil, notamment en intégrant encore plus d’espèces animales d’Europe dans le modèle.

 

1 IDRIS (CNRS) à Orsay 

2 CEFE (CNRS/École Pratique des Hautes Études - Université PSL/Institut de Recherche pour le développement/Université de Montpellier) à Montpellier

3 LECA (CNRS/Université Grenoble Alpes/Université Savoie Mont-Blanc) à Grenoble/Chambéry.

4 LBBE (CNRS/Université Claude Bernard/Vetagro SUP) à Lyon