Par Jasspreet Sahib
Est-ce qu’on vous a déjà proposé d’identifier une personne dans votre photo sur Facebook? Une intelligence artificielle ingénieuse détecte les visages sur vos photos. Est-ce que cela pourrait être possible aussi pour reconnaitre les baleines?
Le processus de reconnaissance faciale fait appel à des réseaux de neurones à convolution (sigle anglais : CNN), un type de modèle informatique inspiré du cerveau humain qui consiste en plusieurs couches qui filtrent les données d’entrée pour obtenir les renseignements désirés. Les CNN servent de base aux logiciels Siri d’Apple et Alexa d’Amazon, ainsi qu’à d’autres assistants virtuels à reconnaissance vocale.
La baleine noire de l’Atlantique Nord est une espèce en voie de disparition, et les chercheurs utilisent la photo-identification comme moyen d’étudier les individus. Il s’agit de reconnaitre les baleines individuellement d’une photo à l’autre à partir de la configuration des callosités qu’ils ont sur la tête. Ce processus d’identification peut être long et fastidieux et donner lieu à une accumulation de milliers de photos à comparer. Il y a surement un moyen plus efficace…
Et si on pouvait trouver une photo concordante en temps réel?
Deepsense a peut-être la solution!
Deepsense est une entreprise polonaise qui exerce ses activités dans le domaine de la science des données. Elle a élaboré une solution entièrement automatisée qui permettra la photo-identification des baleines noires en un éclair. Lorsque le logiciel sera en service, les utilisateurs pourront simplement téléverser leurs photos et recevoir les résultats dans un délai de quelques dizaines de secondes, avec une exactitude de plus de 87 % — il s’agit du taux le plus élevé à ce jour parmi l’ensemble des outils offerts. Ce taux s’accroit pour atteindre 95 % lorsque l’algorithme génère ses cinq meilleures concordances plutôt qu’une seule.
La solution de Deepsense fonctionne comme un outil de reconnaissance faciale pour les baleines noires. Elle utilise à cet effet trois CNN différents :
+ CNN 1 : Identifie la zone d’intérêt (dans ce cas-ci, une baleine noire) dans la photo et trace un cadre de contour correspondant (dans ce cas-ci, le rostre de la baleine). Pour y arriver, le réseau analyse chaque pixel de l’image et trouve les contours de la zone d’intérêt.
+ CNN 2 : Crée une « photo de passeport » normalisée en rognant les originaux et en leur faisant subir une rotation, de manière à ce qu’il ne reste que la zone qui va du museau à l’évent de la baleine. Identifie les callosités sur la tête de la baleine.
+ CNN 3 : En fonction de la configuration des callosités, cette couche trouve une photo concordante dans son catalogue d’individus — ce qu’on appelle un match — et présente immédiatement ses résultats.
La réunion inédite de l’expertise de scientifiques des données et de celle de spécialistes qui mènent des recherches sur les baleines noires de l’Atlantique Nord a commencé après que Deepsense a gagné un défi Kaggle (en anglais) que la National Oceanic and Atmospheric Administration (NOAA) avait organisé en aout 2015. Un défi Kaggle est une compétition entre scientifiques des données pour élaborer des solutions à des problèmes. Depuis, ils travaillent à la transformation de l’algorithme en un logiciel convivial.
Des difficultés à surmonter
Lorsque l’équipe de Deepsense a commencé à travailler à son projet initial, elle a dû faire face à plusieurs difficultés qui accompagnaient les photos aériennes de baleines noires. Il y avait notamment la qualité variable des photos, les reflets, l’écume, la surexposition ou la sous-exposition de certaines photos, ainsi que les bouillonnements autour d’une baleine dans l’image. Les conditions du travail de terrain sont rarement idéales, et les chercheurs avaient besoin d’une solution qui pourrait convenir à des photos provenant de tout un éventail de situations. Pour que la photo-identification soit exacte, il est crucial de bien relever la configuration des callosités à partir des photos aériennes.
L’apprentissage profond (deep learning en anglais) est au cœur de la solution gagnante de Deepsense. C’est-à-dire qu’après les entrées initiales effectuées manuellement par l’équipe, les réseaux ont appris la façon de procéder et sont devenus entièrement automatisés. Cette solution polyvalente peut ainsi compenser la couleur et la texture des photos aériennes tout en produisant des résultats dans les mêmes délais.
Pourquoi est-ce mieux que les méthodes conventionnelles?
Les autres plateformes, par exemple D.I.G.I.T.S. et Flukebook (en anglais), nécessitent des entrées manuelles à diverses étapes. D.I.G.I.T.S. est une plateforme de recherche permettant aux utilisateurs de filtrer les photos du catalogue de l’Anderson Cabot Center for Ocean Life en fonction de certains attributs, notamment les cicatrices que les baleines présentent et le sexe des baleines. Flukebook exige que ses utilisateurs soumettent leurs photos à l’approbation d’un chercheur local avant que le logiciel les traite, ce qui entraine des délais.
Étant donné qu’il ne reste que 411 baleines noires et qu’on déploie actuellement des efforts sans précédent pour assurer la conservation de l’espèce, la solution de Deepsense permettra aux scientifiques d’accélérer le processus de photo-identification, qui constitue souvent un fondement de bien des projets sur les populations sauvages. C’est non seulement l’analyse des photos aux fins d’identification qui gagnera ainsi en efficacité, mais aussi l’association des baleines individuelles entre les catalogues existants. Cela sera particulièrement utile dans le cas des baleines migratrices, et notamment des baleines noires de l’Atlantique Nord. Les développements futurs du système pourraient permettre d’établir la concordance entre des individus apparaissant d’une part dans des photos ou des vidéos aériennes et d’autre part dans des prises de vues provenant de submersibles ou encore de caméras d’observation ou de pièges photographiques.
Lancement prévu pour l’an prochain
Dans un courriel, Christin B. Khan, biologiste des pêches à la NOAA, a révélé que le lancement du logiciel pourrait avoir lieu dès l’été prochain en tant que composante de Flukebook, une plateforme existante, en collaboration avec Wild Me (en anglais). L’équipe souhaite également appliquer le logiciel aux baleines noires australes, de proches parentes, en le mettant à la disposition de chercheurs en Australie, en Afrique du Sud et dans d’autres pays où les baleines noires font l’objet d’initiatives de conservation.