L’intelligence artificielle pour la classification d’objets biologiques
Les recherches précédentes sur la reconnaissance automatisée de corail
Bien que la problématique du suivi écologique des coraux soit d’actualité, il n’existe que très peu de publications scientifiques relatant d’un système capable d’automatiser les tâches liées à ce sujet. Les quelques études qui relatent de l’automatisation des tâches du suivi des communautés benthiques mettent à profit diverses technologies. Les méthodes de la littérature sont distribuées en deux catégories : l’analyse globale, par télédétection; et l’analyse locale, par photographie sous-marine. Parmi les catégories, divers médias ont été utilisés : l’imagerie multispectrale (voir 1.3.1.3), la vision stéréoscopique (voir 1.3.1.4), l’imagerie par ultra-sons et la photographie traditionnelle. Plusieurs articles relatent même l’utilisation d’une combinaison des médias. Outre la photographie traditionnelle, les médias moins accessibles permettent d’ajouter une information supplémentaire à la prise d’image, soit la réponse à une illumination particulière, ou encore la topologie tridimensionnelle des spécimens étudiés. Ces informations supplémentaires aident certes à départager les espèces présentes, mais nécessitent de l’équipement hautement spécialisé et couteux pour effectuer la collecte des données. Note : Tout au long de cette section, lorsqu’une terminologie relative à la reconnaissance de formes ou la vision artificielle traitée par ce mémoire est utilisée, une référence à la section correspondante est effectuée.
Les recherches basées sur la télédétection
Cette catégorie de recherches est incontournable puisque la télédétection (par imagerie satellitaire ou aérienne) est une méthode très populaire actuellement pour effectuer le suivi de la vie aquatique. Les travaux de Lesser et Mobley (2007) présentent un portrait de la littérature au sujet de la classification du substrat marin à l’aide de photographies aériennes hyperspectrale. Cet article présente bien la problématique du suivi écologique des coraux en utilisant ce média. En effet, pour assurer une lecture pertinente de la réponse spectrale, plusieurs facteurs doivent être pris en compte telle la « colonne d’eau » qui sépare l’observateur du sujet. C’est un phénomène connu, l’eau de mer possède un lot de propriétés optiques inhérentes à son milieu et à ses contaminants. Selon ses propriétés, l’eau atténue par absorption certaines longueurs d’onde et cet effet s’accentue avec la taille de la colonne d’eau qui sépare observateur du sujet (Maritorena, Morel et Gentili, 1994). Par extension, la position angulaire de la source d’éclairage fait également varier la réponse spectrale. De ce fait, l’angle de zénith du soleil doit donc également être pris en compte dans les calculs pour corriger la lecture du spectre réfléchi par le substrat benthique.
Pour mener à bien les expériences, les propriétés optiques inhérentes à l’eau de mer de la zone à l’étude sont évaluées en plongée sous-marine avec un imageur multispectral adapté. La bathymétrie (topologie du substrat marin) est acquise à l’aide d’un sonar. Finalement, la nature du benthos est validée en plongée par transects. Lesser et Mobley présentent la relation qui unit la bathymétrie, la nature du benthos et la réponse spectrale observée. Ils affirment qu’en connaissant deux de ces trois informations, il est possible de déterminer avec une précision acceptable l’information manquante par calcul. Bien que cette méthode soit moins précise que le suivi manuel des communautés benthiques par plongée sous-marine, elle représente un gain significatif puisque l’effort nécessaire à l’acquisition d’images aériennes est de beaucoup inférieur au suivi des communautés benthiques par plongée sousmarine.
Toutefois, il apparait rapidement que le niveau de détail des approches par télédétection n’est pas suffisant à l’étude de la biodiversité. En effet, les résultats de la classification ne permettent de départager sur l’imagerie aérienne que les coraux, les algues, les plantes aquatiques (macrophytes), le sable et l’alios (roche sédimentaire). Avec ce niveau de détail, il est possible de déterminer l’abondance et la distribution de la vie aquatique à l’échelle planétaire ainsi que le changement temporel et spatial de ces deux variables. Cependant, cette vue d’ensemble ne permet pas le suivi de la diversité biologique, qui s’intéresse à la répartition locale des espèces. C’est pourquoi nous n’avons pas poursuivi de plus amples recherches dans ce domaine.
Les recherches basées sur l’imagerie sous-marine
Il est certes plus complexe et plus couteux de transporter une équipe de biologistes et son équipement sophistiqué d’acquisition de données sous l’eau, à proximité des récifs. Toutefois, c’est uniquement en condition de plongée sous-marine que l’identification de l’espèce et le dénombrement des spécimens sont vraisemblablement possibles. Plusieurs publications qui visent l’automatisation du suivi des communautés benthiques relatent cependant l’utilisation d’un VSA (véhicule sous-marin autonome). Dans ce contexte, un petit sous-marin équipé de multiples senseurs est utilisé pour mener à bien la collecte des données automatiquement. Ce type d’équipement hautement sophistiqué a été utilisé dans les travaux de Johnson- Roberson et al. (2006), où les auteurs ont implanté un algorithme de segmentation et de classification de spécimens de corail directement au coeur de l’ordinateur de bord du VSA.
En mettant à profit la stéréovision, des descripteurs de texture basés sur les ondelettes de Gabor et un SVM (séparateur à vaste marge, voir 1.3.5.5) à titre d’algorithme de reconnaissance de formes (RDF), ils ont réussi à implémenter un système capable de segmenter et d’identifier le benthos en temps réel. La classification présentée par cette recherche ne permet de distinguer que trois formes benthiques distinctes (voir 2.1). Malgré la contrainte de temps réel, ce système admet une performance en classification impressionnante de 95 % suite à l’entraînement en validation croisée (voir 1.3.2.3) du SVM sur près de 8000 images stéréoscopiques. Johnson-Roberson et al. ont également publié un autre travail sur la reconnaissance automatisée de corail (Johnson-Roberson, Kumar et Willams, 2007). Toutefois, un autre type de capteur a été installé sur le VSA : un sonar. Les données en provenance du sonar ont été utilisées pour analyser la géométrie du substrat océanique. La fusion des données tirées des images couleurs et sonars acquises par le véhicule ont été traitées par le même processus d’extraction de caractéristiques de Gabor. Enfin, le SVM a également été utilisé pour classifier les données parmi deux ou quatre classes. Dans ces conditions, les résultats obtenus sont de 95 % et de 80 % de bonne classification pour les problèmes à deux et quatre classes respectivement.
Malgré l’exceptionnelle complexité technologique des approches précédentes, on dénote chez plusieurs autres auteurs les mêmes éléments au coeur de leur méthodologie. L’utilisation d’une technique de présegmentation des spécimens, des descripteurs basés sur la texture et d’algorithmes de RDF élaborés tel le SVM, est constante pour plusieurs travaux. Le travail de Mehta et al. (2007) est un bon exemple de cette tendance. Cette fois, de simples photographies numériques sont utilisées pour alimenter le classificateur. Plus encore, les valeurs de ton des pixels de petites zones carrées (25 pixels de côté) ont directement été utilisées en entrée du SVM. Malgré la simplicité de ce protocole expérimental, les auteurs clament avoir atteint une performance de l’ordre de 95 % de classification correcte également. Encore une fois, trois formes benthiques distinctes ont été départagées. Toutefois, seulement cent images ont été utilisées pour entraîner le classificateur. Les travaux de Marcos (2005) relatent aussi l’utilisation d’un classificateur évolué, le perceptron multicouche (voir 1.3.5.6) et de méthodes d’analyse de la texture : les motifs binaires locaux (voir 1.3.4.3).
L’acquisition des images a été effectuée dans ce cas à l’aide d’une caméra vidéo. Les images traitées sont donc des images couleur numériques extraites de la trame vidéo. Encore une fois, trois classes d’objets ont été prises en compte, les coraux vivants, les coraux morts et le sable. Suite à l’entraînement du PM, le taux de classification obtenu en généralisation pour cette approche est de l’ordre de 86 % de classification correcte. D’autres travaux de la littérature utilisent des méthodes plus simples pour classifier les éléments du substrat benthique. Diaz et Torres (2007) utilisent une procédure qui s’apparente à l’algorithme des plus proches voisins (voir 1.3.5.2) pour déterminer si un segment de l’image appartient à l’une ou l’autre des cinq classes de corail prises en compte par le problème. L’image issue d’une photographie sous marine couleur est d’abord présegmentée automatiquement. Ensuite, la couleur moyenne de chaque segment est utilisée pour classifier les segments.
Avenant que la classification en fonction de la couleur soit jugée ambigüe, en fonction d’un seuil de décision ajusté à la main, des caractéristiques de cooccurrence des tons de gris (voir 1.3.4.2) sont extraites pour compléter le portrait. Avec cette approche, l’auteur estime une performance en généralisation de 80 % de bonne classification. Utilisant le même paradigme de classification, l’article de Soriano et al. (2001) propose un système d’extraction de descripteurs utilisant l’information de couleur et de texture des segments d’images. La couleur moyenne dans un espace normalisé est utilisée conjointement à l’analyse de texture par motifs binaires locaux (voir 1.3.4.3). Les données ont ensuite été classifiées avec la règle du plus proche voisin (voir 1.3.5.2). Pour cette recherche, des images issues de transects vidéo ont été utilisées suite à une segmentation manuelle des coraux.
Après une validation des performances, le meilleur classificateur obtenu admet un taux de 48 % de bonne classification sur un problème considérant cinq classes. Les auteurs mentionnent toutefois un constat intéressant : un taux de classification d’environ 80 % est parfaitement acceptable dans le contexte d’évaluation de la santé des récifs coralliens. Certains auteurs s’intéressent principalement au problème de segmentation du corail dans des images numériques. C’est le cas de Rivera-Maldonaldo (2005) qui présente par son mémoire de maîtrise une méthode de segmentation de plusieurs types d’images de corail. Les trois bases de données présentées traitent d’images multispectrales acquises en plongée sousmarine, d’images multispectrales acquises par un VSA et finalement d’images issues d’une télédétection.
|
Table des matières
INTRODUCTION
CHAPITRE 1 ÉTAT DE L’ART
1.1 Les recherches précédentes sur la reconnaissance automatisée de corail
1.1.1 Les recherches basées sur la télédétection
1.1.2 Les recherches basées sur l’imagerie sous-marine
1.1.3 Discussion sur les recherches précédentes
1.2 Les travaux antérieurs à ce mémoire
1.2.1 L’intelligence artificielle pour la classification d’objets biologiques
1.2.2 L’optimisation de la taille des régions d’intérêt
1.3 Les sujets abordés en vision artificielle et reconnaissance de formes
1.3.1 L’acquisition des images et les prétraitements
1.3.1.1 La balance des couleurs
1.3.1.2 L’ajustement de la plage dynamique
1.3.1.3 La spectrométrie
1.3.1.4 La stéréovision
1.3.2 L’échantillonnage
1.3.2.1 La validation simple
1.3.2.2 La stratification
1.3.2.3 La validation croisée
1.3.3 La segmentation
1.3.3.1 Les fondements de la vision artificielle
1.3.3.2 Le seuillage
1.3.3.3 Le laplacien du gaussien
1.3.3.4 Le partage des eaux
1.3.3.5 Les méthodes avancées
1.3.4 L’extraction de caractéristiques
1.3.4.1 Le traitement de l’histogramme des tons
1.3.4.2 La matrice de cooccurence des tons de gris
1.3.4.3 Les motifs binaires locaux
1.3.4.4 La transformée de Fourier
1.3.4.5 La réduction de dimensionnalité
1.3.5 L’optimisation de paramètres et l’entraînement
1.3.5.1 Le classificateur naïf de Bayes
1.3.5.2 L’algorithme des k plus proches voisins
1.3.5.3 L’arbre de classification C4.5
1.3.5.4 Le réseau de neurones à base radiale
1.3.5.5 Le séparateur à vaste marge
1.3.5.6 Le perceptron multicouche
1.3.6 La généralisation
1.3.6.1 La fusion des décisions
1.3.6.2 Le mécanisme de rejet
1.3.6.3 Les matrices de confusion
1.3.6.4 Les intervalles de confiance
1.4 Discussion sur la revue de littérature
CHAPITRE 2 APPROCHE DE DESCRIPTION PAR FORMES BENTHIQUES
2.1 Introduction aux formes benthiques
2.2 L’acquisition des images et les prétraitements
2.3 La base de données
2.4 La segmentation
2.5 Les expérimentations sur l’approche de description par formes benthiques
2.5.1 L’optimisation de la représentation des données
2.5.1.1 Méthodologie
2.5.1.2 Résultats expérimentaux
2.5.1.3 Discussion
2.5.2 La restructuration de la base de données des Philippines
2.5.2.1 Méthodologie et résultats expérimentaux
2.5.2.2 Discussion
2.5.3 L’implémentation d’un système étagé avec mécanisme de rejet
2.5.3.1 Méthodologie
2.5.3.2 Résultats expérimentaux
2.5.3.3 Discussion
2.5.4 L’implémentation d’un système d’identification par détecteurs
2.5.4.1 Méthodologie
2.5.4.2 Résultats expérimentaux et discussion
2.6 Discussion générale sur l’approche descriptive par formes benthiques
CHAPITRE 3 APPROCHE PAR DESCRIPTION TAXINOMIQUE COMPLÈTE
3.1 Introduction à la taxinomie des coraux
3.2 L’acquisition des images et la base de données
3.2.1 Extraction des images de Coral ID
3.2.2 Sélection des images de Coral ID
3.3 L’échantillonnage des données et les méthodes de validation
3.3.1 L’échantillonnage des données
3.3.1.1 Évaluation de la performance en segmentation
3.3.1.2 Évaluation de la capacité de classification considérant deux métaclasses
3.3.1.3 Évaluation de l’effet du nombre de classes sur les performances
3.3.1.4 Évaluation de l’effet de la quantité de données par classe sur les performances
3.3.2 La méthode de validation
3.4 La segmentation des spécimens
3.4.1 La segmentation manuelle
3.4.2 La segmentation automatique supervisée
3.4.2.1 La présegmentation non supervisée
3.4.2.2 L’extraction des caractéristiques pour la segmentation
3.4.2.3 L’entraînement d’un algorithme de RDF pour la segmentation
3.5 L’extraction des caractéristiques pour la classification
3.5.1 Les descripteurs de morphologie
3.5.2 Les descripteurs de texture
3.5.3 Les descripteurs de couleur
3.5.4 Divergences relatives aux travaux de Levasseur
3.6 L’entraînement des classificateurs et l’optimisation des métaparamètres
3.6.1 L’optimisation des métaparamètres
3.6.2 L’entraînement des algorithmes de RDF
3.7 La généralisation
3.8 Les résultats expérimentaux et leur interprétation
3.8.1 Expérience sur la segmentation automatisée
3.8.1.1 Analyse de la présegmentation non supervisée
3.8.1.2 Évaluation de la performance en segmentation
3.8.2 Expériences sur la classification automatisée
3.8.2.1 Évaluation de la capacité de classification en considérant deux métaclasses
3.8.2.2 Évaluation de l’effet du nombre de classes sur les performances
3.8.2.3 Évaluation de l’effet de la quantité de données par classe sur les performances
3.9 Discussion générale sur l’approche par description taxinomique complète
CONCLUSION
RECOMMANDATIONS
LISTE DE RÉFÉRENCES BIBLIOGRAPHIQUES
Télécharger le rapport complet