La classification en bioacoustique

La classification en gรฉnรฉral

Aujourdโ€™hui il nous est encore difficile de dรฉfinir globalement la classification notamment, car chaque communautรฉ associe le terme ยซ classification ยป au vocabulaire de son contexte scientifique. Nous trouvons ainsi aujourdโ€™hui que la classification est liรฉe aux mรฉthodes dโ€™apprentissage (machine learning et deep learning pour apprentissage automatique et apprentissage profond en anglais), ร  lโ€™intelligence artificielle, ร  la vision par ordinateur (computer vision en anglais), ร  la reconnaissance de formes (pattern recognition en anglais), ร  lโ€™optimisation, ร  la topologie mathรฉmatique, ร  la reconnaissance, aux modรจles de prรฉdiction, aux mรฉthodes de segmentation, etc. Nรฉanmoins, il est possible de sรฉparer la maniรจre de faire de la classification en deux approches principales en fonction du niveau dโ€™informations disponibles sur les donnรฉes et de lโ€™objectif recherchรฉ.

La classification supervisรฉe

La premiรจre approche consiste ร  vouloir remplacer (ou du moins seconder) un expert ou un superviseur. Par exemple, dans notre contexte, lโ€™objectif est de rรฉaliser automatiquement les tรขches de reconnaissance et/ou de dรฉtection en identifiant chaque nouvelle observation, comme lโ€™aurait fait un ou plusieurs experts. On parle alors de classification supervisรฉe et plus largement dโ€™analyse discriminante. Pour la validation de ces mรฉthodes de classification, il est nรฉcessaire dโ€™avoir une base de donnรฉes annotรฉes. En rรฉsumรฉ, lโ€™idรฉe principale est dโ€™utiliser lโ€™expรฉrience, ou vรฉritรฉ terrain, donnรฉe par un ou plusieurs experts du domaine considรฉrรฉ pour construire et valider lโ€™algorithme de reconnaissance. La construction consiste ร  ยซ apprendre ยป cette vรฉritรฉ terrain, cโ€™est la phase dโ€™apprentissage. La validation consiste ร  comparer les rรฉsultats proposรฉs par lโ€™algorithme avec la vรฉritรฉ terrain, cโ€™est la phase de test. Nous reviendrons plus loin (cf. section 2.7) sur les questions de validation de mรฉthodes dโ€™apprentissage et sur les problรฉmatiques inhรฉrentes aux bases de donnรฉes.

La classification non supervisรฉe

La seconde approche est plus complexe ร  rรฉsumer. Mathรฉmatiquement, on cherche ร  interprรฉter les donnรฉes de faรงon gรฉomรฉtrique (ou topologique) en se basant sur la notion de distance ou similaritรฉ. Cette notion de distance peut sโ€™appliquer entre les donnรฉes directement ou sโ€™utilise entre des ยซ sous-espaces ยป de donnรฉes quโ€™on appelle lโ€™ensemble de descripteurs ou features (pour caractรฉristiques en anglais). La distance ainsi dรฉfinie va alors permettre de partitionner les donnรฉes par rapport aux descripteurs choisis. On parle de classification non supervisรฉe (clustering en anglais) ou plus largement dโ€™analyse descriptive ou exploratoire. Nous proposons ici quelques problรฉmatiques liรฉes ร  ces mรฉthodes : la recherche de sous-espaces reprรฉsentatifs (descripteurs pertinents par rapport au contexte) afin de rรฉaliser, par exemple, de la segmentation (sรฉlection de zones dโ€™intรฉrรชt); la visualisation (reprรฉsentation schรฉmatique simple) et/ou lโ€™accรจs rapide aux informations voulues par un ou plusieurs utilisateurs dans un contexte donnรฉ; la gรฉnรฉration dโ€™hypothรจses, cโ€™est-ร -dire le fait de proposer un comportement gรฉnรฉral ร  partir dโ€™observations faites sur les donnรฉes; la simulation de donnรฉes observรฉes (problรฉmatique dโ€™incrustation dans de lโ€™image ou de la vidรฉo comme par exemple la synthรจse de texture). Lโ€™idรฉe ici est que les donnรฉes ne sont gรฉnรฉralement pas labellisรฉes ni ยซ classรฉes ยป par un expert. Les enjeux sont alors, soit dโ€™observer des donnรฉes ร  des fins statistiques (proportion, comptage, etc.), soit de construire des classes pertinentes par rapport au contexte applicatif dans lโ€™idรฉe de faire de la classification supervisรฉe.

La classification semi-supervisรฉe

Pour finir, lorsque la base de donnรฉes est partiellement annotรฉe et quโ€™il nโ€™y a pas dโ€™expert pour terminer le travail dโ€™annotation, la classification non supervisรฉe peut รชtre utilisรฉe afin dโ€™aider ร  complรฉter les annotations manquantes. On parle alors de classification semi-supervisรฉe voire de dรฉtection ou dโ€™apprentissage de nouveautรฉ. Dans la pratique, quโ€™elle soit manuelle ou non, lโ€™utilisation de la classification non supervisรฉe, cโ€™est-ร -dire le fait de ยซ regarder ยป les donnรฉes, est fondamentale. Cette รฉtape permet รฉventuellement de confirmer ou dโ€™infirmer les propositions faites par un expert sur les annotations des donnรฉes, en plus de vรฉrifier si la tรขche demandรฉe est rรฉalisable manuellement par un รชtre humain.

Formulation mathรฉmatique de notre problรฉmatiqueย 

Dans notre contexte dโ€™acoustique passive, comme nous savons a priori quelles donnรฉes nous souhaitons reconnaรฎtre, notre mรฉthode de reconnaissance correspond ร  de la classification supervisรฉe. Lโ€™objectif est de donner de la connaissance (phase dโ€™apprentissage) ร  un systรจme pour quโ€™il devienne capable de faire de la re-connaissance. De faรงon plus gรฉnรฉrale, nous cherchons ร  transformer un ensemble de donnรฉes en informations pertinentes. Ces informations sont pertinentes lorsquโ€™elles permettent de sรฉparer les donnรฉes de classes diffรฉrentes et/ou de rassembler les donnรฉes dโ€™une mรชme classe afin de mieux les identifier. Formellement, ร  partir dโ€™un ensemble de N couples de donnรฉes labellisรฉes D = {(xi ,โ„“i)}1โ‰คiโ‰คN avec x1,x2,…,xN les donnรฉes elles-mรชmes ou un ensemble de descripteurs, et โ„“1,โ„“2,…,โ„“N les labels associรฉs (ou noms des classes de signaux), nous cherchons une fonction (un classifieur) f qui, aprรจs avoir effectuรฉ une phase dโ€™apprentissage (construction de f ) sur une base dโ€™apprentissage DA (sous ensemble de D), soit capable de retourner une estimation du label โ„“y (ou classe) associรฉ ร  lโ€™entrรฉe (ou lโ€™observation) y soit :

f (y|DA) = ห†โ„“y (2.1)

Ici, le ยซ sachant DA ยป reprรฉsente lโ€™expรฉrience ou la connaissance apportรฉe au systรจme pour quโ€™il puisse rรฉaliser de faรงon automatique lโ€™estimation du label โ„“y associรฉ ร  lโ€™observation y. Lโ€™idรฉe est toujours de vouloir remplacer lโ€™expert du domaine. Cโ€™est cette expertise qui, associรฉe ร  lโ€™architecture du systรจme, dรฉtermine la faรงon de reprรฉsenter chaque classe.

Vue dโ€™ensemble gรฉnรฉrale des รฉtapes de la reconnaissance

Avant de rentrer dans les dรฉtails de la reconnaissance en bioacoustique sous marine, nous proposons de dรฉcrire le processus gรฉnรฉral effectuรฉ sur les donnรฉes (ici des signaux). Tout dโ€™abord, les donnรฉes brutes D sont sรฉparรฉes en deux ensembles disjoints, la base dโ€™apprentissage DA et la base de test DT. Les donnรฉes dโ€™apprentissage DA sont ensuite ยซ transformรฉes ยป ou projetรฉes dans un espace reprรฉsentatif des signaux dโ€™intรฉrรชts (signaux sรฉlectionnรฉs par un expert). Dans la littรฉrature, il sโ€™agit principalement dโ€™espaces temps-frรฉquence ou temps-รฉchelle (cf. plus loin la section 2.5). A partir de cette reprรฉsentation des donnรฉes vient lโ€™extraction de descripteurs ou caractรฉristiques ou attributs. Ces descripteurs peuvent รชtre vus comme des ยซ nouvelles variables dโ€™observation ยป qui permettent de discriminer les signaux dโ€™intรฉrรชt, par exemple des informations temps-frรฉquence.

Les donnรฉes dโ€™apprentissage DA rรฉsident alors dans un sous-espace XA uniquement constituรฉ des valeurs (qualitative et/ou quantitative) des descripteurs des signaux dโ€™intรฉrรชts. A partir de ces descripteurs et de la vรฉritรฉ terrain, la phase dโ€™apprentissage prend fin avec le choix et/ou la construction de f (cf. plus loin section 2.7). Il existe deux faรงons gรฉnรฉrales de considรฉrer f (cf. plus de dรฉtails dans la partie 2.7). La premiรจre approche consiste ร  avoir f reposant sur un comparateur ou une mesure de similaritรฉ. Cโ€™est-ร -dire que le systรจme de reconnaissance a en mรฉmoire un ou plusieurs reprรฉsentants de chaque classe. Ces reprรฉsentants peuvent prendre en compte les connaissances a priori des donnรฉes ou se baser directement sur des donnรฉes brutes. Le choix de f et la construction de ces reprรฉsentants correspondent ร  la phase dโ€™apprentissage. Comme nous le verrons plus loin, la reconnaissance correspond alors ร  identifier le reprรฉsentant le plus ressemblant de lโ€™observation courante (entrรฉe du systรจme). La procรฉdure est alors liรฉe ร  des problรฉmatiques dโ€™estimation, lโ€™idรฉe est que le modรจle de chaque classe soit le plus reprรฉsentatif possible. La seconde approche consiste ร  contraindre directement lโ€™espace de reprรฉsentation des donnรฉes. Il sโ€™agit de rรฉduire lโ€™espace dโ€™entrรฉe jusquโ€™ร  un espace de sortie qui soit gรฉnรฉralement de dimension รฉgale au nombre de classes ร  identifier. La construction de f consiste alors ร  rรฉsoudre un problรจme de minimisation dโ€™une fonction dite fonction de coรปt. Cette fonction de coรปt permet dโ€™identifier les erreurs commises par le systรจme afin de le corriger ou de le mettre ร  jour. Dans ce cas, f est un systรจme dont les sorties correspondent au nombre de classes attendues. Pour chaque รฉlรฉment x de XA, f se met ร  jour pour converger vers le rรฉsultat voulu. Une fois lโ€™apprentissage terminรฉ, lโ€™espace de sortie reprรฉsente alors une partition (lโ€™espace est partitionnรฉ cโ€™est-ร -dire, quโ€™il a des frontiรจres associรฉes ร  chaque classe) qui permet dโ€™identifier chaque รฉlรฉment par sa position gรฉomรฉtrique dans cet espace. Enfin, vient la phase de test, la base de test DT subit les mรชmes traitements que les donnรฉes dโ€™apprentissage pour devenir un ensemble de descripteurs XT de mรชme nature que XA. De cette faรงon, les performances de la mรฉthode peuvent รชtre รฉvaluรฉes en comparant les rรฉsultats proposรฉs par f avec la vรฉritรฉ terrain donnรฉe par lโ€™expert. Pour la suite, nous proposons de commencer par donner du sens ร  la dรฉfinition de ce quโ€™est une classe. Puis, nous prรฉsentons les reprรฉsentations des donnรฉes dโ€™observation proposรฉes dans la littรฉrature bioacoustique pour introduire les descripteurs utilisรฉs. Ensuite, nous discuterons de lโ€™architecture des systรจmes utilisรฉs, notamment leur mise en ล“uvre, ร  savoir si lesย  mรฉthodes considรฉrรฉes sont basรฉes sur un ensemble de projections (par exemple les rรฉseaux de neurones) ou plutรดt sur une mesure de similaritรฉ. Enfin, nous discuterons des problรฉmatiques inhรฉrentes aux bases de donnรฉes rรฉelles et ร  la validation des mรฉthodes de reconnaissance.

Le rapport de stage ou le pfe est un document dโ€™analyse, de synthรจse et dโ€™รฉvaluation de votre apprentissage, cโ€™est pour cela chatpfe.com propose le tรฉlรฉchargement des modรจles complet de projet de fin dโ€™รฉtude, rapport de stage, mรฉmoire, pfe, thรจse, pour connaรฎtre la mรฉthodologie ร  avoir et savoir comment construire les parties dโ€™un projet de fin dโ€™รฉtude.

Table des matiรจres

Introduction gรฉnรฉrale
Motivations scientifiques
Contexte dโ€™รฉtude
Problรฉmatique
Organisation du manuscrit
Contributions scientifiques
1 Contexte et problรฉmatique
1.1 La reconnaissance de formes
1.2 La bioacoustique
1.3 Le paysage sonore de lโ€™Ocรฉan : quand nos oreilles deviennent nos yeux
1.4 La grande famille des mammifรจres marins
1.5 Lโ€™entreprise SERCEL et lโ€™environnement sismique
1.6 Problรฉmatique et dรฉmarche scientifique adoptรฉe
2 La classification en bioacoustique
2.1 La classification en gรฉnรฉral
2.2 Formulation mathรฉmatique de notre problรฉmatique
2.3 Vue dโ€™ensemble gรฉnรฉrale des รฉtapes de la reconnaissance
2.4 La notion de classes de signaux
2.5 La reprรฉsentation des donnรฉes
2.6 Les descripteurs
2.7 Apprentissage et architecture des mรฉthodes de reconnaissance
2.8 La validation des mรฉthodes de reconnaissance
2.9 Conclusion
3 SINR-SRC
3.1 Mรฉthodologie
3.2 Rรฉsultats expรฉrimentaux
3.3 Auto-apprentissage incrรฉmental semi-supervisรฉe
3.4 Niveau de confiance
3.5 Conclusion
4 Une extension de SINR-SRC : le dรฉtecteur multiclasses
4.1 Mise en ล“uvre dโ€™un dรฉtecteur multiclasses
4.2 Rรฉsultats expรฉrimentaux
4.3 Conclusion et perspectives
Conclusion gรฉnรฉrale

Rapport PFE, mรฉmoire et thรจse PDFTรฉlรฉcharger le rapport complet

Tรฉlรฉcharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiรฉe. Les champs obligatoires sont indiquรฉs avec *