RECONNAISSANCE DE LOCUTEUR PAR METHODE CEPSTRALE

ร‰mission, Propagation, Rรฉception du son

ย  ย Pour qu’un son soit รฉmis, une รฉnergie doit avant tout mettre en mouvement un corps pour produire une vibration. Ainsi, le muscle du larynx, la chute d’un objet sur le sol, ou la tension รฉlectrique dans un haut-parleur, provoqueront l’รฉnergie nรฉcessaire pour produire cette vibration. Ensuite, pour que ce son puisse se propager, il faut un milieu รฉlastique favorable ร  la transmission de la vibration. En crรฉant des surpressions ou des dรฉpressions, l’air permet la propagation de l’onde. Les matรฉriaux solides ont aussi cette capacitรฉ de transmettre le son. Dans le vide par contre, aucun son ne peut se propager, car il n’y a aucun de support. Enfin, pour รชtre perรงue, il doit y avoir un rรฉcepteur sensible. Chez l’homme, l’oreille possรจde une membrane (le tympan) capable de transmettre les informations de vibration en signaux nerveux jusqu’au cerveau, grรขce au nerf auditif. De mรชme, le microphone possรจde รฉgalement une membrane permettant de transformer les dรฉplacements de l’air en signaux รฉlectriques.

Le Timbre

ย  ย Le timbre est le paramรจtre qui permet de prรฉciser la ยซ couleur ยป du signal (son). Suivant le thรฉorรจme de Fourrier, un son complexe peut รชtre dรฉcomposรฉ en une somme de sinusoรฏdes de frรฉquence et dโ€Ÿamplitude donnรฉes.
– La frรฉquence la plus basse est appelรฉe ยซ FONDAMENTALE ยป,
– Les frรฉquences multiples ร  la fondamentale sont appelรฉes ยซHARMONIQUEยป. Plus le son a des harmoniques, plus on dit quโ€Ÿil est ยซricheยป. Lโ€Ÿanalyseur de spectre permet : de montrer le contenu spectral du son (signal) Certains sons nโ€Ÿont pas de spectre bien dรฉfini: les frรฉquences sont gรฉnรฉrรฉes alรฉatoirement.
– le bruit rose (Pink Noise) : contient toutes les harmoniques dont la somme donne un contenu spectral ยซplatยป
– le bruit blanc (White Noise) : contient toutes les harmoniques dont la somme donne un contenu croissant.

La parole

ย  ย La parole est un moyen de communication trรจs efficace et naturel de l’humain. La parole se distingue des autres sons par ses caractรฉristiques acoustiques qui ont leur origine dans les mรฉcanismes de production. La parole apparaรฎt physiquement comme une variation de la pression de l’air causรฉe et รฉmise par le systรจme articulatoire. Les sons de parole sont produits soit par des vibrations des cordes vocales (source de voisement), soit par une turbulence crรฉe par l’air sโ€Ÿรฉcoulant rapidement dans une constriction ou lors du relรขchement dโ€Ÿune occlusion du conduit vocal (sources de bruit). L’unitรฉ de parole de plus petite taille est un phonรจme (voyelle ou consonne). Le nombre de phonรจmes est toujours trรจs limitรฉ, normalement infรฉrieur ร  cinquante.

Empreinte vocale

ย  ย Une Empreinte vocale est un rรฉsumรฉ numรฉrique gรฉnรฉrรฉ ร  partir d’un signal audio. Cette empreinte permet d’identifier un รฉchantillon sonore, ou de localiser une sรฉquence sonore dans une base de donnรฉes audio. Le procรฉdรฉ d’empreinte vocale fut mis au point ร  partir d’expรฉrimentations rรฉalisรฉes par des scientifiques dรฉsirant convertir les sons linguistiques en enregistrements visuels destinรฉs ร  รชtre analysรฉs et mesurรฉs. Les sons vocaux sont convertis en impulsions รฉlectriques et enregistrรฉs sur une bande magnรฉtique, comme dans un enregistrement sonore ordinaire, mais les impulsions sont ensuite traitรฉes รฉlectroniquement par un balayage successif de l’enregistrement magnรฉtique original et converties en un enregistrement sous forme d’images sur un papier de spectrogramme sensibilisรฉ รฉlectriquement. Les images qui en rรฉsultent peuvent รชtre systรฉmatiquement classรฉes par durรฉe, frรฉquence et intensitรฉ et comparรฉes avec des images en provenance d’autres sources. L’empreinte vocale est quelquefois utilisรฉe par la police pour identifier des personnes profรฉrant des menaces tรฉlรฉphoniques ou ร  l’origine d’appels anonymes.

Reconnaissance de locuteurs par des profanes

ย  ย Une croyance ancienne, toujours dโ€Ÿactualitรฉ de nos jours, stipule que lโ€Ÿhumain peut รชtre fiable ร  identifier autrui en entendant sa voix. En effet, en se basant sur notre capacitรฉ ร  reconnaรฎtre des voix dโ€Ÿamis ou dโ€Ÿidentifier des voix dโ€Ÿacteurs ou de politiciens, le mythe dโ€Ÿune reconnaissance vocale auditive par des profanes exacte et prรฉcise est nรฉ. Selon le mรชme auteur, les humains surestiment leur performance dans le domaine de la reconnaissance de locuteurs. Un grand nombre de paramรจtres entre รฉgalement en jeu dans ce genre de reconnaissance : la qualitรฉ de la voix, la nature du discours, la durรฉe de lโ€Ÿรฉcoute, le temps รฉcoulรฉ entre lโ€Ÿรฉcoute de la voix du locuteur et la procรฉdure dโ€Ÿidentification, la diffรฉrence dโ€Ÿรขge, de genre et dโ€Ÿethnie entre le tรฉmoin auditif et le locuteur, le dรฉguisement de la voix, etc. De ce fait, de nombreux auteurs prรฉconisent de prendre avec prรฉcaution les rรฉsultats dโ€Ÿune identification de locuteur par des profanes.

Le rapport de stage ou le pfe est un document dโ€™analyse, de synthรจse et dโ€™รฉvaluation de votre apprentissage, cโ€™est pour cela chatpfe.com propose le tรฉlรฉchargement des modรจles complet de projet de fin dโ€™รฉtude, rapport de stage, mรฉmoire, pfe, thรจse, pour connaรฎtre la mรฉthodologie ร  avoir et savoir comment construire les parties dโ€™un projet de fin dโ€™รฉtude.

Table des matiรจres

Introduction
Chapitre I. Gรฉnรฉralitรฉs
I.1. Les Sons
a. ร‰mission, Propagation, Rรฉception du son
b. Caractรฉristiques du son [3]
I.2. La parole [4]
I.3. Empreinte vocale
I.4. Reconnaissance vocale [5]
Chapitre II. Analyse acoustique du signal de la parole
II.1. Traitement des signaux [6]
a. Echantillonnage des signaux
b. Reprรฉsentation des signaux pรฉriodiques sous la forme de sรฉries de Fourier
II.2. Analyse spectrale des signaux numรฉriques
a. Transformation de Fourier numรฉrique [7]
b. Transformation de Fourier discrรจte [8]
c. Transformรฉe de Fourier Rapide
II.3. Fenรชtrage [9]
II.4. Analyse Cepstrale
Chapitre III. Reconnaissance de locuteur
III.1. Historique
a. Reconnaissance de locuteurs par des profanes
b. Reconnaissance de locuteurs par des experts
c. Reconnaissance de locuteurs automatisรฉe
III.2. Principe et fonctionnement de la reconnaissance de locuteur [13]
a. Crรฉation de l’empreinte vocale
b. Dรฉtection des zones de silence
c. Calcul des coefficients MFCC
d. Conversion de lโ€Ÿรฉchelle en logarithme
e. La transformรฉe en cosinus discret (DCT)
III.3. Comparaison dynamique (Dynamic Time Warping (DTW))
III.4. Les variabilitรฉs du signal de parole
III.5. Application de la reconnaissance de locuteur
III.6. Problรจmes majeurs
Chapitre IV. Rรฉalisation
IV.1. Prรฉsentation du logiciel
a. Programmation
b. Fonctionnement
c. Organigramme
IV.2. Les interfaces de ยซ zazakely ยป
a. Fenรชtre de dรฉmarrage
b. Fenรชtre principale
c. Fenรชtre dico
IV.3. Manuel dโ€Ÿutilisation de ยซ zazakely ยป
a. Enregistrement
b. Reconnaissance dโ€Ÿun locuteur
IV.4. Les matรฉriels requis
Conclusion et Perspectives

Rapport PFE, mรฉmoire et thรจse PDFTรฉlรฉcharger le rapport complet

Tรฉlรฉcharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiรฉe. Les champs obligatoires sont indiquรฉs avec *