รmission, Propagation, Rรฉception du son
ย ย Pour qu’un son soit รฉmis, une รฉnergie doit avant tout mettre en mouvement un corps pour produire une vibration. Ainsi, le muscle du larynx, la chute d’un objet sur le sol, ou la tension รฉlectrique dans un haut-parleur, provoqueront l’รฉnergie nรฉcessaire pour produire cette vibration. Ensuite, pour que ce son puisse se propager, il faut un milieu รฉlastique favorable ร la transmission de la vibration. En crรฉant des surpressions ou des dรฉpressions, l’air permet la propagation de l’onde. Les matรฉriaux solides ont aussi cette capacitรฉ de transmettre le son. Dans le vide par contre, aucun son ne peut se propager, car il n’y a aucun de support. Enfin, pour รชtre perรงue, il doit y avoir un rรฉcepteur sensible. Chez l’homme, l’oreille possรจde une membrane (le tympan) capable de transmettre les informations de vibration en signaux nerveux jusqu’au cerveau, grรขce au nerf auditif. De mรชme, le microphone possรจde รฉgalement une membrane permettant de transformer les dรฉplacements de l’air en signaux รฉlectriques.
Le Timbre
ย ย Le timbre est le paramรจtre qui permet de prรฉciser la ยซ couleur ยป du signal (son). Suivant le thรฉorรจme de Fourrier, un son complexe peut รชtre dรฉcomposรฉ en une somme de sinusoรฏdes de frรฉquence et dโamplitude donnรฉes.
– La frรฉquence la plus basse est appelรฉe ยซ FONDAMENTALE ยป,
– Les frรฉquences multiples ร la fondamentale sont appelรฉes ยซHARMONIQUEยป. Plus le son a des harmoniques, plus on dit quโil est ยซricheยป. Lโanalyseur de spectre permet : de montrer le contenu spectral du son (signal) Certains sons nโont pas de spectre bien dรฉfini: les frรฉquences sont gรฉnรฉrรฉes alรฉatoirement.
– le bruit rose (Pink Noise) : contient toutes les harmoniques dont la somme donne un contenu spectral ยซplatยป
– le bruit blanc (White Noise) : contient toutes les harmoniques dont la somme donne un contenu croissant.
La parole
ย ย La parole est un moyen de communication trรจs efficace et naturel de l’humain. La parole se distingue des autres sons par ses caractรฉristiques acoustiques qui ont leur origine dans les mรฉcanismes de production. La parole apparaรฎt physiquement comme une variation de la pression de l’air causรฉe et รฉmise par le systรจme articulatoire. Les sons de parole sont produits soit par des vibrations des cordes vocales (source de voisement), soit par une turbulence crรฉe par l’air sโรฉcoulant rapidement dans une constriction ou lors du relรขchement dโune occlusion du conduit vocal (sources de bruit). L’unitรฉ de parole de plus petite taille est un phonรจme (voyelle ou consonne). Le nombre de phonรจmes est toujours trรจs limitรฉ, normalement infรฉrieur ร cinquante.
Empreinte vocale
ย ย Une Empreinte vocale est un rรฉsumรฉ numรฉrique gรฉnรฉrรฉ ร partir d’un signal audio. Cette empreinte permet d’identifier un รฉchantillon sonore, ou de localiser une sรฉquence sonore dans une base de donnรฉes audio. Le procรฉdรฉ d’empreinte vocale fut mis au point ร partir d’expรฉrimentations rรฉalisรฉes par des scientifiques dรฉsirant convertir les sons linguistiques en enregistrements visuels destinรฉs ร รชtre analysรฉs et mesurรฉs. Les sons vocaux sont convertis en impulsions รฉlectriques et enregistrรฉs sur une bande magnรฉtique, comme dans un enregistrement sonore ordinaire, mais les impulsions sont ensuite traitรฉes รฉlectroniquement par un balayage successif de l’enregistrement magnรฉtique original et converties en un enregistrement sous forme d’images sur un papier de spectrogramme sensibilisรฉ รฉlectriquement. Les images qui en rรฉsultent peuvent รชtre systรฉmatiquement classรฉes par durรฉe, frรฉquence et intensitรฉ et comparรฉes avec des images en provenance d’autres sources. L’empreinte vocale est quelquefois utilisรฉe par la police pour identifier des personnes profรฉrant des menaces tรฉlรฉphoniques ou ร l’origine d’appels anonymes.
Reconnaissance de locuteurs par des profanes
ย ย Une croyance ancienne, toujours dโactualitรฉ de nos jours, stipule que lโhumain peut รชtre fiable ร identifier autrui en entendant sa voix. En effet, en se basant sur notre capacitรฉ ร reconnaรฎtre des voix dโamis ou dโidentifier des voix dโacteurs ou de politiciens, le mythe dโune reconnaissance vocale auditive par des profanes exacte et prรฉcise est nรฉ. Selon le mรชme auteur, les humains surestiment leur performance dans le domaine de la reconnaissance de locuteurs. Un grand nombre de paramรจtres entre รฉgalement en jeu dans ce genre de reconnaissance : la qualitรฉ de la voix, la nature du discours, la durรฉe de lโรฉcoute, le temps รฉcoulรฉ entre lโรฉcoute de la voix du locuteur et la procรฉdure dโidentification, la diffรฉrence dโรขge, de genre et dโethnie entre le tรฉmoin auditif et le locuteur, le dรฉguisement de la voix, etc. De ce fait, de nombreux auteurs prรฉconisent de prendre avec prรฉcaution les rรฉsultats dโune identification de locuteur par des profanes.
|
Table des matiรจres
Introduction
Chapitre I. Gรฉnรฉralitรฉs
I.1. Les Sons
a. รmission, Propagation, Rรฉception du son
b. Caractรฉristiques du son [3]
I.2. La parole [4]
I.3. Empreinte vocale
I.4. Reconnaissance vocale [5]
Chapitre II. Analyse acoustique du signal de la parole
II.1. Traitement des signaux [6]
a. Echantillonnage des signaux
b. Reprรฉsentation des signaux pรฉriodiques sous la forme de sรฉries de Fourier
II.2. Analyse spectrale des signaux numรฉriques
a. Transformation de Fourier numรฉrique [7]
b. Transformation de Fourier discrรจte [8]
c. Transformรฉe de Fourier Rapide
II.3. Fenรชtrage [9]
II.4. Analyse Cepstrale
Chapitre III. Reconnaissance de locuteur
III.1. Historique
a. Reconnaissance de locuteurs par des profanes
b. Reconnaissance de locuteurs par des experts
c. Reconnaissance de locuteurs automatisรฉe
III.2. Principe et fonctionnement de la reconnaissance de locuteur [13]
a. Crรฉation de l’empreinte vocale
b. Dรฉtection des zones de silence
c. Calcul des coefficients MFCC
d. Conversion de lโรฉchelle en logarithme
e. La transformรฉe en cosinus discret (DCT)
III.3. Comparaison dynamique (Dynamic Time Warping (DTW))
III.4. Les variabilitรฉs du signal de parole
III.5. Application de la reconnaissance de locuteur
III.6. Problรจmes majeurs
Chapitre IV. Rรฉalisation
IV.1. Prรฉsentation du logiciel
a. Programmation
b. Fonctionnement
c. Organigramme
IV.2. Les interfaces de ยซ zazakely ยป
a. Fenรชtre de dรฉmarrage
b. Fenรชtre principale
c. Fenรชtre dico
IV.3. Manuel dโutilisation de ยซ zazakely ยป
a. Enregistrement
b. Reconnaissance dโun locuteur
IV.4. Les matรฉriels requis
Conclusion et Perspectives
Tรฉlรฉcharger le rapport complet