Depuis toujours, la parole a été pour l’humanité le moyen de communication le plus utilisé. Grâce à son utilisation fréquente, elle peut être un moyen pour reconnaitre un individu. Pour réaliser, la reconnaissance se fait par l’enregistrement de la parole via un microphone, puis, traitement du signal de cette parole par les microordinateurs qui vont donner le résultat adéquate.
GENERALITE SUR LA BIOMETRIE VOCALE
Voix
Définition
La voix est l’ensemble des sons caractérisés par deux fonctions mécaniques de base : la phonation qui consiste à la production d’un phénomène acoustique et l’articulation qui consiste à la modulation de ce dernier.
Parole
Caractéristiques
La parole est un moyen de communication naturel de l’humain avec une efficacité très importante. Elle se distingue des autres sons par ses caractéristiques acoustiques qui ont leur origine dans les mécanismes de production. Elle apparait physiquement comme une vibration de pression de l’air causée par le système articulatoire. Les sons de la parole sont produits soit par des vibrations des cordes vocales (c’est la source de voisement), soit par une turbulence créée par l’air s’écoulant rapidement dans une constriction ou lors du relâchement d’une occlusion du conduit vocal (c’est la source de bruit).
Production de la parole
Essentiellement, il y a trois étapes pour le processus de la phonation :
– Premièrement, il faut avoir une énergie respiratoire suffisante pour mettre en mouvement les cordes vocales et générer des bruits.
– Les cordes vocales vibrant, provoquent la naissance des sons voisés.
– Enfin, une gestuelle articulatoire au niveau du conduit vocal et fosses nasales se réalise.
Signal de la parole
Le signal vocal est caractérisé par:
– Sa fréquence
– Son intensité (ou le niveau sonore)
– Son timbre (ou « la richesse » du signal) .
Prosodie
La prosodie est la façon de décrire ou de présenter formellement les éléments de l’expression orale à savoir les tons, les accents, l’intonation et la qualité. Ces éléments transmettent des informations sur la signification d’un énoncé. En d’autres termes, elle désigne les phonèmes liés à l’évolution dans le temps des paramètres de hauteur, d’intensité et de durée. La perception de hauteur est essentiellement liée à la fréquence fondamentale qui correspond au niveau physiologique de la production et à la fréquence de vibration des cordes vocales.
La perception d’intensité est essentiellement liée à l’amplitude et à l’énergie du son, mais partiellement dépend aussi avec sa durée. La perception de durée correspond à son temps d’émission et sa durée acoustique. A noter que le terme «durée » est utilisé pour désigner à la fois le paramètre perceptif et le paramètre acoustique et le terme « longueur » comme synonyme de durée perçue est utile quand la distinction est importante [4].
• Mélodie
Elle est constituée par la variation dans le temps de la fréquence fondamentale, ou de la hauteur si l’on se place du point de vue perceptif. L’enchainement des durées relatives (y compris les durées des silences) constitue le rythme. Avec le modèle d’intonation, il existe quatre niveaux d’intonation : basse, moyenne, haute et aiguë. Cette modélisation met en jeu les trois modalités suivantes : l’interrogation, l’exclamation et l’affirmation. Les substitutions entre les intonations dans une phrase de même contenu, entrainent des changements de sens. Cela montre notamment que l’intonation joue un rôle très important pour la compréhension du message vocale.
• Ton
Le mot ton désigne le ou les niveaux de hauteurs observées dans une syllabe donnée. Le ton coïncide donc avec la partie de la courbe mélodique qui se rattache à une seule syllabe. L’intonation d’un énoncé se présente comme une succession de ton. Et on distingue quatre niveaux de hauteur : haut, bas, infra-bas et suraigu.
• Accent
L’accent se situe par la manifestation d’intensité, de hauteur et/ou de durée, portant sur une syllabe.
L’équation suivante résume ce qui précède :
Prosodie = F0 + énergie + durée (grandeur acoustique)
= hauteur + intensité +longueur (grandeur perçues)
=mélodie + rythme (structures) + accentuation
Notion de la biométrie
Identité
L’identité est une notion complexe, difficile à définir. Du point de vue personnel, la caractérisation de l’identité prend en compte tout ce que l’individu considère comme faisant partie intégrante de lui et qui ne peut lui être enlevé. Du point de vue externe, l’identité d’un individu est la façon dont il perçu par le monde qui l’entoure. Pour identifier une personne, trois approches sont possibles:
− Utiliser un identifiant : ce que l’on possède (carte, badge, document).
− Utiliser une connaissance : ce que l’on sait (mot de passe).
− Utiliser une biométrie : ce que l’on est.
Biométrie
a. Définitions
C’est la science qui étudie, à l’aide des mathématiques (statistiques, probabilités), les variations biologiques à l’intérieur d’un groupe déterminé. Autrement dit, c’est une méthode permet d’identifier ou de vérifier l’identité (authentification) d’une personne sur la base de données reconnaissable et vérifiable qui lui est propre.
b. Authentification biométrique
La biométrie permet l’authentification d’individus à partir de leurs caractéristiques physiologiques ou comportementales qui doivent être :
– universelles : présentes chez tous les individus.
– uniques : spécifiques à chaque individu.
– permanentes : pour permettre une authentification au cours du temps.
– mesurables : pour permettre l’enregistrement et les comparaisons futures.
|
Table des matières
INTRODUCTION
Chapitre I : GENERALITE SUR LA BIOMETRIE VOCALE
1.1 Voix
1.2 Parole
1.2.1 Caractéristiques
1.2.2 Production de la parole
1.2.3 Signal de la parole
a. Fréquence
b. Intensité
c. Timbre
1.3 Phonème
1.4 Prosodie
1.5 Notion de la biométrie
1.5.1 Identité
1.5.2 Biométrie
a. Définitions
b. Authentification biométrique
c. Différents types de biométrie
1.6 Reconnaissance vocale ou la biométrie vocale
Chapitre II: NUMERISATION D’UN SIGNAL
2.1 Introduction
2.2 Echantillonnage
2.2.1 Echantillonnage idéal
2.2.2 Echantillonnage réel
2.2.3 Echantillonnage blocage
2.3 Quantification
2.3.1 Définitions
2.3.2 Quantification uniforme
2.3.3 Quantification non linéaire
2.4 Codage
2.4.1 Code binaire naturel ou DCBN
2.4.2 Code Gray
2.4.3 Code DCB
Chapitre III : RECONNAISSANCE DU LOCUTEUR / IDENTIFICATION DU LOCUTEUR
3.1 La reconnaissance du locuteur
3.1.1 Généralité
3.1.2 Conditions nécessaires
3.1.3 Principe de base
3.1.4 Les modes de reconnaissance du locuteur
a. Le mode dépendant du texte
b. Le mode indépendant du texte
3.2 L’identification du locuteur
3.3 Procédure d’identification
3.3.1 La phase de paramétrisation
a. Transformée de Fourier discrète
b. FFT
c. MFCC
3.3.2 La phase de modélisation
3.3.3 La phase de décision
Chapitre IV : REALISATION
4.1 Introduction
4.2 Description du logiciel « RecSpeaker »
4.2.1 Programmation
4.2.2 Présentations des interfaces
a. Interface principale
b. La fonction des boutons
Conclusion
Annexe