Accents régionaux en français

Notre thèse est consacrée à l’étude de variétés régionales de français. Nous nous intéressons aux accents régionaux, autrement dit aux particularités phonétiques segmentales et prosodiques qui caractérisent la prononciation d’un locuteur en fonction de son origine géographique. Avant de poursuivre, nous devons définir ce que nous entendons par le terme accent. La variation dans la langue peut se manifester à plusieurs niveaux : réalisation acoustique, inventaire phonémique, lexique, prosodie. . . que nous n’allons pas tous prendre en compte ici. Un accent peut être défini comme the cumulative auditory effect of those features of pronunciation, which identify where a person is from regionally or socially [Crystal, 2003]. En adoptant cette acception du terme, nous avons exclu de nos études la variation lexicale et syntaxique pour nous focaliser sur la prononciation. Nous ferons également ici la distinction entre accents et dialectes, ces derniers correspondant à une variante orale d’une langue, avec des particularités phonétiques mais également lexicales ou syntaxiques. Nous ne traiterons donc par la suite ni des dialectes, ni de la variation diastratique (i.e. sociale). Nous nous concentrerons uniquement sur la variation régionale. La variation dans la parole peut poser problème aussi bien aux humains qu’aux machines. Les humains ont une bonne capacité d’adaptation et arrivent le plus souvent à se comprendre malgré tout. Les systèmes de reconnaissance de la parole peuvent rencontrer des difficultés pour traiter de la parole avec accent : dans le cas où l’accent est inconnu et ne figure pas dans les données d’apprentisage, les systèmes sont moins performants. Du point de vue du traitement automatique, nous manquons d’informations sur les accents du français. Si de nombreuses études linguistiques ont pour objet la description précise de telle ou telle variété par rapport à un standard, nous ignorons si ces caractéristiques peuvent être retrouvées automatiquement à partir du signal de parole. Si les performances du système de reconnaissance de la parole se dégradent en présence de parole avec accent, c’est d’abord la qualité (i.e. l’adéquation) des modèles acoustiques de mots qui peut porter à suspicion, dans la mesure où le vocabulaire et l’usage des mots devraient changer dans une moindre mesure. Ces changements dans la réalisation acoustique des mots gagneraient à être mieux connus. Au-delà de la motivation d’améliorer les modèles acoustiques pour rendre les systèmes de transcription plus performants face aux variations régionales et autres accents, notre objectif est aussi de rendre compte de l’utilisation combinée de grands corpus (bases d’observation des accents) et du traitement automatique pour accroître nos connaissances sur ces accents.

De grands corpus oraux comprenant des accents régionaux du français deviennent aujourd’hui disponibles : leurs données offrent une bonne base pour entreprendre l’étude des accents. Les outils de traitement automatique de la parole permettent de traiter des quantités de données plus importantes que les échantillons que peuvent examiner les experts linguistes, phonéticiens ou dialectologues. La langue française est parlée dans de nombreux pays à travers le monde. Notre étude porte sur le français d’Europe continentale, excluant ainsi des territoires comme le Québec, l’Afrique francophone ou encore les départements d’Outre-Mer. Nous étudierons des accents régionaux de France, de Belgique et de Suisse romande.

Les accents du français 

Notre étude porte sur un sous-ensemble de toutes les variétés du français. De ce fait certains accents, comme l’accent québécois par exemple, ne font pas partie de notre travail. Dans cette section, nous donnerons une brève description des caractéristiques linguistiques de quelques accents du français et nous développerons plus en détail les accents que nous avons étudiés. La variation peut se manifester à différents niveaux, mais ainsi que nous l’avons précisé en introduction, nous avons exclu de notre étude la variation lexicale. Les caractéristiques sur lesquelles nous nous sommes concentrée et que nous décrirons sont les niveaux acoustico-phonétique, phonémique et la prosodie.

Les accents dans leur ensemble

Plusieurs études ont été consacrées à la description des accents régionaux du français. Les zones géographiques considérées et leur découpage diffèrent selon les travaux que nous citons ci-dessous. C’est aussi le cas du matériel employé : questionnaires, enregistrements. . . Malgré leurs différences, toutes ces études essaient de donner une vue d’ensemble de la variation régionale de la langue française, fondée sur des enquêtes de terrain. Depuis le début du XXe siècle, à la suite des atlas linguistiques de [Gilliéron et Edmont, 1902 1910], la variation phonétique a suscité un grand intérêt. Les atlas linguistiques permettent de distinguer les aires dialectales (au sens large) grâce au tracé d’isoglosses, frontières qui séparent des zones différant les unes des autres d’une certaine manière, par exemple par la prononciation d’un mot donné. Une tentative de visualisation de l’Atlas Linguistique de la France (ALF), qui couvre plus de 600 localités, a été entreprise plus récemment [Goebl, 2002]. L’enquête de [Martinet, 1945] est fondée sur des Témoignages recueillis en 1941 dans un camp d’officiers prisonniers. L’auteur a distribué des questionnaires dans lesquels les sujets devaient répondre à des questions portant sur leurs antécédents linguistiques, les systèmes des voyelles orales et nasales, les consonnes. . . Quelques 409 sujets ont été regroupés en 11 régions : le Midi, le Sud-Est, l’Est, le Nord, la Normandie, la Bretagne, l’Ouest, le Centre, la Bourgogne, le Centre-Nord et la région parisienne. L’enquête de [Walter, 1982], qui prolonge la précédente, porte sur le français parlé en Europe : la France (y compris la Corse), la moitié de la Belgique, la Suisse romande et le Val d’Aoste (en Italie) sont compris dans l’étude. Les descriptions sont basées sur un corpus constitué d’enregistrements et de réponses à un questionnaire phonologique pour 111 locuteurs, regroupés en 35 variétés. Plus récemment, [Carton et al., 1983] ont accompagné leur ouvrage d’une cassette audio, permettant ainsi au lecteur d’écouter les accents du français dont il était question. Une version électronique de leurs travaux est actuellement disponible sur Internet à l’adresse accentsdefrance.free.fr. Les études que nous venons de décrire illustrent l’évolution de la méthodologie expérimentale au cours du temps, en lien avec les instruments technologiques disponibles. Les premiers travaux utilisaient les réponses à des questionnaires papier, il a ensuite été possible d’enregistrer des locuteurs afin de pouvoir étudier les échantillons de parole et, finalement, ces échantillons ont pu être largement diffusés grâce à Internet.

Quelques accents en particulier

Souvent, les travaux se focalisent sur l’étude d’un accent donné, que ce soit du point de vue linguistique, sociolinguistique ou autre. Dans cette section, nous allons décrire plus en détail les accents que nous étudierons par la suite.

Le français standard
Toutes les études que nous avons mentionnées dans la section précédente ont pour objet principal les variations diatopiques (i.e. régionales) de la langue française. Les variantes régionales sont opposées à un français non situé géographiquement, appelé français de référence, standardisé, neutre, d’Oïl [Carton et al., 1983]. Dans notre travail, nous y ferons référence sous le terme français standard. C’est le français véhiculé par les médias. Bien que sans référence géographique, il est souvent défini comme le français des Parisiens de milieux « bourgeois » ou intellectuels. Ce français serait aujourd’hui parlé dans la plus grande partie de la moitié nord de la France, de Rennes à Nancy [Armstrong et Boughton, 1997], à l’exception de certaines zones telles que la région Nord ou l’Alsace. Des travaux ont été consacrés à des variétés de français incluses dans cette aire géographique. Un dialecte de Vendée a fait l’objet d’une thèse [Léonard, 1991], mais de l’aveu même de l’auteur, la francisation s’opère à grande vitesse. L’accent du Havre ne serait quant à lui qu’un mythe linguistique : des auditeurs se montrent incapables de l’identifier perceptivement [Hauchecorne et Ball, 1997]. L’inventaire phonémique du français standard peut être décrit comme suit [Fougeron et Smith, 2000] : il comporte 12 voyelles orales /a A e E ø œ i o O u y @/, 4 voyelles nasales /˜A ˜E ˜œ ˜O/, 3 glides /4 w j/ et 17 consonnes /p b t d k g f v s z S Z m n ñ l K/. En pratique, l’opposition /a/∼/A/ tend à disparaître au profit de /a/, de même que /˜E/∼/ ˜œ/ au profit de /˜E/ [Léon, 1992]. Du point de vue prosodique, l’accent est généralement placé sur la syllabe finale.

Les accents du sud de la France
De même que pour le français standard, de nombreux termes font référence au français parlé dans le sud de la France : le français du Midi, le français méridional, le français du Sud ou encore le français d’Oc [Durand, 1995; Coquillon, 2005; Sobotta, 2006]. Les variétés méridionales de français ont été l’objet de plusieurs études. Le français de Nice, et plus particulièrement la réalisation des voyelles nasales selon les générations, a été étudié par [Thomas, 1991]. [Borrel, 1999] a, quant à lui, étudié leur réalisation à Toulouse. Les auteurs de ces deux études constatent un recul de la prononciation méridionale (voyelle dénasalisée suivi d’un appendice consonantique nasal) chez les jeunes locuteurs. [Taylor, 1996] a étudié les voyelles nasales à Aix en-Provence. Elle observe également un recul de la prononciation méridionale, qu’elle met en lien avec l’âge et le niveau d’étude des locuteurs. La thèse de [Sobotta, 2006] est en partie consacrée à l’étude de locuteurs aveyronnais. L’auteur déplore l’absence d’étude sur le français méridional dans son ensemble : il lui est de ce fait difficile de positionner les observations faites sur les Aveyronnais par rapport à l’ensemble des Méridionaux. Elle indique toutefois que les différences entre les divers français du Midi ne semblent pas être trop importantes. L’accent de Marseille a fait l’objet de plusieurs études. [Binisti et Gasquet-Cyrus, 2003] l’ont étudié à partir d’enregistrements et de questionnaires. Ils opposent un stéréotype national de l’accent marseillais à trois accents émergeant de leurs données : l’accent des « vrais Marseillais », l’accent de la « bourgeoisie marseillaise » et l’accent des « quartiers Nord ». Les particularités prosodiques de l’accent marseillais ont fait l’objet d’une thèse [Coquillon, 2005]. L’auteur a observé plus de variation de fréquence fondamentale ainsi qu’un contour mélodique particulier en « chapeau mou »  chez des locuteurs marseillais comparés à des locuteurs du français standard. Si elle mentionne également une différence entre Marseillais et Toulousains au niveau de l’analyse rythmique du schwa final, elle indique également que les particularités de l’accent marseillais sont, pour beaucoup, partagées avec d’autres parlers du sud de la France.

Toutes ces études mentionnent des traits caractéristiques de l’accent dont elles traitent. Nous présentons ci-dessous quelques-uns des traits qui sont partagés par les accents du sud et qui les distinguent du français standard :
– les voyelles nasales sont souvent partiellement, voire totalement dénasalisées et suivies d’un appendice consonantique nasal ;
– la réalisation de nombreux schwas (ou e muets) [Durand et al., 1987] ;
– la réduction des oppositions semi-ouvert/semi-fermé pour les voyelles moyennes, dont la distribution suivrait la loi de position [Durand, 1995] ;
– la simplification de groupes consonnantiques complexes ;
– une prosodie différente de celle du français standard (sans mesures précises).

Le français en Alsace
L’Alsace n’est traditionnellement pas incluse dans la grande moitié nord de la France où le français standard est parlé. Cette région a un passé linguistique complexe [Bister-Broosen, 2002] : la langue officielle y a successivement été le français et l’allemand. Il faut également prendre en compte le dialecte alsacien (dialecte germanique), lequel influence la prononciation de ses locuteurs : en 1998, un locuteur sur deux déclare encore le parler couramment [Bothorel-Witz, 2000]. [Vajta, 2002] a mené en Alsace une enquête linguistique dont le but était d’observer le recul des langues germaniques par rapport au français. Les mesures étaient entre autres effectuées sur des marqueurs tels que la diphtonguaison, ou encore l’accentuation initiale. La prosodie semble jouer un rôle important dans cet accent, mais les études sur le sujet manquent : nous n’avons pu trouver en la matière qu’une étude comparant les variétés du nord et de l’est (Lorraine) de la France d’un point de vue prosodique [Carton et al., 1991]. Parmi les traits caractérisant l’accent alsacien, nous pouvons citer :
– l’aspiration des consonnes plosives sourdes /p t k/ ;
– une opposition de voisement peu ou pas marquée pour certaines consonnes (par exemple /p/∼/b/) ;
– une prosodie différente de celle du français standard.

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

Introduction
1 État de l’art
1.1 Les accents du français
1.1.1 Les accents dans leur ensemble
1.1.2 Quelques accents en particulier
1.2 Caractérisation et identification d’accents
1.2.1 Approches perceptives
1.2.2 Approches automatiques
1.3 Conclusion
2 Corpus et alignement automatique
2.1 Le corpus PFC
2.1.1 Le projet PFC
2.1.2 Notre corpus
2.2 Le corpus CTS
2.3 Alignement automatique en phonèmes
2.3.1 Procédure d’alignement en phonèmes
2.3.2 Quelques mesures issues de l’alignement
2.4 Conclusion
3 Identification perceptive
3.1 Méthode
3.2 Premières expériences
3.2.1 Description des expériences
3.2.2 Résultats
3.2.3 Analyse des résultats par clustering et scaling
3.2.4 Bilan
3.3 Seconde expérience
3.3.1 Description de l’expérience
3.3.2 Résultats
3.3.3 Analyse des résultats par clustering et scaling
3.3.4 Bilan
3.4 Fusion des représentations graphiques
3.4.1 Mise en œuvre de la fusion
3.4.2 Résultats
3.5 Conclusion
4 Analyse des formants
4.1 Aspects méthodologiques
4.1.1 Corpus
4.1.2 Méthode d’extraction des formants
4.1.3 Résultats
4.1.4 Discussion
4.2 Mesures de formants sur deux corpus
4.2.1 Méthode
4.2.2 Analyse du corpus PFC
4.2.3 Analyse du corpus CTS
4.3 Conclusion
Conclusion

Lire le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *