Notion de norme linguistique
Norme(s) linguistique(s)
Choisir une norme linguistique revient à choisir un ensemble de règles à suivre. Le contenu de ces règles diffèrent selon l’entité en charge de leur établissement et selon l’idée de ce que doit être la langue française. Par exemple, des plaidoyers comme Tirons la langue : plaidoyer contre le sexisme dans la langue française de (Borde 2018) ou Pour une langue sans sexisme de (Labrosse 2021) voient la langue française comme une langue sexiste avec des règles grammaticales telles que le genre masculin qui l’emporte sur le genre féminin au pluriel. Ils remettent en question la norme linguistique actuelle résultante d’une vision patriarcale de la société puisqu’établie par des grammairiens masculins. Cet exemple montre que le choix d’une norme linguistique équivaut à se positionner sur des questions socio politiques. Illustrant différentes prises de position, plusieurs types de normes existent dans la littérature. Cette section détaille des typologies de normes, avant de présenter notre propre définition de la norme linguistique.
Types de norme linguistique De nombreux travaux étudient la norme linguistique, pour n’en citer qu’une infime partie : (Rey 1972 ; Prikhodkine 2011 ; Pöll et Schafroth 2010 ; Moreau 1999 ; Maurais 2008 ; Marcellesi 1976 ; Manessy 1994 ; Lafontaine 1986 ; etc.) Parmi eux, nous retenons trois études : celle de (Gadet 2007), celle de (Paveau et Rosier 2008) et celle de (Ledegen 2021). Nous les avons choisies car ces trois études proposent des typologies partageant des types communs de normes. Dans la première typologie, (Gadet 2007) oppose deux types de norme linguistique : la norme objective et la norme subjective. La norme objective renvoie à une contrainte issue d’un organisme officiel qui édicte les règles à suivre pour un bon usage de la langue. La norme subjective renvoie à une contrainte collective issue des jugements de valeurs sur les pratiques linguistiques d’une communauté de locuteurs. Elle a pour effet de renforcer la cohésion sociale de cette communauté. La principale limite de cette proposition est la mise en opposition des deux normes. Isolées, elles ne peuvent pas conduire à une langue moderne et commune. La norme objective risque d’être toujours en retard par rapport aux usages réels de la langue, car longue à être établie. Prenons, par exemple, l’édition actuelle du dictionnaire de l’Académie française publiée en 2011. 11 années ont été nécessaires pour mettre à jour la 8e édition de 1935. La norme subjective, quant à elle, risque d’établir des règles linguistiques trop spécifiques à une communauté entravant la compréhension entre locuteurs de communautés différentes. Il faudrait associer ces deux normes pour assurer un ensemble de règles communes à l’ensemble des locuteurs et adaptables aux nouveaux usages.
Dans (Ledegen 2021) l’auteur reprend ces types de normes en les intégrant dans une typologie plus nuancée qui en distingue cinq au total. Elle montre graduellement comment la norme peut être un outil de description ou de prescription :
1. La norme objective, qui désigne les habitudes linguistiques partagées au sein d’une communauté.
2. La norme descriptive, qui explicite les normes objectives définies ci-dessus.
3. La norme prescriptive, qui donne un ensemble de normes objectives comme le modèle à suivre.
4. La norme subjective, qui concerne les attitudes et représentations linguistiques, et attachent aux formes des valeurs esthétiques, affectives, ou morales : élégant vs. vulgaire, chaleureux vs. prétentieux. . .
5. La norme fantasmée, qui est « un ensemble abstrait et inaccessible de prescriptions et d’interdits que personne ne saurait incarner et pour lequel tout le monde est en défaut » (Baggioni et Moreau 1997 dans Ledegen 2021).
La limite de cette typologie est qu’elle n’envisage pas la norme descriptive comme imposant des règles à suivre. Or, les locuteurs d’une même communauté suivent ces règles implicites pour pouvoir être compris. La norme descriptive a donc une action prescriptive au même titre que la norme prescriptive. Dans la dernière typologie, (Paveau et Rosier 2008) décrit des types de postures . Trois types de postures sont distingués :
1. La posture normative, qui est fondée sur le respect du bon usage tel qu’il est défini et conservé dans les grammaires et les dictionnaires, et tel qu’il s’exprime au sein de conseils et prescriptions pour parler une belle et bonne langue.
2. La posture puriste, qui se caractérise par une forte prégnance de valeurs esthétiques, politiques, pseudo-linguistiques et métaphoriques.
3. La posture scientifique, qui est revendiquée par la linguistique depuis Saussure, pour laquelle la norme légitime est celle, interne, des règles du système de la langue.
Trois types de normes se retrouvent dans toutes ces typologies : la norme prescriptive qui édicte des règles grammaticales de bon usage à suivre ; la norme subjective qui édicte des règles empreintes de valeurs idéologiques et esthétiques sur ce que devrait être la langue ; la norme objective qui dégage des règles à partir de l’usage de la langue. Partant de ce constat, nous avons travaillé sur une définition de la norme afin d’évaluer les variations linguistiques. Nous ne voulions pas baser la perception de la variation sur la notion de faute grammaticale, car cette dernière est insuffisante pour l’analyse des registres. Si le repère pour évaluer les variations linguistiques était la norme grammaticale, alors comment différencier les registres courant et soutenu la suivant tous les deux ? Une forme correcte grammaticalement mais inadaptée à la situation de communication peut elle être perçue comme du registre soutenu ? Imaginons l’utilisation de la formulation « Je vous prie d’agréer, Messieurs, l’expression de mes sentiments respectueux » pour saluer une foule après un discours politique. La formulation ne sera pas perçue comme complètement soutenue bien qu’elle respecte la norme grammaticale. En effet, son utilisation ne suit pas la norme d’usage qui la réserve aux échanges écrits. Le non respect de l’usage crée une impression d’erreur limitant la reconnaissance du registre soutenu. Cet exemple met en avant le besoin d’une norme d’usage complémentaire à la norme grammaticale pour l’analyse des registres de langue.
Notre définition de la norme Dans le cadre de notre travail, les enjeux politiques, voire idéologiques, sous-jacents à l’établissement d’un modèle linguistique ne sont pas pris en compte, car hors de nos objectifs. C’est pourquoi nous n’avons pas considéré la norme subjective. En revanche, nous pensons que la norme prescriptive est nécessaire pour assurer la compréhension entre locuteurs. Nous pensons également que la norme objective est importante pour permettre aux règles linguistiques de s’adapter aux nouveaux usages. Notre définition de la norme découle donc à la fois de la norme objective en se basant sur l’usage, et de la norme prescriptive en se basant sur la grammaire.
Différents usages émergent des règles linguistiques qui ne sont pas forcément formalisées et rédigées dans un document officiel tel qu’un dictionnaire, une convention ou bien une grammaire. À l’inverse, la norme grammaticale contient des règles entérinées et décrites par une institution à caractère officiel comme l’académie française. Suivant cette définition de la norme linguistique, nous décidons de considérer un texte comme pouvant appartenir à trois registres distincts définis comme suit :
• familier : lorsque la norme grammaticale et la norme d’usage ne sont pas suivies ;
• courant : lorsqu’il se conforme partiellement à la norme grammaticale et d’usage ;
• soutenu : lorsqu’il se conforme complètement à la norme grammaticale et d’usage.
Variété linguistique de référence
Cette section montre comment certains travaux ont abordé la question de la norme linguistique à travers celle de la variété linguistique de référence. Ce que nous appelons la « variété linguistique de référence » renvoie au français choisi comme français modèle à suivre :
Selon une définition de R.-L. Wagner, une attitude normative « implique que l’on ait discerné des niveaux entre plusieurs manières de s’exprimer, hiérarchisé ces niveaux et conféré à l’un d’eux la dignité de modèle » (Wagner et Quemada 1969 dans Authier et Meunier 1972).
Tout comme dans la section précédente, le choix d’un modèle est accompagné de questions socio-politiques. Par exemple, les travaux de (Valdman 1982) remettent en question le choix d’un « français standard » renvoyant à une classe sociale bourgeoise et parisienne :
« Il devient de plus en plus malaisé de répondre à la question : quel français enseigner ? En effet, la reconnaissance de la primauté du français standard (FS), défini comme « le parler soutenu de la bourgeoisie cultivée de la région parisienne », ne fait plus l’unanimité, tant à l’intérieur qu’hors de l’hexagone. » (Valdman 1982) .
Illustrant la difficulté de tomber sur un consensus sur ce que devrait être le modèle à suivre, de nombreuses appellations différentes co-existent. Parmi elles, citons le « français standard » (Valdman 1982 ; Beaufort, Roekhaut et Fairon 2008 ; Charaudeau et Maingueneau 2002 ; Guerin 2008 ; Durand et Lyche 1999 ; Rebourcet 2008) ; ou bien le « français courant » (Bonnard 1981 ; Hellermann 1969 ; Glasco 2011 ; Rigat et Piccardo 2008), ou encore le « registre neutre » (Mercier, Verreault et Lavoie 2002 ; BERTOCCHINI et Costanzo 2010 ; Juan et Zhihong 2018). Ce principe de neutralité est repris par (Gadet 2007, p. 20) qui décrit le « français standard » comme une variété se voulant neutre : « il prétend à la neutralité devant les genres discursifs ». Toutes ces terminologies renvoient à une sorte de français dit standard/courant/neutre/de base à partir duquel sont évaluées les variations linguistiques :
« Le français « de base », est un seuil entre ce qui est formel et ce qui ne l’est pas. Il est associé à l’usage correct : une langue épurée de tout énoncé erroné. En somme, il correspond à une entité linguistique qui peut être aussi bien écrite qu’orale. Le bon français, c’est le français correct. » (Rebourcet 2008) .
|
Table des matières
1 Introduction
1.1 Contexte d’étude
1.2 Problématique et objectifs de la thèse
1.3 Organisation du manuscrit
2 La variation linguistique
2.1 Notion de norme linguistique
2.1.1 Norme(s) linguistique(s)
2.1.2 Variété linguistique de référence
2.2 Entre sociolinguistique et linguistique
2.2.1 En sociolinguistique
2.2.2 En linguistique
2.3 Partitionnement de l’espace linguistique
2.3.1 Représentation de l’espace linguistique : entre modalités orale et écrite
2.3.2 Partitionnement de l’espace linguistique
2.4 Conclusion
3 Constitution de corpus
3.1 Contexte et motivations
3.2 Notre modèle d’apprentissage automatique
3.2.1 Approche générale du modèle
3.2.2 Enjeux et problématiques des étapes du modèle
3.3 Travaux préliminaires : corpus TREMoLo-Web
3.3.1 Corpus et sous-corpus
3.3.2 Description du processus d’apprentissage semi-supervisé
3.3.3 Validation de la technique d’apprentissage semi-supervisée
3.3.4 Exploration linguistique du corpus TREMoLo-Web
3.4 Corpus de référence pour les registres de langue français : TREMoLo-Tweets
3.4.1 Constitution du corpus TREMoLo-Tweets
3.4.2 Annotation manuelle de la graine
3.4.3 Étiquetage automatique du corpus TREMoLo-Tweets
3.4.4 Exploration linguistique du corpus TREMoLo-Tweets
3.5 Conclusion
4 La fouille de motifs comme outil automatique
4.1 Fouille de motifs ensemblistes
4.1.1 Cadre théorique
4.1.2 Algorithmes de fouille de motifs ensemblistes
4.1.3 Synthèse
4.2 Fouille de motifs séquentiels
4.2.1 Cadre théorique
4.2.2 Algorithme de fouille de motifs séquentiels
4.2.3 Synthèse
4.3 Application des techniques de fouille de motifs séquentiels à des données textuelles
4.3.1 Fouille de motifs séquentiels dans des données biomédicales
4.3.2 Fouille de motifs séquentiels à partir de textes
4.3.3 Synthèse
4.4 Conclusion
5 Conclusion