Structuration des informations intrinsèques

Télécharger le fichier pdf d’un mémoire de fin d’études

La non-lexicalisation de notre modèle

Pour notre part, nous postulons que ce n’est pas toujours l’unité lexicale considérée dans sa globalité, en tant que partie du discours, qui contient les informations sur ses relations avec le reste de l’énoncé. En eﬀet, les études menées par exemple sur ce qui est appelé la “non-compositionnalité” de nombreuses constructions linguistiques que l’on ne saurait réduire aux seuls phénomènes de figement 16 (p.ex. [Kay & Fillmore, 1999], [Kracht, 2005a], etc.) montrent bien qu’il est parfois nécessaire de pouvoir prendre en considération uniquement une partie de l’ensemble d’informations constituant une unité afin de l’intégrer à la construction d’une structure plus grande. Par exemple, on fera usage de l’ensemble des informations contenues dans l’unité lexicale terre pour l’intégrer en tant que constituant de syntagme dans (5a), alors qu’on devra en éliminer une certaine partie dans l’analyse de (5b) qui est une expression semi-figée dans laquelle le morphème ne conserve pas la totalité de son contenu sémantique ainsi que sa capacité à recevoir des compléments ; enfin, dans (5c) où l’unité est employée dans une expression figée (un “mot complexe non construit” selon l’expression de [Corbin, 1987]), terre perd complètement son statut de morphème et donc toute une partie de son statut.
Pourtant, dans les trois cas une partie (variable et plus ou moins large) de l’unité reste stable, ce qui justifie selon nous de pouvoir séparer ces informations-ci de ce qui concerne l’emploi de l’unité en tant que constituant de structure plus grande.
C’est là l’une des raisons pour lesquelles on tient à ne pas présumer de l’utilisation d’un objet au sein même de sa description. Conséquence de cela, on cherche à eﬀectuer une distinction 20 claire entre le système lexical et le système grammatical, sans avoir à passer par des règles qui ont pour charge de modifier le contenu de base des unités lexicales (i.e., de changer la “grammaire” contenue dans le “lexique”) 21. Selon ce postulat les informations grammaticales (concernant les relations entre objets d’un énoncé) peuvent être exprimées de manière régulière en fonction d’un ensemble d’informations dont la constitution est variable à volonté, pouvant contenir des caractéristiques provenant de domaines diﬀérents (morphologie, syntaxe, séman-tique, prosodie, pragmatique). Cela signifie que ces ensembles manipulés dans la grammaire ne correspondent pas forcément toujours à des unités lexicales, mais peuvent pointer des objets plus larges ou plus fins, en fonction des descriptions eﬀectuées.
La frontière que nous posons ici a pour conséquence que de nombreuses informations de sous-catégorisation que l’on trouve habituellement mentionnées dans le lexique, font dans notre modèle l’objet de constructions grammaticales. Nous faisons par exemple une diﬀérence de traitement entre valence et transitivité. Nous représentons la valence dans les unités lexicales parce qu’il s’agit d’une information de sémantique lexicale, stable pour chacune de ces entrées, mais nous représentons la transitivité dans la grammaire parce qu’elle dépend des occurrences produites (Cf. chapitre 7 pour une discussion à ce propos).

Une grammaire non-présomptive

D’un point de vue plus général, cette position concernant la “lexicalisation” des grammaires est en réalité l’une des manifestations d’un choix selon lequel on refuse de faire figurer dans une construction donnée des informations portant sur la structure (de quelque domaine que ce soit) dans laquelle elle est susceptible d’entrer. Concernant le lexique, cela signifie qu’on ne fait pas figurer d’informations syntaxiques dans les unités lexicales (ce sont les constructions syntaxiques qui pourront contenir des restrictions plus ou moins fines et pouvant mentionner des informations lexicales), mais ceci ne s’applique pas uniquement à la relation entre “lexique” et “grammaire”.

La non-modularité de notre modèle

De ce qui précède nous retenons une distinction entre ce que l’on appelle “modèles modulaires” et qui font une distinction de notation entre les domaines, en faisant des systèmes autonomes, et ce que l’on appelle les “modèles non-modulaires” qui, même s’ils peuvent séparer les infor-mations des diﬀérents domaines, les représentent toutefois en une même entité si bien qu’il est possible d’envisager des interactions de toutes sortes, y compris de bas niveau, entre les domaines, de même que d’envisager une représentation avec partage d’information entre do-maines. Dans le premier groupe on fait figurer LFG, TAG et la TST ; dans le second, HPSG, DS et GM. Nous nous plaçons pour notre part aux côté des seconds.
Plus précisément, en reprenant ces interprétations possibles de la modularité, on peut dire que notre modèle adopte une représentation modulaire de ses objets à la manière de HPSG, mais les rassemble au sein d’une grammaire non-modulaire (§3.2.1), qui eﬀectue des analyses non-modulaires (cf. §3.2.2).

Grammaire non-modulaire

Dans notre conception, une grammaire est un ensemble d’associations d’informations indiquant les interactions entre diﬀérents objets. L’idée est de rassembler plusieurs sources d’information sitôt qu’elles ont une conséquence remarquable sur (la construction de) l’interprétation, quelles que soient leur nature et leur importance. Cette conception est celle des Grammaires de Construction (sur ce point, cf. p.ex. [Kay & Fillmore, 1999]), qui a été intégrée à notre propre cadre de travail ([Blache, 2004a]).
Représentation homogène. — Contrairement aux approches qui font usage de la linking theory, en GP la totalité des informations que nous représentons l’est sous une unique forme, stable et homogène : quel que soit leur domaine d’appartenance, nous utilisons une unique formalisation, ce qui permet à ces informations d’être mises en relation dès leur expression dans la grammaire, et sans recours à l’expression d’un mode d’interfaçage spécifique. Cela signifie également que nous n’introduisons pas de hiérarchie entre les diﬀérents domaines d’information, à la diﬀérence des approches telles que la TST. En outre, cela permet également de ne pas avoir à préciser le domaine d’appartenance d’une information, et donc de pouvoir préciser tout aussi directement des relations existant entre des éléments de domaines diﬀérents (la simultanéité d’un geste et un son dans une analyse multimodale p.ex.).
Toutefois, permettre une interaction de bas niveau entre les diﬀérents domaines opérant au sein même des descriptions grammaticales, ne signifie pas que toutes ces informations sont confondues en un seul et même système (au sens de [Saussure, 1916]). En eﬀet, mêler les diﬀérents domaines en une unique ressource requiert avant tout d’être à même de poser une diﬀérence claire entre chacun d’eux, afin d’en cerner les besoins propres, les mécanismes spé-cifiques et les caractéristiques remarquables 33. Aussi nous concentrons-nous ici uniquement sur les caractéristiques strictement syntaxiques des phénomènes étudiés, parce que notre par-ticipation à l’élaboration de cette grammaire se situe précisément à ce niveau. Par ailleurs ce sera une occasion de montrer que même pour eﬀectuer une analyse syntaxique (i.e., pour obtenir une structure syntaxique en guise de résultat d’analyse), l’ensemble des informations syntaxiques, toutes fines qu’elles puissent être, ne sont bien souvent pas suﬃsantes.
Ce n’est donc pas la même conception de la non-modularité que celles des théories fonction-nelles (comme p.ex. [Givón, 1984], la Cognitive Grammar de [Langacker, 1987], la Systemic Functional Grammar de [Halliday, 1985], la Functional Grammar de [Dik, 1989], etc.), qui certes associent à chaque objet linguistique un couple forme-sens tout comme c’est le cas ici, mais ne représentent pas explicitement les informations linguistiques constituant les objets ; ils préfèrent à cela représenter une sorte de synthèse fonctionnelle de ces informations.

Représentation

Comme on l’a vu en fig. 16 l’expression des conditions prend la même forme de tableau que celle des informations de forme et d’identité du type de propriété. Chacune d’elles prendra la forme suivante :
– La disponibilité prend la forme d’une liste dont chaque item correspond à la mention de la disponibilité de l’un des termes du type de propriété, représenté par l’index lui correspon-dant. Par exemple dans une propriété d’Exigence dont la disponibilité requiert la présence du premier terme (mais pas de celle du second), on indique 1 = disponible. Pour une pro-priété d’Accord dont la disponibilité requiert la présence des deux termes de la propriété, on indique 1 = disponible ∧ 2 = disponible.
– La satisfaction prend la forme d’une liste dont chaque item correspond soit à la disponibi-lité de l’un des termes indexés précédemment (p.ex. dans le cas d’une propriété d’Exigence, la condition de satisfaction prendra la forme 2 = disponible puisque pour qu’une telle pro-priété soit satisfaite il faut que le second terme soit présent), soit à la comparaison de parties des termes précédemment indexés (p.ex. pour une propriété de Précédence la condition de satisfaction pourra prendre la forme 1 .index|debut < 2 .index|debut ce qui signifie que pour qu’une telle propriété soit satisfaite il faut que la valeur de l’index de début de l’objet représenté par le terme indexé 1 soit inférieure à la valeur de l’index de début de l’objet représenté par le terme indexé 2 ).
– La capacité, enfin, reçoit une valeur numérique comprise entre 1 et ∞ 54.

Introduction des constructions caractérisées

Tous les objets ainsi caractérisés ne correspondent pas nécessairement à autant de construc-tions eﬀectivement introduites en tant que résultat possible. En eﬀet l’étape d’introduction des nouvelles constructions qui suit l’étape de caractérisation, consiste à sélectionner parmi CG ,e ,n les caractérisations que l’on estime suﬃsamment pertinentes pour être considérées comme une analyse possible.
La notion de “pertinence” à cette étape dépend du type d’analyse que l’on souhaite eﬀectuer : si l’on ne veut proposer que des résultats parfaitement conformes à la grammaire on n’introduira que les constructions dont CGs−,e,n est vide, i.e. qui n’ont pas de propriétés violées. Si en revanche on veut rendre l’analyse plus souple on peut convenir d’introduire les constructions dont C s −,, G e n n’est pas vide mais contient moins d’un nombre donné de propriétés, ou alors ne contient pas de propriétés de tel(s) type(s) (constituance, précédence,…), ou encore dont C s + représente G ,e ,n plus de x% de CGs ,e ,n , ou de convenir de tout autre moyen de sélection des constructions à introduire en fonction de leurs caractérisations respectives.
Cette possibilité oﬀerte de tenir compte d’informations précises aussi bien concernant la qua-lité d’une construction (son degré de grammaticalité, cf. notamment [Blache et al., 2006] à ce propos) en référence à une grammaire (proportion de propriétés satisfaites parmi les proprié-tés évaluées) que la quantité d’informations disponibles la concernant (nombre de propriétés évaluées parmi les propriétés existantes, densité d’information existant pour une construction donnée, cf. à ce propos [Blache, 2004b]), permettent de proposer plusieurs types de résultat en fonction des objectifs propres à un besoin particulier, et c’est l’une des spécificités de GP que de permettre un tel choix. Au terme de ce second mouvement, on obtient un nouvel ensemble d’objets, constitué des constructions que l’on vient d’introduire et des objets n’étant pas des constituants de ces nouvelles constructions le cas échéant, ensemble qui fera l’objet du niveau d’analyse suivant, jusqu’à ce que les objets ne puissent plus être mis en relation les uns avec les autres.
Contenu des constructions introduites. — Pendant une analyse, les constructions in-troduites représentent des instanciations des définitions de la grammaire en fonction d’une production linguistique à analyser, et correspondent à un ensemble de propriétés (leur carac-térisation) qui est un sous-ensemble de celui ayant servi à la définition de la construction : toutes les propriétés figurant dans la grammaire pour une telle construction n’ont pas néces-sairement été évaluées, et certaines ont pu être instanciées plusieurs fois pour représenter un même type de contrainte s’exerçant sur plusieurs objets ou couples d’objets diﬀérents.
De plus, chaque propriété figurant dans la caractérisation d’une construction contient une information supplémentaire par rapport aux propriétés de la grammaire : le fait qu’elle soit satisfaite ou non. Finalement, une instance de construction introduite à la suite de l’évaluation du système de contraintes ressemblera à la figure 21 : Dans les informations extrinsèques on ne mentionne que les propriétés évaluées, en précisant pour chacune si elle est satisfaite ou non.

Propriétés de constituance : Majeur et Mineur

Les propriétés de constituance rassemblent les types de relations qui s’établissent non pas entre les divers constituants d’une construction, mais entre cette construction et ses constituants. C’est la raison pour laquelle ce sont ici typiquement des relations unaires, c’est-à-dire que l’on n’y mentionne que les constituants intéressés et non la construction (puisque ce sont des propriétés qui feront partie de ses informations extrinsèques donc y seront associées par définition).
Les deux propriétés Majeur (§2.1.1) et Mineur (§2.1.2) remplacent respectivement celles d’Obligation et Facultativité employées dans les anciennes grammaires GP, que l’on évoque au §2.1.3.

Majeur

Définition. — On appelle Majeure la relation établie entre une construction et l’un de ses constituants qui joue un rôle spécifique et notable dans le choix de la nature (cf. §1.3.1) de la construction.
Typiquement et pour les relations, syntaxiques, qui nous intéressent, cette propriété permet de pointer deux constituants entretenant une relation majeure avec la construction : sa tête d’une part (au sens défini au §1.4.1), qui influe directement sur le type de la construction (une construction à tête nominale aura tendance à être de type nominal, une construction à tête verbale aura tendance à être de type verbal, etc.), et son spécifieur d’autre part, qui influe directement sur la catégorie de la construction (une construction spécifiée par un déterminant sera un syntagme nominal, une construction spécifiée par une préposition sera un syntagme prépositionnel, etc.).
Nous posons dans notre grammaire que pour une construction donnée il ne peut y avoir qu’une seule tête et un seul spécifieur, sans que la présence de ceux-ci ne soit obligatoire pour autant (c’est-à-dire qu’il peut exister des constructions sans spécifieur et/ou sans tête, mais pas de construction à plusieurs têtes et/ou à plusieurs spécifieurs).

Remarques sur les propriétés d’Obligation et de Facultativité

Après une première version de grammaire GP où la constituance était constituée d’un unique type de propriété du même nom (p.ex. [Bès & Blache, 1999]), celle-ci a rapidement été scindée en deux types, Obligation et Facultativité, dont les définitions respectives étaient “liste des têtes possibles” et “liste des constituants non-tête” ([Blache, 2001]). Or ces deux propriétés nous ont posé deux problèmes dans le développement de notre grammaire : d’une part, comme nous l’avons dit pour le type Majeur, nous ne considérons pas que ce que les auteurs appelaient Obligation ne renfermait que les têtes possibles, d’autre par les notions même d’obligation et de facultativité, relativement aux principes de GP, nous ont semblé inappropriées.
Obligation vs. Majeur. — Comme on vient de le dire, la propriété d’Obligation telle que définie dans les multiples publications de Philippe Blache est définie comme étant la “liste des têtes possibles”. Notons avant toute chose que l’utilisation de “tête” par l’auteur n’ayant pas été précisément définie, on en déduit qu’il s’agit de la définition classique de la tête (et non pas, notamment, de celle dont on a parlé plus haut). Pourtant, l’auteur indique bien que selon l’utilisation de cette propriété, il ne peut y avoir qu’une seule tête par construction, ce qui pose d’emblée un problème par rapport aux autres théories utilisant cette notion puisque nombre d’entre elles postulent que certaines constructions syntaxiques peuvent porter plusieurs têtes (typiquement la coordination dans un certain nombre d’analyses) : on ne sait pas clairement comment l’auteur se justifie de cette diﬀérence de taille et comment il la met en pratique.
Ce que l’on ignore également, c’est pourquoi est-ce que l’auteur choisit de diﬀérencier ce type précis de constituant alors qu’il ne distingue pas les autres : on a dit dans notre définition du type Majeur que l’on justifie la distinction entre celui-ci et le type Mineur du fait que les premiers ont une incidence notable sur la nature de la construction dont ils sont constituants, au contraire des seconds. On ne sait pas, pour Philippe Blache, pourquoi est-ce que les spéci-fieurs sont rassemblés au sein du même type de propriété que tous les autres constituants qui n’ont véritablement pas le même statut dans la construction.
Les notions d’obligation et de facultativité. — Du fait que l’on souhaite rassembler de préférence pour notre part les têtes et spécifieurs possibles des constructions d’un côté, et le reste des constituants possibles de l’autre, rien de nous empêcherait (ni formellement, ni théoriquement) d’utiliser simplement l’Obligation et la Facultativité en ce sens précis pour notre grammaire, si ce n’est les notions mêmes véhiculées par les noms choisis à ces deux types de propriétés.
En eﬀet, l’une des caractéristiques de GP est que les types de propriétés ne sont pas hiérarchisés a priori dans le formalisme. Il est envisageable de leur associer une importance relative dans le cadre d’une théorie particulière, mais ceci dépend de la grammaire et non du formalisme, dans lequel aucune propriété n’est censée prévaloir sur les autres, ni être indispensable à l’introduction d’une construction en dehors des choix à ce propos qui relèvent de la théorie. Or, en utilisant les termes d’“obligation” et de “facultativité”, on en vient à contredire cela en aﬃrmant que les objets mentionnés dans la première propriété sont indispensables, alors que ceux mentionnés dans la seconde (ainsi que dans les autres types, nécessairement) ne le sont.
De plus, même si l’on souhaite ajouter à la spécification une notion d’importance des types de propriétés relativement les uns aux autres (en leur aﬀectant un poids par exemple), cette information devra alors être exprimée pour tous les types, et non simplement pour les pro-priétés de constituance, et ne s’exprimera sans doute pas sous une forme binaire (obligation vs. facultativité), mais à l’aide d’une échelle où l’on pourra p.ex. indiquer que la Linéarité est plus importante que l’Accord, mais qu’elle est moins importante que l’Obligation (ce qui fait l’objet de [Blache et al., 2006]).
Pour ces raisons, nous avons finalement décidé de ne pas faire usage des types Obligation et Facultativité définis dans les premières versions de GP et d’introduire ceux de Majeur et Mineur, dont la définition linguistique (et formelle) est certes proche, mais nous l’espérons plus en phase avec d’une part notre théorie, d’autre part les caractéristiques du formalisme.

Propriétés de cooccurrence : Exigence, Exclusion et Unicité

Les types de propriétés suivants rassemblent les réclamations et restrictions de cooccurrence entre constituants d’une construction. Il s’agit des trois propriétés définies dans [Blache, 2001] p.ex. : Exigence (§2.2.1), Exclusion (§2.2.2) et Unicité (§2.2.3).

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

I Pour une théorie descriptive et formelle de la langue
1 Positionnement théorique
1 Une approche non-générative
2 Une grammaire non-présomptive
3 Un traitement non-modulaire
4 Une analyse multi-dimensionnelle
2 Architecture du formalisme
1 Grammaire
2 Spécification des propriétés
3 Analyse
3 Notre modèle de grammaire
1 Structuration des informations intrinsèques
2 Propriétés et spécification
4 D’autres modèles en GP
1 Une grammaire d’unification modulaire en GP
2 Un modèle catégoriel procédural en GP
3 Une Métagrammaire en GP
II Éléments de grammaire du français
Introduction
1 Objectifs
2 Notations simplifiées
3 Organisation de la partie
5 Constructions de base
1 Hiérarchie générale des constructions
2 Constructions de Base
6 Constructions nominales
1 Noms construits (N)
2 Syntagmes Nominaux (SN)
7 Constructions verbales 157
1 Verbes construits (V)
2 Syntagmes Verbaux (SV)
8 Constructions propositionnelles
1 Propositions
9 Constructions de subordination
1 Subordonnants (Sub)
2 Conjoints de subordination (Conj-s)
10 Constructions adjectivales
1 Adjectifs construits (Adj)
11 Entassements paradigmatiques
1 Entassement Paradigmatique (EP)
2 Coordination (EP-c)
3 Disfluence (EP-c)
4 Précisions des descriptions
Conclusion
III Exemples d’analyses
Introduction
1 Structure produite
2 Analyse vs. Parsing
12 Un énoncé simple
1 Début de l’analyse : Informations disponibles
2 Premier niveau d’analyse
3 Deuxième niveau
4 Troisième niveau
13 Constructions verbales
1 Différentes constructions verbales
2 Sujet plein vs. sujet clitique
3 Clitiques non-nominatifs
14 Coordinations
1 Coordination de catégories différentes
2 Coordination elliptique
Conclusion
Conclusion générale
1 Retour sur le développement
2 Retour sur les objectifs
Perspectives
3 Perspectives théoriques
4 Perspectives grammaticales
5 Perspectives formelles
6 Perspectives informatiques
Annexes
A La campagne d’évaluation des analyseurs syntaxiques EASY
1 Les ressources utilisées
2 Les parseurs
3 La grammaire
4 Interprétation des résultats
Bibliographie