Les modèles cognitifs de raisonnement par analogie
Le raisonnement par analogie est une faculté cognitive essentielle. Il est au cœur de nombreux processus cognitifs, qu’il s’agisse par exemple de résoudre un problème à l’aide de problèmes déjà résolus, plaider dans un procès à l’aide d’éléments provenant de cas similaires, imiter quelqu’un, reconnaître le lien entre une photo et la situation réelle qu’elle représente, etc. L’étude de ce type de raisonnement est justifiée et supportée par un large ensemble de résultats empiriques, mettant en évidence les caractéristiques de cette faculté de l’être humain (Gentner et al., 2001).
Analogie et appariements Un tel type de raisonnement fait habituellement appel à un appariement des éléments d’un domaine source avec ceux d’un domaine cible, domaines a priori différents. Analogy will be described as a mapping between elements of a source domain and a target domain. Hall (1989, p. 40)
En général, les connaissances disponibles au niveau du domaine source sont plus nombreuses que celles relatives au domaine cible. Un des objectifs du raisonnement par analogie est alors d’exploiter un appariement adéquat effectué entre les éléments des domaines source et cible, de manière à transférer un certain nombre de connaissances du premier vers le deuxième. Par exemple, Falkenhainer et al. (1989) examine le cas de l’analogie entre deux configurations, l’une étant le siège d’un flux de liquide (le domaine source) et l’autre d’un flux thermique (le domaine cible). Pour effectuer l’analogie entre les deux domaines, un certain nombre de connaissances sont supposées accessibles.
Le premier domaine est alors représenté par plusieurs objets, tels qu’un vase et une petite fiole remplis d’eau et un tube fin reliant ces deux contenants . Nous disposons également de certaines propriétés concernant ces objets (la pression exercée sur l’eau dans les deux contenants), et de relations (la pression sur l’eau dans le vase est supérieure à celle contenue dans le fiole, cette différence de pression est la cause d’un flux de liquide du vase vers la fiole). Les informations concernant le second domaine sont du même ordre, mais, par hypothèse, moins complètes. Les éléments le caractérisant sont une tasse contenant du café, un glaçon et une tige d’argent reliant le glaçon au café. Nous savons également que la température du café est supérieure à celle du glaçon. Dans cette situation, raisonner par analogie consiste à apparier la pression, l’eau du vase, l’eau de la fiole avec respectivement la température, le café et le glaçon, conduisant à l’inférence de l’existence d’un flux thermique du café vers le glaçon.
Les apprentis paresseux en apprentissage automatique
L’Apprentissage Automatique (Machine Learning en anglais) désigne un ensemble de procédés inductifs dont l’objectif est d’« apprendre » à partir de données. Un scénario d’apprentissage courant consiste à chercher à prédire une information non connue sur un objet représenté par un certain nombre de caractéristiques appelées attributs. Il peut s’agir, par exemple, d’évaluer le risque d’attaque cardiaque d’un patient dont on connaît quelques données cliniques (taille, poids, antécédents médicaux, etc.). Dans ce cas, les données cliniques représentent les attributs du patient, et le risque d’attaque correspond à l’information à prédire. De manière à effectuer cette prédiction, les méthodes d’apprentissage automatique exploitent les données de patients dont le risque d’attaque cardiaque est déjà connu.
Citons également les tâches de détection automatique du caractère non-sollicité d’un courrier électronique (i.e. le classer en pourriel ou non-pourriel) et de reconnaissance automatique de chiffres manuscrits (i.e. associer à une image le chiffre qu’elle représente) .tâche d’apprentissage automatique (supervisé) se formalise de la façon suivante. Étant donnée une base d’apprentissage, constituée d’objets représentés par un ensemble d’attributs et dont la valeur de l’information à prédire est connue, il s’agit de construire un apprenti en mesure de prédire l’information manquante d’un objet non encore rencontré (i.e. absent de la base d’apprentissage).
Apprentissage paresseux et raisonnement par analogie
Les méthodes d’apprentissage paresseux n’effectuent pas de généralisation des données disponibles. Pour analyser un nouvel objet, aucune généralisation n’est opérée, et le seul recours consiste à trouver un objet suffisamment « analogue » parmi les objets déjà analysés, et de l’utiliser pour effectuer l’analyse. En utilisant le vocabulaire introduit , l’objet analogue trouvé tient lieu de source et l’objet à analyser de cible. Ces méthodes reposent donc en partie sur les mêmes principes que le raisonnement par analogie étudié dans le contexte des sciences cognitives, à savoir la recherche et l’identification d’un appariement entre deux situations. Ces observations justifient la considération selon laquelle un apprentissage paresseux est un apprentissage par analogie. En revanche, les notions d’appariement et d’analogue dans le cas de l’apprentissage paresseux prennent un sens beaucoup plus restreint. Dans ce contexte, l’acception de l’analogie se confond avec celle de similarité. Une instance « analogue » est avant tout une instance proche. Ainsi, au questionnement formulé par Hall : Analogy presents a basic and challenging epistemological question: when are two representational descriptions, for some purpose alike? Hall (1989, p. 39) .les méthodes d’apprentissage paresseux répondent simplement : « quand elles sont proches ». Il suffit alors de munir l’espace d’entrée d’une mesure de similarité, et un appariement entre deux instances s’effectue si leur similarité dépasse un certain seuil ; l’étape de transfert se résume à une simple recopie (f(b) = f(a)) ,Par conséquent, bien que les mécanismes généraux du raisonnement par analogie soient respectés, l’analogie est ici réduite au calcul d’une simple similarité et à un transfert par recopie ; nous parlerons d’apprentissage par similarité, version «dégénérée» de l’apprentissage par analogie. Les proportions impliquées dans l’étape de transfert n’exploitent aucune propriété structurelle des données. Or, comme nous l’avons remarqué avec Gentner, l’analogie repose avant tout sur une conservation de relations et de structures et ne peut se résumer à un calcul de similarité. Toutefois, cette simplification se justifie au regard de la nature des données usuellement manipulées par les apprentis paresseux. Ceux-ci n’ont pas pour vocation première la modélisation de capacités cognitives, mais doivent régulièrement fournir une réponse à des problèmes divers et variés tels que la classification automatique de textes, la détermination de la fonction d’une protéine, la classification d’images satellitaires, etc. Un aperçu de cette variété est par exemple observable à partir de l’UCI Machine Learning Repository (Hettich et al., 1998).
Apprentissage du langage par analogie
Nous avons étudié, dans les sections précédentes, la notion d’apprentissage par analogie, dont l’apprentissage par similarité est une version dégénérée. Cet apprentissage repose sur une inférence s’effectuant directement à l’aide d’« objets » mémorisés, exemples, cas, situations, etc., et s’oppose en ce sens aux modèles formulant une abstraction de connaissances. Cette inférence implique un appariement entre l’objet à analyser et les objets mémorisés, donnant lieu à un transfert fondé sur des proportions et des équations analogiques.
Dans un contexte linguistique, parler d’analogie est périlleux. En effet, une confusion sémantique entoure cette notion dont l’acception dépend des contextes et des locuteurs.
Par exemple, pour les grammairiens grecs et latins, l’analogie (qui signifie analogon=proportion) est synonyme de régularité et s’oppose à l’anomalie. Du processus d’apprentissage par analogie, seule la notion de proportion analogique est retenue. Puisqu’ils considèrent que ces proportions sont modélisables à l’aide de règles, l’analogie est dite «régulière». Ici, les règles agissent localement, c’est-à-dire relativement aux termes impliqués dans une proportion particulière.
À l’inverse, d’autres n’en conservent que son utilisation d’exemples, même si celle-ci conduit à une abstraction. Dans ce cadre, l’analogie peut être définie par la négative : elle regroupe tout ce qui ne relève pas de l’approche à base de règles ; en particulier, utiliser un réseau de neurones et une base d’exemples est une approche analogique. C’est la définition utilisée dans l’opposition fréquente entre analogie et modèles à base de règles, notamment dans certaines études en psycholinguistique. Dans ce contexte, certaines des questions posées sont : est-ce que la connaissance linguistique est mémorisée sous forme de règles, sous forme d’exemples, y a-t-il des règles d’une part et des exceptions d’autre part, etc. ? Notons que les règles sont ici globales ; elles modélisent une connaissance générale sur un domaine.
Entreprendre une discussion sur les tenants et les aboutissants du débat autour de l’« analogie et ses acceptions en linguistique » dépasse clairement le cadre de notre travail. Dans la suite, nous fournissons simplement quelques exemples permettant d’éclairer succinctement deux ingrédients de l’apprentissage par analogie dans ce contexte, à savoir la notion de proportion analogique en linguistique, et l’apprentissage automatique de données linguistiques à partir d’exemples .
|
Table des matières
CHAPITRE 1 Introduction
1.1 Contexte
1.2 Contributions
1.3 Organisation du document
CHAPITRE 2 Apprendre « par analogie »
2.1 Les modèles cognitifs de raisonnement par analogie
2.1.1 Introduction
2.1.2 Les approches symboliques
2.1.3 Les approches sub-symboliques
2.1.4 Les modèles hybrides
2.2 Les apprentis paresseux en apprentissage automatique
2.2.1 Introduction
2.2.2 Généralisation vs. paresse
2.2.3 Apprentissage paresseux et raisonnement par analogie
2.3 Apprentissage du langage par analogie
2.3.1 Introduction
2.3.2 Linguistique et proportions analogiques
2.3.3 TAL et apprentissage à partir d’exemples
2.4 Conclusion
CHAPITRE 3 Exploitation de proportions analogiques pour l’AALN
3.1 Apprentissage automatique de changement de niveau de représentation
3.1.1 Introduction
3.1.2 Quelques réponses
3.2 Un apprenti paresseux à base de proportions analogiques
3.2.1 Introduction
3.2.2 Des voisins aux proportions
3.2.3 APPA
3.3 Extension analogique et biais d’apprentissage
3.3.1 Introduction
3.3.2 Extension analogique
3.3.3 Biais d’apprentissage
3.4 Proportions analogiques et paradigmes
3.4.1 Introduction
3.4.2 Paradigmes morphologiques
3.4.3 Paradigmes syntaxiques
3.4.4 Paradigmes sémantiques
3.5 Conclusion
CHAPITRE 4 Modèles formels de proportions analogiques
4.1 Proportions analogiques entre mots : un point de départ
4.1.1 Introduction
4.1.2 Définition et propriétés
4.1.3 Méthodes de calcul
4.1.4 Pondérations
4.2 Une caractérisation algébrique des proportions analogiques
4.2.1 Introduction
4.2.2 Semigroupes, magmas et dérivés
4.2.3 Représentations structurées d’objets linguistiques
4.2.4 Proportions en « cascade »
4.2.5 Le cas des arbres
4.3 Conclusion
CHAPITRE 5 Validations expérimentales
5.1 Méthodologie générale
5.1.1 Évaluation des performances d’un système d’apprentissage
5.1.2 Stratégies de filtrage et de pondération
5.1.3 Recherche efficace de triplets
5.2 Prononciation
5.2.1 Présentation de la tâche
5.2.2 Données
5.2.3 Formalisation et pré-traitements
5.2.4 Résultats
5.3 Analyse flexionnelle
5.3.1 Présentation de la tâche
5.3.2 Données
5.3.3 Formalisation et pré-traitements
5.3.4 Résultats
5.4 Analyse dérivationnelle
5.4.1 Présentation de la tâche
5.4.2 Données
5.4.3 Formalisation et pré-traitements
5.4.4 Résultats
5.5 Conclusion
CHAPITRE 6 Conclusion et perspectives
Télécharger le rapport complet