Modèles graphiques probabilistes pour la recommandation de solution pertinentes

Modèles graphiques probabilistes pour la recommandation de solution pertinentes

Réseaux bayésiens

Les réseaux bayésiens (RB) sont des modèles graphiques probabilistes introduit par Judea Pearl [21] en 1982 et constituent une technologie puissante en Intelligence Artificielle, et en apprentissage automatique. Ils s’appliquent sur un ensemble prédéfini de variables aléatoires, dont la relation entre elles est fixée à l’avance. Les RB constituent un langage graphique et une méthodologie, simples et corrects, pour exprimer pratiquement ce de quoi on est certain ou incertain, avec l’utilisation des probabilités jointes, pour décrire l’incertitude de faits, et à partir de ces probabilités jointes, on peut retrouver les probabilités conditionnelles souhaitées, ils reposent sur la formule de Bayes, reliant des probabilités conditionnelles avec des probabilités jointes. Au cours de la dernière décennie ils ont connu un grand succès dans une grande variété d’applications de recherche dans le monde réel et professionnel. Définissons plus formellement un réseau bayésien : Un réseau bayésien est un graphe orienté sans circuit avec un ensemble X de noeuds et un ensemble E d’arcs orientés. Un noeud contient, 1-le nom d’une variable, 2-une table de probabilités de cette variable en fonction des valeurs de ses parents

Exemple de structure de réseau bayésien dans un contexte de recommandation de films [5]. Les variables sont ici booléennes et expriment le goût d’une personne particulière pour un film ou un réalisateur. Chaque variable est associée à une distribution de probabilités définie sachant les valeurs de ses variables parentes dans le graphe de structure. Plusieurs distributions sont proposées à titre d’exemple sous la forme de tables de probabilités conditionnelles.

Exemple des réseaux bayésiens

Un exemple de structure de réseau bayésien en figure 2 (de la page 10). Cette structure représente le fonctionnement d’un système de recommandation de films. Le noeud « George Lucas » représente la variable aléatoire qui correspond à la chance que ce réalisateur soit aimé par une personne. La variable « Star Wars » a deux parents et deux enfants. Enfin les valeurs (Matrix = 0 et Star wars = 0.1 donne une probabilité 0.7 pour le poids de l’arc P(Matrix=0 | Starwars=0 et TheHobbit=1) = 0.7, chaque variable est associée à une distribution de probabilités définie, sachant les valeurs de variables parents, les distributions de cet exemples sont proposées sous la forme de tables de probabilités conditionnelles. Nous pouvons par exemple déduire de ce système la recommandation des films qui n’ont pas encore été vus, mais qui ont une grande probabilité d’être appréciés par cette personne.

Modèles relationnels probabilistes

Toute information est intéressante, l’exploitation et l’analyse d’information demande un traitement bien spécial qui dépend du domaine de l’utilisation et de l’individu. Pour cette raison la conception et la création d’un modèle générique permet un raisonnement spécial sur un ensemble de données. L’utilisation d’un modèle relationnel probabiliste permet de faire un traitement plus précis sur les données, ainsi qu’une forte adaptation du modèle sur plusieurs cas. Au cours de la dernière décennie, Les réseaux bayésiens ont été utilisés avec succès dans une grande variété d’applications de recherche dans le monde réel. Cependant, malgré leur succès, les réseaux bayésiens sont souvent inadéquats pour représenter des domaines grands et complexes. Comme définie précédemment un réseau bayésien pour un domaine donné implique un ensemble prédéfini de variables aléatoires, dont la relation à l’autre est fixée à l’avance.

Modèles relationnels probabilistes

Un réseau bayésien ne peut pas être utilisé pour traiter des domaines où nous pourrions rencontrer un nombre d’entités faisant varier dans une variété de configurations. Cette limitation de réseaux bayésiens est une conséquence directe du fait qu’ils manquent du concept « d’objet » (ou l’entité de domaine). D’où, ils ne peuvent pas représenter des principes généraux des objets semblables multiples qui peuvent alors être appliqués dans des contextes multiples. Les modèles relationnels probabilistes (MRP) [8], ou réseaux bayésiens relationnels sont une extension relationnelle des réseaux bayésiens. Une approche adaptée pour la représentation de l’incertain dans un contexte relationnel avec un ajout des notions de l’orienté objet, pour être plus précis c’est un réseau bayésien orienté objet avec un schéma de base de données en entrée. L’utilisation de plusieurs concept de l’orienté objet a permis au MRP de s’adapter au différents cas, un MRP spécifie un modèle pour une distribution de probabilité sur une base de données relationnelle.

Le modèle comprend un composant relationnel décrivant le schéma relationnel, et un composant probabiliste décrivant les dépendances probabilistes. Étant donné un ensemble d’objets, un MRP spécifie une distribution de probabilité sur un ensemble d’interprétations impliquant ces objets. Les deux composants de la syntaxe MRP sont : Le schéma relationnel : c’est une description logique du domaine, il décrit un ensemble de classes, X ={X1, …, Xn}. Chaque classe est associée à un ensemble d’attributs descriptifs. Le modèle graphique probabiliste : décrit les dépendances probabilistes dans le domaine. Dans la phase d’apprentissage, l’entrée contient un schéma relationnel qui spécifie le vocabulaire de base dans le domaine. C’est l’ensemble des classes, des attributs associés aux différentes classes, et les types possibles de relations entre les objets dans les différentes classes. Les données de formation se composent d’une instance entièrement spécifiée de ce schéma sous la forme d’une base de données relationnelle. Dans la phase d’analyse, une fois que le MRP apprend, il sert comme un outil pour l’analyse exploratoire des données et peut être utilisé pour faire des prédictions et des inférences complexes dans des situations différentes. [8] définissent les MRP par :

MRP et incertitude de référence

Les modèles relationnels probabilistes (MRP) représentent une connaissance impliquant les différents attributs d’un schéma de base de données. Ceci implique que toute instance doit connaître le nombre de tuples pour chaque relation, et que chaque contrainte d’intégrité référentielle pour tout tuple concerné est certaine. En d’autres termes, cela signifie que les références entre tuples sont connues. Inférer sur les instanciations de tels MRP est alors restreint aux valeurs des attributs descriptifs de ces tuples. La certitude de références entre tuples n’est pas toujours vérifiée.

À titre d’exemple, dans un contexte de recommandation, nous ne connaissons a priori pas toutes les associations susceptibles d’exister entre des utilisateurs et les produits en vente et la tâche de recommandation vise justement à inférer la valeur d’associations inconnues à partir des informations certaines sur les entités et associations du domaine. Dans ce type de contextes où nous souhaitons pouvoir inférer sur les références entre tuples, il nous faut avoir recours à des versions étendues des MRP [7].

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela rapport gratuit propose le téléchargement des modèles gratuits de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

I Contexte général
I.1 Introduction
I.2 Présentation du projet
II État de l’art
II.1 Introduction
II.2 Modèles graphiques probabilistes
II.2.1 Réseaux bayésiens
II.2.2 Exemple des réseaux bayésiens
II.3 Modèles relationnels probabilistes
II.3.1 Introduction
II.3.2 Langage relationnel
II.3.3 Schéma d’instanciation
II.3.4 Squelette relationnel
II.3.5 Modèles relationnels probabilistes
II.3.6 Exemple de MRP
II.3.7 Conclusion
II.4 MRP et incertitude de référence
II.4.1 Introduction
II.4.2 Entités et Associations
II.4.3 Incertitude de référence
II.4.4 Squelette objet
II.4.5 Fonctions de partition
II.4.6 MRP avec incertitude de référence
II.4.7 Le projet PILGRIM
II.5 Traitement de données textuelles
II.5.1 Lemmatisation
II.5.2 Stop words
II.5.3 Les n-grammes
II.5.4 Allocation de Dirichlet latente
II.6 Fouille d’opinion
II.6.1 Généralités
II.6.2 LDA pour la fouille d’opinion
II.6.3 Fouille d’opinion dans des textes courts
III Réalisation pratique
III.1 Schéma relationnel
III.2 Partitionnement
III.2.1 Principe général
III.2.2 Premiers exemples de résultats
III.2.3 Autres exemples de résultats
Annexes
I Guide d’installation
I.1 Programmes à installer (développeur)
I.2 Installation (développeur)
I.3 Programmes à installer (utilisateur)
II Guide d’utilisation
II.1 Utilisateur avancé
II.2 Utilisateur normal

Rapport PFE, mémoire et thèse PDFTélécharger le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *