Interrogation flexible des résumés linguistiques

Interrogation flexible des résumés linguistiques

Résumé Linguistique

Les volumes de données stockés par les systèmes informatiques deviennent importants à cause de l’archivage de données numériques et de l’avancement technologique .Pour cela, la recherche des informations pertinentes, pour un besoin spécifique, devient difficile. Il faut trouver une technique de résumé qui puisse couvrir toutes les données, minimiser le volume des résumés et de les présenter sous une forme simple et intelligible. Dans l’état de l’art, ils existent de nombreuses techniques de réduction de volume de données qui prennent en compte le traitement informatique. Parmi ces techniques, nous citons un modèle de résumé linguistique qui est très répondu dans la littérature où nous détaillons ses principes dans ce chapitre. Ce type de modèle de résumé est une méthode de construction d’un résumé de données structurées. Il est basé sur le concept de théorie de l’ensemble floue. Mais avant de parler sur ces différentes méthodes de résumé linguistique, nous citons dans la section 1.2, section 1.3, un état de l’art sur les techniques de condensation de l’information et nous montrons la différence entre la compression de données et la réduction sémantique de données.

Interrogation flexible des résumés linguistiques

Avec la démocratisation d’informatisation des données et leur utilisation comme un outil de communication, une somme de sources d’informations importantes est stockée sous une forme de la base de données. Face à cette multitude des données informatiques, il est important de développé un système de recherche efficace. Le but de ces systèmes de recherche est d’aider l’utilisateur de trouver l’information désirée parmi une masse de données disponibles. Dans ces systèmes de recherche, l’utilisateur doit formuler son besoin de l’information sous la forme d’une requête où le rôle de ce système est d’identifier les enregistrements qui répondent à ces besoins. Ces systèmes fournissent une liste à l’utilisateur qui est triée en fonction de leur pertinence estimée (satisfaction). L’efficacité de ces systèmes est jugée par une meilleure adéquation entre la machine et l’humain. Si la représentation et la description des informations satisfont le besoins de l’utilisateur donc c’est un système d’interrogation flexible. Le principe de Systèmes d’interrogation est de réduire à la fois l’espace de recherche et le nombre de sources interrogées (réduisant les temps de recherche), pour des réponses moins nombreuses et mieux ciblées (réduisant la surcharge d’informations). Dans ce chapitre, nous allons tout d’abord rapidement présenter les systèmes d’interrogations de base de données traditionnels. Nous aborderons ensuite sur les ensembles flous, et leur application aux bases de données, notamment dans la gestion des requêtes plus flexibles. Nous essayons d’exploiter un état de l’art de différents algorithmes de recherche proposé pour chaque type de résumé linguistique et de montrer l’intérêt de ces résumés de données dans le contexte de système d’interrogation flexible.

Système d’interrogation des résumés linguistiques

Un résumé linguistique a pour un but de condenser les informations sémantiquement ; son principe est d’utiliser la notion de la logique floue. En général, la logique floue nous offre un résumé intelligent où le résumé est associé par des degrés d’appartenances et des degrés de satisfactions. Donc, un résumé linguistique est interprétable en langage naturel parce qu’il utilise, pour la présentation, les variable linguistique de la logique flou. Cette présentation est proche du langage naturel, ainsi que la recherche d’une information à l’aide d’une requête. Les résumés de données sont utilisés pour améliorer l’efficacité du processus d’interrogation. L’exploitation de ces résumés, nous permet de tirer plus de connaissance que l’interprétation des résumés. Elle doit notamment offrir à l’utilisateur la possibilité de préciser les critères de regroupement qui semblent intéressants pour un traitement particulier. Le système d’interrogation d’un résumé linguistique est considéré comme un moyens de répondre au problème de projection par ce que l’utilisation de résumes accélère l’accès aux données et conduit à des réponses plus compactes, et vagues. Ces systèmes permettent de répondre à des requêtes telle que : « Comment les individus sont x » Où X est une projection de la relation R sur un ensemble ordonné d’attributs défini dans la requête (X ⊆ R). Une telle requête spécifie les individus ou les objets qui prennent en compte l’indication des caractéristiques x portant sur les attributs X.

Donc, répondre à une telle requête, consiste à faire du prétraitement dans les résumés afin de trouver des résultats. L’interrogation n’a plus pour but de décrire les données mais elle est considérée comme un test d’existence. Elle peut savoir si des données présentant des caractéristiques spécifiées existent ou non. L’interrogation des résumés fournit une réponse à tous les types de requêtes.[51]. Dans les différentes méthodes de résumé linguistique, il est possible d’utiliser la requête flou dans d’un système d’interrogation flexible. Mais chaque méthode de résumé linguistique à son propre traitement de recherche de l’information qui convient à la demande d’utilisateur. Nous citons par la suite un état de l’art sur les différents algorithmes du processus d’interrogation pour chaque méthode de résumé linguistique.

Approche proposée d’un système d’interrogation médical flexible

Les résumés linguistiques de la base de données fournissent un moyen de réduire considérablement le volume d’entrées. Sachant que l’avantage de tous type des résumés linguistiques est de réduire le temps de réponse, donc, Il est important de trouver un processus de recherche rapide et précis sur nos résumés linguistiques RLR-CardF. Pour un mécanisme d’interrogation efficace, Il faut que la connaissance pertinente puisse être facilement récupérée à partir d’un ensemble de résumés linguistiques. En plus, la réponse demandée doit être précise avec le taux de perte faible. Par conséquent, il faut créer un système d’interrogation flexible qui répond parfaitement aux besoins de l’utilisateur. Pour cela, nous avons besoin d’identifier le quantificateur flou d’une requête demandée. Dans les quantificateurs flous introduits par Zadeh, nous trouvons deux type de quantificateurs : absolus (environ 3, au moins 2) ou relatifs (la majorité, environ la moitié). Les résumés linguistiques, à base de cardinalité floue, de la base de données ‘’Pima Indiana Diabète’’ contiennent des informations quantitatives et des informations qualitatives qui sont interprétables en langage naturel. En général dans tous types de résumé linguistique, la requête demandée est écrite avec des expressions (proposé par Yager) de langage naturel sous la forme (). Les expressions quantifiées simples sont définies par : «  » ‘Qy areP’Qy areP

Conclusion général

Les travaux présentés dans cette thèse ont abordé le problème de l’extraction et la déduction des connaissances à partir d’une grande masse de données médicales, nous avons traité en particulier le problème de la taille volumineuse de données médicales. Nous avons utilisé les informations des résumés linguistiques, à base de calcul de cardinalité floue, afin de construire un classifieur explicite et performant. Nos principaux objectifs, ont été d’apporter des contributions sur construction d’un résumé linguistique sur les bases de données médicales, la création d’un système d’interrogation médical flexible et de réaliser un classifieur supervisé basé sur ces résumés linguistiques. Le modèle que nous avons proposé, pour atteindre ces objectifs, a été testé sur des bases de données réelles, issues de plusieurs bases de données médicales existantes dans la littérature. Dans la première partie, Nous avons proposé d’améliorer la méthode de résumé linguistique à base de calcul de cardinalité floue, proposé par Pard et Dubois, pour traiter le problème de grand volume de données médicales. Nous avons proposé un algorithme de résumé linguistique, à base de calcul de cardinalité floue réduit (RLR-CardF), qui est interprétable et proche du langage humain (médecin).

Les résumés linguistiques RLR-CardF condensent toutes les informations avec leur poids et leurs degrés de satisfactions .Ils utilisent la notion de la logique floue qui offre aux résumés une meilleure représentation des connaissances, qui sont proche du langage naturel. Dans la deuxième partie de notre modèle est utilisé les résumés linguistiques pour construire un système d’interrogation médical rapide et flexible, et qui répond aux besoins spécifiques de l’utilisateur. L’exploitation de résumé linguistique, à base de calcul de cardinalité floue, donne la possibilité de faire une recherche par des requêtes sémantiquement proches au langage naturel. Notre contribution concerne le calcul de degré de la validité d’une requête, proposé par L.Liétard, pour valider une requête complexe et de trouver le quantificateur flou d’une requête IFlex- RL (Interrogation Flexible des Résumés Linguistiques). Nous constatons que les résultats obtenus, à partir de notre modèle d’interrogation flexible, sont plus rapides et plus précis par rapport à la recherche sur une base de données numérique.

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela rapport gratuit propose le téléchargement des modèles gratuits de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

Remercîment
Dédicace
Résumé
Table des matières
Liste des figures
Liste des Tableaux
Introduction général
chapitre 1. Résumé linguistique
1.1 Introduction
1.2 Compression de données
1.2.1 Compression physique
1.2.2 Compression logique
1.3 Réduction sémantique de données
1.3.1 La réduction basée sur les méthodes statistiques
1.3.1.1 La réduction verticale
1.3.1.2 Réduction horizontale
1.3.1.3 Calcul d’agrégats
1.3.2 Approche basé sur les modèles
1.3.2.1 Le modèle de fouille de données
1.3.2.2 Les modèles basés sur les métadonnées
1.4 Résumé linguistique :
1.4.1 Définition Variable linguistique :
1.4.2 Théorie de l’ensemble flou
1.5 Résumé SaintEtiQ
1.5.1 Les étapes de la construction hiérarchique de résumés.
1.5.1.1 Réécriture des données :
1.5.1.2 Regroupement des données
1.6 Résumé de Yager
1.7 Résumé linguistique à base de calcul de la cardinalité floue
1.7.1 Principe de résumé linguistique à base de calcul de la cardinalité floue
1.7.2 Définition le Quantificateur flou
1.8 Conclusion
chapitre 2. Interrogation flexible des résumés linguistiques
2.1 Introduction
2.2 L’interrogation de la Base de données relationnel
2.2.1 Définition de la base de données :
2.2.2 Système d’interrogation flexible
2.2.2.1 Système de personnalisation
2.2.2.2 Requête flexible
2.2.3 Requête floue :
2.3 Système d’interrogation des résumés linguistiques
2.3.1 Le modèle SaintEtiQ
2.3.1.1 La Forme général de la requête :
2.3.1.2 Évaluation des requêtes :
2.3.2 Résumé de Yager
2.3.2.1 Langage d’interrogation de résumé Yager
2.3.3 Approche de L.Liétard
2.3.4 Résume linguistique à base de calcul de Cardinalité floue
2.3.4.1 La définition de résumé linguistique à base de calcul de la cardinalité floue
2.3.4.2 Quantité graduel
2.4 Conclusion
chapitre 3. La relation entre le résumé linguistique et la classification supervisée
3.1 Introduction
3.2 Extraction de connaissance à partir de données
3.2.1 Définition de Data Mining (Fouille de données)
3.2.1.1 L’estimation
3.2.1.2 La prédiction
3.2.1.3 Les règles d’association
3.2.1.4 La segmentation
3.2.1.5 Classification
3.3 La classification
3.3.1 L’apprentissage
3.3.1.1 L’apprentissage non supervisé :
3.3.1.2 L’apprentissage semi-supervisé (par renforcement) :
3.3.1.3 L’apprentissage supervisé :
3.3.2 Principe de la classification
3.3.2.1 Définition d’une classe
3.3.2.2 Définition d’un classifieur
3.3.3 Classification supervisée
3.3.3.1 Risque réel
3.3.3.2 Risque empirique
3.4 Les méthodes de classification
3.4.1 Séparateurs à Vaste Marge
3.4.1.1 Principe
3.4.1.2 Ajustement
3.4.1.3 Avantages et inconvénients
3.4.2 Arbre de décision
3.4.2.1 Principale de l’arbre de décision
3.4.2.2 Avantages et inconvénients
3.4.3 Réseaux de neurone
3.4.3.1 Principe
3.4.3.2 Mise en oeuvre
3.4.3.3 Avantages et Inconvénients
3.4.4 Les plus proches voisins
3.4.4.1 Les distances
3.4.4.2 Avantages et inconvénients
3.5 Prédiction et le calcul de la distance métrique des résumés linguistique
3.5.1 Présentation de résumé linguistique
3.5.1.1 Les protoformes classiques :
3.5.1.2 L’extension de protoforme de Yager
3.5.2 Evaluation de la similarité d’une protoforme classique :
3.5.3 Similarité entre les ensembles des résumes linguistiques
3.5.3.1 Agrégation en utilisant opérateurs OWA :
3.5.3.2 Agrégation de Intégral Sugeno
3.5.4 Résumés linguistiques différentiels
3.5.5 Travaux de littératures
3.6 Conclusion
chapitre 4. Conception d’un modèle médical à base de résumés linguistiques
4.1 Introduction
4.2 Matériels et méthodes
4.2.1 Langages et outils utilisés
4.2.2 Les bases de données
4.2.2.1 PIMA
4.2.2.2 Wisconsin Breast Cancer (WBCD)
4.2.2.3 Mammographie
4.2.3 Critères d’évaluation
4.3 Architecture d’un nouveau modèle de diagnostic médical
Aperçue sur l’application
4.4 Approche proposée des résumés linguistiques médicaux RLR-CardF
4.4.1 Implémentation le RLR-CardF sur une base de données médicale
4.4.2 Résultat et discutions
4.4.3 Aperçue sur l’application
4.5 Approche proposée d’un système d’interrogation médical flexible
4.5.1 Calcul le quantificateur flou par le produit scalaire
4.5.2 Calcul le quantificateur flou par le degré de vérité
4.5.3 L’approche proposé IFlex- RLR-CardF par le degré de validité
4.5.4 Aperçue sur l’application
4.6 Approche proposé d’un classifieur médical « Classifieur- RLR-CardF»:
4.6.1 Schéma général de l’approche proposé « Classifieur- RLR-CardF »
4.6.2 Processus de développement, Classifieur- RLR-CardF
4.6.3 Aperçue sur l’application
4.7 Résultats et discussions
4.8 Comparaison de l’approche proposée avec les travaux de la littérature
4.9 Conclusion
Conclusion général
Bibliographie

Rapport PFE, mémoire et thèse PDFTélécharger le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *