INTRODUCTION AUX BASES DE DONNEES REPARTIES
Aujourd’hui les BDR sont de plus en plus répandues et comblent largement les lacunes des bases de données classiques. L’idée est venue de multiplier les sources de données et les communiquer par réseau afin de bénéficier de traitement parallèle minimisant le temps de réponses. En effet, pour accéder de manière intégrée à des données dans les différents sièges et des usines, notamment des entreprises multi sites, il nous est utile d’offrir un système de gestion intégrant des sources de données hétérogènes en assurant la transparence à la distribution et à l’hétérogénéité, ceci enfin de faciliter les développements pour l’utilisateur. Avec les grands réseaux internationaux tels que INTERNET, le besoin de fédération de données hétérogènes (tables, textes, documents audio-visuels, géométrie, cartes, etc.…) est immense. La recherche en bases de données réparties dont un des aboutissements est déjà le client serveur a donc encore un bel avenir.
DEFINITION D’UNE BDDR
Une base de données répartie est un ensemble de bases de données gérées par des sites différents et apparaissant à l’utilisateur comme une base unique. Elle peut aussi être définie comme une collection des bases de données logiquement reliées distribuées sur un réseau.
Signalons que la définition de la base des données réparties se fonde sur trois critères :
– Structuration : qui fait allusion aux conditions de stockage des informations et à la manière dont ces informations seront utilisées ;
– Non redondance : interdit à la base des données de contenir des informations répétitives. La synonymie (même signification) et la polysémie (un objet renvoi plusieurs significations) ;
– Exhaustivité : la base des données doit contenir toutes les informations nécessaires afin de répondre aux besoins de l’utilisateur ;
D’où la base de données est un ensemble des données structurées, non redondantes et exhaustives.
AVANTAGE DES BDDR
Les avantages de BDDR sont nombreux. On peut citer comme principaux :
– Le gain de performances : les traitements se font en parallèle ;
– La fiabilité : si un site a une panne, un autre peut le remplacer valablement ;
– La transparence des données : les développeurs et les utilisateurs n’ont pas à se préoccuper de la localisation des données qu’ils utilisent.
CONCEPTION D’UNE BASE DE DONNEES REPARTIE
Comme tous les mécanismes, la phase de conception est la plus importante et déterminante dans la mise en place d’une BDDR. A cet effet, le rôle du concepteur est :
– De définir les fragments de la base et leurs localisations ;
– D’évaluer les différents coûts de stockage et de transfert, et de priorité à respecter On distingue deux principaux types de conception : ascendante et descendante.
Conception ascendante : dans ce cas de figure, il existe plusieurs bases de données qu’il faut réunir en une seule BDDR et cohérente avec schéma de conception globale .
Conception descendante : ici on a au départ une seule base de données qu’il faut fragmenter et allouer les fragments aux différents sites. Va donc d’un schéma global de conception à des sous schémas locaux.
LA FRAGMENTATION
La fragmentation désigne le découpage en sous base selon les critères de base. Le concepteur choisi entre un découpage horizontal, vertical ou mixte. Notons qu’un fragment est une sous-table obtenue par sélection des lignes et des colonnes à partir d’une table globale, localisée sur un site unique.
la fragmentation horizontale
Elle consiste à faire une séparation selon les enregistrements. C’est le découpage d’une table en sous table permettant de sélectionner les lignes appartenant à chaque fragment. Ce type est adopté à la régionalisation ou départementalisation dans une entreprise (par exemple dans le cas de gestion de stock on peut séparer les produits vendus à Kinshasa de ceux vendus à Kananga).
la fragmentation verticale
C’est un découpage d’une table en sous-table par projection permettant de sélectionner les colonnes composant chaque fragment. En continuant avec l’exemple de la gestion de stock, on peut avoir le numéro, le nom, le post nom, le lieu d’habitation d’un client quelconque.
N.B. : La fragmentation mixte consiste à utiliser conjointement les deux méthodes citées-dessus.
L’ALLOCATION
Lors que le concepteur a fini de fragmenter sa base, il lui faut ensuite allouer chaque fragment sur son site correspondant. Cette phase est appelée « allocation ». L’allocation peut être faite de plusieurs façons :
La réplication totale de données
Pour des raisons de fiabilité, on peut décider de répliquer toutes les données sur tous les sites. Ainsi, si un site est temporairement ou définitivement défaillant, on utilise simplement un autre. Mais cette méthode n’est très efficace que lorsque les données sont régulièrement mises à jour, car il se pose le problème de cohérence de données.
L’absence de réplication
On peut aussi choisir de ne rien répliquer afin d’assurer une meilleur cohérence de données. Ici chaque donnée est mise à jour sur un site. Cette méthode est plus efficace quand les données sont beaucoup plus modifiées que lues.
La méthode hybride
Afin de bénéficier des deux méthodes citées à la fois, celle hybride peut être utilisée. Ainsi, les données en Read Only (en lecture seule) peuvent être répliquées et celles en Read Write (lecture-écriture) pas du tout.
LES TRANSACTIONS REPARTIES
Définition
Une transaction désigne un ensemble d’opérations effectuées de manière indivisible sur une base de données. Elle est aussi définie comme un ensemble des requêtes obéissant à la propriété ACID. Elle est soit validée par un Commit, soit annulée par le roll back, soit interrompue part abort.
propriétés des transactions
Une transaction est composée d’une suite de requêtes dépendantes de la base qui doivent vérifier les propriétés d’Atomicité, de Cohérence, d’Isolation et de Durabilité résumées par le sigle vocable ACID.
– Atomicité : une transaction doit effectuer toutes ses mises à jour ou ne rien faire du tout. En cas d’échec, une transaction doit annuler toutes les modifications qu’elle a engagées. En outre, toutes les opérations d’une transaction sont menées de façon indivisible, cela veut dire qu’elles doivent être validées si non tout est annulé. Cette propriété signifie qu’une transaction est traitée comme une seule opération. Toutes les actions d’une transaction sont donc menées à bien ou aucune d’entre elles.
– Cohérence : la transaction doit amener le système (ou la BDD) d’un état cohérent vers un autre état cohérent, telles que toutes les contraintes d’intégrité soient respectées, si non en cas d’échec, l’état cohérent initial doit être restauré. La cohérence d’une transaction est simplement sa correction.
– L’isolation : une transaction encours ne peut révéler ses résultats à d’autres transactions si toutes les opérations ont été validées.
– La durabilité : dès qu’une transaction valide des modifications, le système doit garantir que les modifications seront conservées en cas de panne. Ou encore elle est une propriété qui garantit au système lorsqu’une transaction a effectué son commit, le résultat sera permanent et ne pourra pas être effacé de la base de données quelques soient les pannes rencontrées.
TRANSACTIONS REPARTIES
Dans le cadre de systèmes répartis, une transaction peut être en attente pas seulement par rapport à une seule transaction locale, mais située sur un autre site. On peut aussi voir dans ce cas une transaction constituée des plusieurs autres mais qui sont locales. Dans ce cas on utilise un protocole à deux phases. Dans la première phase dite de préparation, le site coordonnateur demande aux sites participant de se préparer à la validation. Lorsqu’il reçoit les modifications positives il lance alors la phase de validation en donnant l’ordre correspondant aux sites. Dans le cas contraire il donne l’ordre d’interrompre les transactions.
LA REPLICATION
La réplication est un processus qui consiste à copier et à mettre à jour les objets (tables, informations, index, etc.), entre différents sites qui peuvent être éloignés géographiquement. Elle désigne la reproduction identique de données d’un site à un autre. Elle a pour but d’assurer la fiabilité du système et diminuer les trafics réseaux dans le cadre de système distribué. Ainsi, si un site est momentanément inaccessible, un autre peut le remplacer valablement sans que les utilisateurs s’en aperçoivent.
Cette mise à jour peut s’enclencher automatiquement ou manuellement. La réplication signifie que les mêmes données sont disponibles à multiples endroits. Mais pour les bases de données distribuées, les données sont disponibles à plusieurs endroits mais une table particulière réside à un seul site.
|
Table des matières
INTRODUTION GENERALE
CHAPITREI. LES BASES DE DONNEES REPARTIES ET LES ARCHITECTURES CLIENTSERVEUR
1. INTRODUCTION AUX BASES DE DONNEES REPARTIES
2. L’ARCHITECTURE CLIENT SERVEUR
CONCLUSION
CHAPITRE II. ENVIRONNEMENTS MOBILES ET RESEAU ADHOC
INTRODUCTION
2.1. LES ENVIRONNEMENTS MOBILES
2.1.6 ARCHITECTURE DES ENVIRONNEMENTS MOBILES
2. 2. RESEAU ADHOC
CONCLUSION
CHAPITRE III. GESTION DE STOCK MULTI-SITES
1. LES ASPECTS THEORIQUES DE LA GESTION DES STOCKS
2. GESTION DE STOCK
3. MODELE DETERMINISTE DE LA GESTION DE STOCK
CHAPITRE IV. DEVELOPPEMENT ET DEPLOIEMENT DE L’APPLICATION
INTRODUCTION
4.1. APERCU GENERAL DU CADRE DE PROJET
4. 2. ANALYSE ET SPECIFICATION DES BESOINS
4.3. CONCEPTION DETAILLEE
4.4. IMPLEMENTATION ET REALISATION
CONCLUSION GENERALE
BIBLIOGRAPHIE
Télécharger le rapport complet