Modélisation multidimensionnelle de l’ED spatio-temporel
Contributions originales du simulateur SEIR-SW
L’objectif de la modélisation d’épidémie est de mettre au point une représentation réaliste du phénomène de propagation d’épidémie par : la présentation des différents états d’un individu durant une maladie, l’étude de l’évolution de la maladie dans le temps et dans l’espace et la compréhension des facteurs qui pourraient causer la transmission. Classiquement, les modèles compartimentaux d’épidémie reposent sur les systèmes d’équations différentielles ordinaires (EDO) pour étudier le phénomène complexe de la propagation d’épidémie. Ces modèles considèrent que le degré des noeuds (le nombre de voisins d’un individu dans le réseau social) est fixe, égale à une matrice de valeurs figées ou à une loi de distribution. Cependant, ces modèles ont échoué à représenter les individus distribués d’une façon hétérogène dans l’espace et formant un réseau social afin d’effectuer une analyse de ce réseau. Il est donc important de considérer cette hétérogénéité et le contexte géographique dans lequel la maladie se développe pour préciser le risque épidémiologique. L’objectif ici est de contribuer à élaborer un modèle permettant de modéliser et de comprendre l’évolution de l’épidémie grippale.
Ce modèle est basé sur un réseau social où le degré des noeuds est variable pour représenté les relations dans le monde réel. En outre, il permet une analyse de ces réseaux afin de comprendre les facteurs sociaux influençant la propagation d’épidémie. Plus concrètement, notre démarche consiste à formaliser, dans un programme informatique, le réseau social SW pour la création des individus représenté par des noeuds et des relations de rencontres entre ces individus représentées par des arrêts. Le but d’une telle création consiste à modéliser et analyser les différents types de liens existant entre les individus de la population. Ensuite, l’application de modèle SEIR pour étudier la transmission et l’évolution de la maladie au niveau individuel. Et l’évolution du réseau sociale (graphe sociale) dans le temps. Ce simulateur SEIR-SW a pour objectif d’estimer les paramètres inconnus de la maladie par l’utilisation de la méthode d’ajustement.
Contributions originales de SID Face aux problèmes de santé, les décideurs manquent d’outils cartographiques simples et puissants pour explorer, synthétiser et analyser des données spatio-temporelles telle que la détermination des zones à risque. En effet, la visualisation des foyers épidémiques sur la carte géographique est souvent gérée par le SIG (Système d’Information Géographique). Toutefois, cette technologie souffre encore de plusieurs lacunes dues en grande partie à un manque de capacités analytiques capables de supporter les problèmes multidimensionnels suite aux progrès des solutions issues du domaine de l’informatique décisionnelle. La solution la plus diffusée pour faire évoluer les SIG vers un vrai outil d’aide à la décision est de les coupler avec le moteur OLAP, car la maîtrise de la complexité des problèmes décisionnels à référence spatiale nécessite l’utilisation de méthodes, de techniques et d’outils d’analyse puissants, qui doivent non seulement gérer mais aussi analyser des données multiples. Des solutions, telles que le SOLAP, permettant de supporter les données spatiales dans l’OLAP, ont été développées par Bédard [Bédard et al., 19 97].
L’originalité de ce travail de recherche porte aussi sur l’intégration du processus SWSEIR dans un SID afin d’améliorer les insuffisances d’étude spatio-temporelle et géographique du processus SW-SEIR et augmenter les performances du SID. A notre connaissance, aucune étude n’avait traité de la propagation d’épidémie dans le contexte de suivi, prévention et alerte à la fois en stockant les données réelles multidisciplinaires et simulées dans un entrepôt de données puis effectuant une analyse multidimensionnelle SOLAP en montrant l’apport de cet outil dans le suivi, la surveillance et la prévention de propagation d’épidémie dans la région d’étude afin de fournir un outil d’aide à la décision spatiotemporel au responsable du programme de lutte contre l’épidémie de la grippe saisonnière. En effet, ce travail de thèse illustre une marche difficile au travers des problèmes de la complexité dans les systèmes vivants. Nous sommes partis d’une problématique de nature complexe et multidisciplinaire. La complexité du processus dynamique de transmission de la maladie nous conduit à la transposer dans un formalisme mathématique lié à la théorie des graphes, qui nous a permis de proposer un nouveau modèle étudiant la propagation des maladies infectieuses. L’utilisation d’entrepôt de données et le moteur SOLAP permettra une analyse multidimensionnelle des données multiples dédiées à l’épidémiosurveillance. La mise en oeuvre du modèle proposé nous a conduit à un outil formel capable de répondre à notre problématique.
L’estimation des paramètres liés au modèle épidémique
Dans le domaine épidémiologique, nous avons souvent besoin de connaître certaines caractéristiques inconnues du modèle étudié. Plusieurs techniques d’estimation numériques de ces derniers ont été proposées, tels que : la vraisemblance, les modèles bayésiens, etc. Les paramètres du modèle mathématique d’épidémie inconnus telle que le taux de transmission de l’infection ont eu une importance considérable pour la compréhension de la dynamique du système. En effet, l’estimation de certains paramètres est indispensable car la méconnaissance de ces derniers rends très difficile la comparaison des modèles aux données réelles. Ainsi, elle permet de dégager les paramètres clefs de l’épidémie, de tester les politiques de prévention et de faire des prévisions par l’élaboration des scenarios de propagation. Certaines variables peuvent être mesurées (par exemple : le nombre des infectés), qui seront utilisées dans le modèle pour étudier la dynamique du système afin de pouvoir estimer les autres variables. De plus, pour connaitre l’origine de la maladie (par exemple : le nombre d’infectés initial) une fois que l’épidémie soit propagée.
Dans le présent travail de recherche, nous utilisons une méthode d’estimation des états et des variables non mesurés à partir des données du terrain en se basant sur l’algorithme de Levenberg-Marquardt [Kristensen, 2004] tout en déduisant une méthode simple d’estimation des paramètres inconnus. L’idée est de comparer les résultats du modèle de propagation proposé avec les données réelles et de trouver, par conséquent, les valeurs des paramètres qui minimisent l’écart entre les résultats (sorties) du modèle et les données réelles. L’algorithme de Levenberg-Marquardt : ou algorithme L-M, est largement utilisé pour un objectif d’optimisation. Il fut développé par Kenneth Levenberg [Levenberg, 1944], puis publié par Donald Marquardt [Marquardt, 1963]. Il permet d’obtenir une solution numérique au problème de minimisation d’une fonction non linéaire et dépendant de plusieurs variables. L’algorithme combine les avantages de l’algorithme de Gauss-Newton et l’algorithme du gradient [Kristensen, 2004]. Il est rapide et a une convergence stable. Plus stable que celui de Gauss-Newton, il trouve une solution même s’il est démarré très loin d’un minimum. La méthode de Levenberg-Marquardt permet de trouver le minimum d’une fonction F(x) exprimé par la somme des carrés des fonctions non linéaires fi(x), tel que :
Travaux connexes Dans ce contexte, les auteurs dans [Casagrandi et al., 2006] ont développé un modèle simple d’EDO pour étudier les conséquences épidémiologiques du mécanisme des virus de la grippe A. Par l’amélioration du modèle classique SIR, ils ont introduit une quatrième classe (C) pour les individus ayant une immunité croisée . Le modèle de SIRC affirme que la prévalence du virus est maximale pour une valeur intermédiaire de R0. Via une analyse de bifurcation du modèle, les auteurs ont discuté l’effet de la saisonnalité sur les régimes épidémiologiques. utilisent les modèles d’épidémie SIR et SEIR avec un taux d’incidence non linéaire, en intégrant l’aspect du retard dans les modèles des EDO. En particulier, ils considèrent deux modèles d’EDO avec retard dans lesquels les retards sont causés : (1) par la latence de l’infection dans un vecteur, et (2) par la période de latence dans un hôte infecté. En construisant la fonction de Lyapunov appropriée et utilisant le principe d’invariance de Lyapunov-LaSalle, ils ont prouvé la stabilité globale de l’équilibre endémique et l’équilibre en absence de maladie en cas de retard dans le temps pour chaque modèle.
Les résultats ont montré que les propriétés globales des équilibres ne dépendent que du nombre de reproduction de base (R0). L’un des problèmes majeurs des modèles épidémiques simples est qu’ils conduisent à des schémas épidémiques irréalistes. Ils considèrent que tous les individus de la population peuvent être infectés et qu’aucun afflux de nouveaux sujets susceptibles par le biais de la naissance ou de la migration. En effet, des modèles avec extensions rajoutées sont mis en place par plusieurs chercheurs afin d’étudier l’impact de certains facteurs, tels que : médicaux, sociaux et démographiques sur la propagation d’épidémie [Capasso, 1993]. Des versions améliorées du travail de [Huang et al., 2010], ont exploité l’effet de la structure par sexe et contact [Sharomi et Gumel, 2011], la structure d’âge où la sensibilité à la maladie dépend de l’âge d’individu [Melnik et Korobeinikov, 2013], et la démographie (naissance et le décès) [Wang et al., 2014].
|
Table des matières
Liste des Figures
Liste des Tables
Remerciements
Résumé
Acronymes
Introduction Générale
I La modélisation mathématique et les réseaux complexes
1 Concepts et définitions de base
1.1 Introduction
1.2 La modélisation mathématique
1.2.1 Concepts de base
1.2.2 La modélisation mathématique en épidémiologie
1.2.3 Quelques modèles mathématiques de transmission de maladie
1.3 Les réseaux complexes
1.3.1 L’épidémiologie par réseaux de contacts
1.3.2 L’analyse structurelle des réseaux
1.4 Conslusion
2 Etat de l’art sur les modèles d’épidémie
2.1 Introduction
2.2 Principe de la modélisation mathématique en épidémiologie
2.3 Les modèles mathématiques d’épidémie simple
2.4 Les modèles compartimentaux déterministes
2.4.1 Les modèles compartimentaux déterministes simples
2.4.2 Les modèles compartimentaux déterministes spatiaux
2.5 Modèles compartimentaux stochastiques
2.6 Les modèles mathématiques d’épidémie complexes
2.6.1 Les modèles à base d’agent / individus-centrés
2.6.2 Les modèles de réseau
2.6.3 Les modèles de métapopulation
2.6.4 Modèles à base des structures de contact
2.7 Conclusion
3 Modèle de propagation d’épidémie proposé
3.1 Introduction
3.2 Les objectifs du modèle de propagation SEIR-SW
3.3 L’identification du problème
3.3.1 Comprendre la dynamique de la maladie
3.3.2 Comprendre la réparation spatiale et la dynamique de la population
3.3.3 Définition des hypothèses
3.4 La description du modèle de propagation SEIR-SW
3.4.1 Le cadre générale de la démarche de modélisation
3.4.2 Le modèle SEIR-SW
3.5 Simulation et résultats expérimentaux
3.5.1 Jeux de données
3.5.2 L’estimation des paramètres du modèle SEIR-SW
3.5.3 Résultats de la simulation
3.5.4 Estimation du nombre de reproduction de base : R0
3.5.5 La validation du modèle SEIR-SW
3.5.6 L’analyse du réseau social petit monde (SW)
3.6 Conslusion
II Les systèmes d’Information Décisionnels
4 Généralités sur les SID
4.1 Introduction
4.2 Qu’est-ce qu’un Système d’Information Décisionnel SID ?
4.3 L’architecture d’un Système d’Information Décisionnel (SID)
4.4 Entrepôts de données (ED) « Datawarehouse»
4.4.1 Définitions
4.4.2 Les objectifs d’un ED
4.4.3 Les composants d’un ED
4.4.4 Les phases de construction d’un ED
4.5 Schéma multidimensionnel : le cube Olap (On-Line Analytical Processing)
4.5.1 Les Opérations de manipulation d’un cube
4.5.2 Les architectures OLAP
4.5.3 Outils de visualisation OLAP
4.5.4 Spatial OLAP (SOLAP)
4.6 Conclusion
5 Etat de l’art sur les Systèmes d’Information Décisionnels
5.1 Introduction
5.2 Les Systèmes de surveillance d’épidémies/ Les systèmes d’épidémiosurveillance
5.2.1 Des systèmes à l’échelle nationale et mondiale
5.2.2 Travaux de recherche connexes
5.3 Les systèmes de surveillance à référence spatiale
5.3.1 Le SIG comme outil d’aide à la décision
5.3.2 Le SIG et les modèles mathématiques
5.4 Les SID épidémiologiques
5.4.1 Les travaux traitant les entrepôts de données médicales
5.4.2 Les travaux traitant les entrepôts de données médicales et l’OLAP
5.4.3 Les travaux traitant les entrepôts de données et les réseaux sociaux
5.5 Autres stratégies de lutte contre les épidémies
5.5.1 Surveillance active ou passive
5.5.2 Surveillance exhaustive
5.6 Conclusion
6 Le système décisionnel proposé SYDSEP
6.1 Introduction
6.2 Le système proposé : SYDSEP
6.2.1 Les objectifs du système SYDSEP
6.2.2 La description du système SYDSEP
6.3 La démarche décisionnelle adoptée par SYDSEP
6.4 Modélisation UML de SYDSEP
6.4.1 Diagramme de cas d’utilisation
6.4.2 Diagramme de séquence
6.5 Description de l’entrepôt de données
6.5.1 Les sources de données
6.5.2 Modélisation multidimensionnelle de l’ED spatio-temporel
6.6 Mise en oeuvre de SYDSEP
6.6.1 L’environnement technique
6.6.2 Le découpage spatial administratif de la région d’étude
6.6.3 SIG et analyse spatiale
6.6.4 Création des cubes d’analyse en ligne
6.6.5 Suivi et surveillance de la grippe saisonnière
6.6.6 La prédiction
6.7 Le système SYDSEP : Discussion
6.8 Conclusion
Conclusion Générale
III Annexes
A L’épidémiologie
A.1 Quelques définitions
A.2 Formes épidémiologiques des maladies
A.3 Indicateurs épidémiologiques
B Les facteurs climatologiques
B.1 Description des données climatiques
C L’analyse multidimensionnelle
C.1 Description du schéma MEDICAL_STATISTICS et ses dimensions
C.2 Description du schéma ENVIRONMENT et ses dimensions
C.3 Description du schéma HEALTH_STATUS_OF_POPULATION et ses dimensions
C.4 Description du schéma DEMOGRAPHY et ses dimensions
C.5 Description du schéma SIMULATION et ses dimensions
C.6 Description du schéma STATUT et ses dimensions
Bibliographie
Télécharger le rapport complet