Architectures réparties et conteneurs logiciels sécurisés pour coopérations médicales multi-sites

Dû à la croissance énorme de la quantité des données produites dans le monde, nous nous trouvons devant une évolution très rapide d’analyses de données massives dans pratiquement tous les domaines biomédicaux et d’ingénierie. Des plus grandes quantités de données permettent généralement aux analyses d’obtenir des résultats plus précis et atteindre une puissance statistique plus grande. Elle se place à la base de l’amélioration de connaissances dans de nombreux secteurs tels que la médecine, le secteur bancaire, le transport, etc.

La médecine de précision est un domaine médical émergent qui a pour objectif de cibler des diagnostics et des traitements médicaux à des petits groupes de personnes ou même des individus. Ainsi, la prévention et les traitements des maladies peuvent tenir compte de la variabilité de facteurs tels que génétiques, métaboliques ou environnementaux. Cela contraste avec l’approche médicale actuelle, qui appliquent des stratégies de prévention et des traitements développés pour des représentants « moyens » de (très) larges groupes de personnes, sans pouvoir prendre en compte les différences entre les individus. [122]. Dans le domaine de la médecine de précision, la disponibilité de larges quantités de données, associée à l’accélération de la technologie et à une précision accrue des tests, permet aux chercheurs de découvrir, entre autres, de nouveaux bio marqueurs et de mieux comprendre les maladies au niveau moléculaire et génétique. Cela permettra à terme de fournir des traitements ciblés à des populations de patients stratifiées pour des bénéfices médicaux optimaux.

Des technologies pour des analyses distribuées à grande échelle

Cloud computing

Traditionnellement défini comme la fourniture des services informatiques (des serveurs, du stockage, des bases de données, de gestion réseau, des logiciels, des outils d’analyse, d’intelligence artificielle) via Internet (le cloud) dans le but d’offrir une innovation plus rapide, des ressources flexibles et des économies d’échelle [18]. Grâce à sa propriété de mutualisation des ressources, le cloud computing a permis de démocratiser l’informatique dans les entreprises. Il a contribué à la centralisation de l’infrastructure pour un grand nombre d’utilisateurs pour plusieurs applications en même temps, ce qui facilite les collaborations entre les équipes. Il a aussi permis d’adapter la demande des ressources informatiques nécessaires selon l’évolution du besoin du métier, ce qui permet de payer les ressources selon le besoin [41].

Les types du Cloud 

Pour les types de Cloud, on peut trouver aujourd’hui :
— Cloud public : C’est une infrastructure informatique dans laquelle les ressources d’un fournisseur de services sont mises à la disposition de tous via internet comme « DropBox » [27].
— Cloud privé : Contrairement au cloud public, ce type concerne un petit ensemble de groupes qui font partie à un cercle fermé. L’hébergement de l’infrastructure informatique dans ce type de cloud n’est pas partagé. Le cloud privé est connu par un niveau de sécurité et de contrôle le plus élevé car un réseau privé est utilisé.
— Cloud hybride : Ce cloud utilise des clouds privés et publics, en fonction de leur objectif. On peut héberger les applications les plus importantes sur nos propres serveurs, pour les garder plus sécurisées et héberger les applications secondaires ailleurs.
— Cloud communautaire : Le cloud communautaire est partagé entre des organisations ayant un objectif commun ou qui s’intègrent dans une communauté spécifique (communauté professionnelle, communauté géographique, etc.).

Les services Cloud

Pour les principaux services de Cloud, on peut citer :
— Infrastructure en tant que service (IaaS) : IaaS est la catégorie basique des services informatiques en cloud qui permet de louer à la carte une infrastructure informatique (serveurs ou machines virtuelles) auprès d’un fournisseur de services informatique en cloud. Ce service ne fournit aucune infrastructure logicielle. L’utilisateur doit fournir lui-même le système d’exploitation et les services distribués de base.
— Plateforme en tant que service (PaaS) : La plate-forme en tant que service (PaaS) est destinée aux développeurs ou aux entreprises de développement. En plus des services IaaS, il ajoute un système d’exécution et des services distribués de base. Il fait référence à la fourniture d’un environnement à la demande pour le développement, le test, la fourniture et la gestion d’applications logicielles. Il est conçu pour créer rapidement des applications Web ou mobiles, sans se soucier de la configuration ou de la gestion de l’infrastructure sous-jacente de serveurs, de stockage, de réseau et de bases de données nécessaires au développement.
— Logiciel en tant que service (SaaS) : Le logiciel en tant que service (SaaS) est une méthode permettant de fournir des applications logicielles sur Internet à la demande et sur abonnement. SaaS permet de faire héberger et de gérer l’application logicielle et l’infrastructure sous-jacente, ainsi que de faire gérer toute maintenance (mises à niveau logicielles et correctifs de sécurité).

Cloud computing pour le domaine biomédical 

Dans le cadre des projets medicaux collaboratifs, on se trouve devant la nécessité d’une réelle distribution des analyses biomédicales. Dans ce contexte, on peut citer le projet I-CAN [63] dans lequel 34 hôpitaux français apportent leurs données à des serveurs centralisés pour un premier stockage. Le traitement des données, qui comprend les données cliniques, d’imageries et génétiques, est alors effectué sur un serveur différent mais également de manière centralisée, ce qui implique une transmission de données à grande échelle au moment du calcul, qui nécessite la disponibilité d’un réseau à haut débit.

Dans le cadre de ce projet, Boujdad et al. [13] ont montré l’importance de l’utilisation des clouds publics sécurisés et des clouds communautaires pour résoudre les problèmes de reproductibilité, de confidentialité et d’évolutivité dans le contexte des études multi-centres.

La technologie Blockchain

La technologie Blockchain, bien que datant des années 1980, a été décrite et implémentée pour la premiere fois par Nakamoto [92] « bitcoin a peer-to-peer electronic cash system ». il s’agit d’une technologie de stockage de grands registres décentralisés, utile comme technique de sécurité pour l’authentification, l’autorisation et la vérification des données générées. Avec la technologie blockchain, le concept de consensus est devenu un mécanisme garantissant la confiance dans la communication entre deux entités sans l’intervention d’un intermédiaire. Aujourd’hui, la blockchain est omniprésente dans la crypto-monnaie, les contrats intelligents, la gestion des identités numériques, les applications de contrôle d’accès, l’assurance automatisée entre homologues, dans les banques et dans de nombreuses autres applications [105].

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

1 Introduction
1.1 Motivations
1.2 Contributions
1.3 Publications
1.4 Aperçu de la thèse
2 État de l’art
2.1 Introduction
2.2 Des technologies pour des analyses distribuées à grande échelle
2.2.1 Cloud computing
2.2.2 La technologie Blockchain
2.2.3 Big Data
2.2.4 L’apprentissage fédéré
2.3 Des mécanismes de confidentialité pour les calculs distribués
2.3.1 L’agrégation et la fragmentation des données
2.3.2 Les méthodes de cryptographie
2.3.3 La confidentialité différentielle
2.3.4 La synthétisation des données
2.4 Conclusion
3 Quelques outils et méthodes d’analyses dans le domaine biomédical
3.1 L’application de suivi des transplantés rénaux KITAPP
3.2 Le système des antigènes des leucocytes humains (HLA)
3.2.1 Allèle HLA
3.2.2 Génotype HLA
3.2.3 Haplotype HLA
3.3 La base de données AFND
3.4 L’inférence des haplotypes à l’aide de la méthode statistique EM pour le calcul de vraisemblance
3.5 Conclusion
4 Contextualisation distribuée des données biomédicales
4.1 Introduction
4.2 Motivation des analyses distribuées pour l’application KITAPP
4.3 Contextualisation distribuée des données biomédicales
4.3.1 Définition de l’algorithme
4.3.2 Implémentation distribuée
4.4 Expérimentations
4.4.1 Déploiement sur une infrastructure géo-distribuée
4.4.2 Évaluation des performances et de la confidentialité
4.5 Conclusion
5 Analyse factorielle de données mixtes distribuée
5.1 Introduction
5.2 État de l’art
5.3 Motivation d’une analyse factorielle de données mixtes distribuée pour KITAPP
5.4 FAMD Distribuée
5.4.1 Description de l’algorithme
5.4.2 Implémentation distribuée
5.5 Expérimentations
5.5.1 Déploiement sur une infrastructure géo-distribuée
5.5.2 Résultats et évaluation des performances
5.6 Conclusion
6 La Distribution de la base de données HLA en histocompatibilité
7 Conclusion

Lire le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *