Les avancรฉes technologiques ont dรฉmultipliรฉ les circuits dโaccรจs aux donnรฉes , leur traitement et leur diffusion. Les donnรฉes sont devenues la matiรจre premiรจre des systรจmes dโinformation et sont indispensables ร la vie et au dรฉveloppement des organisations ; surtout avec la croissance rapide des capacitรฉs de calcul des processeurs ces derniรจres annรฉes. Nous assistons, ainsi, ร une explosion du stockage et du traitement des donnรฉes avec les technologies de lโinformation et de la communication (TIC). Ces technologies ont atteint un niveau de dรฉveloppement trรจs important avec pour aboutissement lโapogรฉe de technologies connexes que sont : le big data , le cloud computing , les objets connectรฉs et lโintelligence artificielle (IA).
Le big data, terme trรจs utilisรฉ de nos jours mais mรฉconnu des Franรงais , sโest dรฉveloppรฉ dans un premier temps dans les domaines de lโรฉconomie, de la gestion et du marketing pour la gestion de la relation client, lโamรฉlioration des processus opรฉrationnels, la crรฉation de nouvelles valeurs et la prise de dรฉcision efficiente. Mais ces derniรจres annรฉes, les envies dโutilisation dans le domaine de la santรฉ connaissent un essor important ; envies liรฉes notamment aux promesses dโรฉconomies รฉnormes sur les dรฉpenses de la santรฉ, ร leur impact sur la recherche dans les domaines mรฉdicaux et pharmaceutiques et ร lโamรฉlioration de la prise en charge des individus.
Le big data a pour objectif de transformer les donnรฉes brutes en connaissance directement exploitable en lien direct avec les consommateurs. Dans le domaine de la santรฉ, les concepteurs promettent des rรฉductions de dรฉpenses de santรฉ, lโamรฉlioration de la qualitรฉ de soin et des politiques de santรฉ. En effet, lโรฉtude McKinsey (MANYIKA ET AL., 2011) sur le systรจme de santรฉ aux Etats Unis a montrรฉ quโen analysant les donnรฉes de santรฉ , on notait une amรฉlioration considรฉrable de lโefficacitรฉ, de lโefficience et de la qualitรฉ du systรจme de santรฉ. Cette utilisation des donnรฉes de santรฉ pourrait crรฉer une valeur de 300 milliards de dollars amรฉricains dont deux tiers sous forme de baisse des dรฉpenses de santรฉ. La protection de la santรฉ est non seulement un rรฉflexe individuel mais aussi une obligation pour lโEtat visร -vis de la population ; Ainsi, du fait de la raretรฉ des ressources financiรจres et de la recherche permanente dโefficience et de qualitรฉ, lโEtat sโest saisi de lโopportunitรฉ quโoffre le numรฉrique pour mettre en place une politique de santรฉ fondรฉe sur les TIC.
Contexte
Rappel historiqueย
Dรจs 1998, lโEtat sโest lancรฉ dans la mise en place de la tรฉlรฉmรฉdecine afin dโamรฉliorer lโaccรจs aux soins ร un plus grand nombre dโindividus. En 2000, le premier arrรชtรฉ pour la mise en ลuvre de la tรฉlรฉmรฉdecine dans un hรดpital a รฉtรฉ signรฉ. En avril 2005, lโEtat a mis en place un groupement dโintรฉrรชt public (GIP DMP) qui devait mettre en ลuvre le dossier mรฉdical personnel aujourdโhui devenu le dossier mรฉdical partagรฉ (DMP). Le but du DMP รฉtait dโune part, de fournir au mรฉdecin traitant l’information la plus complรจte pour qu’il puisse proposer le traitement ou les examens les plus adaptรฉs et, dโautre part, d’รฉviter des redondances inutiles d’examens ou de prescriptions.
Lโรtat a encouragรฉ le numรฉrique dans tous les domaines avec la promulgation de la loi n 2016-1321 du 7 octobre 2016 pour une Rรฉpublique numรฉrique . Lโobjectif de lโutilisation du numรฉrique par lโEtat est de rรฉduire les dรฉpenses de santรฉ et dโamรฉliorer la qualitรฉ de la prise en charge des patients. Cette loi a รฉtรฉ suivie dโactions telles que la relance du DMP et la crรฉation dโun ยซ Data Health Hub ยป pour amรฉliorer lโaccรจs aux donnรฉes de santรฉ ร la recherche.
Lโutilisation des TIC dans le domaine de la santรฉ a donnรฉ naissance ร lโe-santรฉ. Pour lโOrganisation Mondiale de la Santรฉ (OMS), lโe-santรฉ se dรฉfinit comme ยซ les services du numรฉrique au service du bien-รชtre de la personne ยป (WHO, 2016). Elle se dรฉfinit รฉgalement comme ยซ lโutilisation des outils de production, de transmission, de gestion et de partage dโinformations numรฉrisรฉes au bรฉnรฉfice des pratiques tant mรฉdicales que mรฉdico sociales ยป (WHO, 2016). Elle ne se rรฉsume pas ร la tรฉlรฉmรฉdecine et ne doit pas รชtre assimilรฉe au vaste ensemble des TIC-santรฉ qui englobent lโensemble des applications numรฉriques au service de lโoffre de soins.
Mais le domaine de la santรฉ a une particularitรฉ spรฉcifique – lโhumain comme objet dโรฉtude – qui mรฉrite dโรชtre prise en compte dans lโutilisation des TIC ; car une nรฉgligence de cette spรฉcificitรฉ peut aboutir ร des consรฉquences importantes pour le systรจme de santรฉ, les individus et la sociรฉtรฉ .
Contexte spรฉcifique de la santรฉ
Le domaine de la santรฉ est un systรจme complexe trรจs dynamique qui repose sur la mรฉdecine et lโHomme qui sont รฉgalement des systรจmes complexes. Aujourdโhui, la combinaison du big data, de lโintelligence artificielle (IA) et des objets connectรฉs conduit ร une mรฉdecine prรฉventive et individuelle qui prend en compte les vulnรฉrabilitรฉs de chaque personne en vue dโassurer un meilleur suivi (un analyseur รฉlectrocardiographique surveille en temps rรฉel les alertes cardiovasculaires, la surveillance des patients chroniques ร distance ou de lโactivitรฉ sportive et des paramรจtres vitaux des patients, etc.โฆ). Toutes ces technologies aboutissent ร une production massive de donnรฉes qui nรฉcessitera des moyens pour les stocker, les gรฉrer et les utiliser. Toutefois, la sรฉcuritรฉ des donnรฉes devrait รชtre prise en compte afin de protรฉger le secret mรฉdical – fondement de la pratique mรฉdicale -, la vie privรฉe, lโintimitรฉ des individus et garantir lโaccessibilitรฉ des donnรฉes ร tout moment aux soignants afin de leur permettre dโassurer la continuitรฉ des soins.
Le big data prend essentiellement naissance dans et par lโinformatique ; dรฉpassant les solutions classiques existantes pour la collecte, le stockage et le traitement des donnรฉes. Le changement dโรฉchelle, qui a fait passer des bases de donnรฉes aux masses de donnรฉes, rรฉinterroge ces problรฉmatiques. Concernant la collecte des donnรฉes tout dโabord, les mรฉthodes de fouille des rรฉseaux sociaux comme lโintรฉgration de donnรฉes provenant de multiples capteurs (objets connectรฉs, dispositifs de surveillance mรฉdicale, puces, smartphones, etc.โฆ) et leur croisement est riche de potentialitรฉs applicatives tout en posant diffรฉremment les problรฉmatiques liรฉes ร la vie publique / vie privรฉe et ร la visibilitรฉฬ plus ou moins contrรดlรฉe et plus ou moins contrรดlable via les algorithmes, des individus. Le stockage et le traitement calculatoire de ces donnรฉes, la croissance des capacitรฉs de stockage et la structuration, des data center (centres de donnรฉes ou ferme de donnรฉes), ouvrent des problรฉmatiques aussi bien techniques (pour lโorganisation et lโoptimisation de ces systรจmes), quโรฉnergรฉtiques ou รฉconomiques. Pour lโexploitation de ces donnรฉes, le big data a imposรฉฬ la dรฉcouverte de nouvelles mรฉthodes dans des domaines pourtant assez anciens, comme le data mining (fouille de donnรฉes) pour lโexploitation efficace de ces donnรฉes par lโIA en intรฉgrant ร la fois des mรฉthodes de machine learning et de deep learning. Le traitement des donnรฉes massives pose de sรฉrieux problรจmes juridiques – notamment en ce qui concerne leur contrรดle, leur protection, leur sรฉcuritรฉฬ et leur propriรฉtรฉฬ intellectuelle – et des questions sur la commensurabilitรฉ du parcours de vie et du parcours de soins ร travers le numรฉrique.
L’innovation technologique du big data, dont l’Internet des objets (objets connectรฉs), et les stratรฉgies de ciblage, de marketing et de visibilitรฉ auxquelles elles donnent lieu, forcent ร interroger le cadre juridique qui leur est applicable. La visibilitรฉ sur le web implique รฉgalement un questionnement sur la portรฉe des droits fondamentaux ร caractรจre informationnel. Sโil existe une volontรฉ de renforcer les droits des personnes sur leurs donnรฉes, ceux-ci doivent subir de nรฉcessaires limites, de faรงon ร ce que certaines donnรฉes puissent รชtre traitรฉes lรฉgitimement .
Lโutilisation de lโInternet dans le domaine de la santรฉ et des objets connectรฉs laissent des traces dont lโimpact social pour les individus sur lโutilisation de leurs donnรฉes de santรฉ est considรฉrable. Les technologies du big data sont fondรฉes sur le web sรฉmantique et lโinterrogation transversale (data mining) des bases de donnรฉes permet le profilage qui conduit ร exclure tacitement des personnes (COLLOC, 2015). Ces risques dโexclusion ont รฉtรฉ rappelรฉs dans le discours de Edith Ramirez (RAMIREZ, 2014) sous la notion de ยซ discrimination par algorithmeยป consรฉcutif au big data.
La pratique de la mรฉdecine est inconcevable sans lโutilisation des donnรฉes personnelles. Lโexploitation informatisรฉe des donnรฉes personnelles dans le domaine de la santรฉ est trรจs sensible en ce quโelles font intimement partie de la vie des individus et de leur famille. Pour protรฉger la vie privรฉe des individus, le lรฉgislateur a prรฉvu la loi relative ร lโinformatique, aux fichiers et aux libertรฉs depuis 1978 en France complรฉtรฉe rรฉcemment par le rรจglement (UE) 2016/679 du Parlement europรฉen et du Conseil du 27 avril 2016 relatif ร la protection des personnes physiques ร l’รฉgard du traitement des donnรฉes ร caractรจre personnel et ร la libre circulation de ces donnรฉes, et abrogeant ainsi la directive 95/46/CE. Ainsi, la question de la protection de la vie privรฉe des individus รฉtait dรฉjร abordรฉe dans les annรฉes 1970 avant mรชme le dรฉveloppement important des TIC, tรฉmoignant de lโimportance de celle-ci au sein de la population mais รฉgalement au niveau de lโEtat. Elle a abouti ร la crรฉation de la Commission Nationale de lโInformatique et des Libertรฉs (CNIL) . Toutefois, sur le plan individuel, le partage des donnรฉes de santรฉ des personnes ne peut se concevoir quโentre les soignants dans le respect du secret professionnel afin de prรฉserver la confiance dans la relation de soin. Le DMP doit assurer la sรฉcuritรฉ (disponibilitรฉ, intรฉgritรฉ, traรงabilitรฉ, confidentialitรฉ) des donnรฉes. Mais le secret mรฉdical est actuellement remis en question par lโutilisation des TIC comme les clouds administrรฉs le plus souvent ร lโรฉtranger ou des hรฉbergeurs accrรฉditรฉs par le ministรจre de la santรฉ pour le stockage des donnรฉes de santรฉ et lโentrรฉe en jeu dโautres acteurs ne faisant pas partie de lโรฉquipe de soins. Le ยซ privacy shield ยป a donc รฉtรฉ mis en place pour permettre la protection des donnรฉes des ressortissants de lโUnion Europรฉenne transfรฉrรฉes vers les Etats Unis en remplacement du ยซ Safe Harbor ยป. Lโanonymat est devenu pratiquement ยซ impossible ยป ร lโheure du tout numรฉrique. Le concept de ยซ privacy by design ยป est lโune des solutions proposรฉes par Ann Cavoukian (CAVOUKIAN, 2006) pour assurer un minimum de protection des donnรฉes personnelles.
|
Table des matiรจres
1 Introduction gรฉnรฉrale
1.1 Contexte
1.1.1 Rappel historique
1.1.2 Contexte spรฉcifique de la santรฉ
1.2 Problรฉmatique et hypothรจses de recherche
1.2.1 Problรฉmatique des traces numรฉriques et de la privacy dans le cadre du big data et de lโintelligence artificielle
1.2.2 Place de lโรฉthique et questions รฉpistรฉmologiques
1.2.3 Complexitรฉ des questions posรฉes
1.2.4 Intรฉrรชt de notre sujet de thรจse
1.2.5 Objectifs de notre thรจse
2 Mรฉthodologique de la recherche
2.1 Mรฉthodes
2.1.1 Phase exploratoire
2.1.2 Mรฉthode dโenquรชte
2.2 Techniques de recueil de donnรฉes
2.2.1 Technique de questionnaire
2.2.2 Technique dโentrevue ou dโentretien
2.3 Echantillonnage
2.3.1 Population cible
2.3.2 Population dโรฉtude
2.4 Techniques dโanalyse
2.4.1 Techniques dโanalyse qualitative
2.4.2 Techniques dโanalyse quantitative
2.4.3 Logiciels dโanalyse des donnรฉes
2.5 Rรฉalisation des outils de collecte
2.5.1 Guide dโentretien des mรฉdecins
2.5.2 Questionnaire des patients
2.5.3 Guide dโentretien des personnes ressources
2.6 Dรฉroulement des entretiens et remplissage des questionnaires
2.7 Considรฉrations รฉthiques et juridiques
3 Etat de lโart
3.1 Big data
3.1.1 Dรฉfinitions
3.1.2 Description des technologies du big data
3.1.3 Big data et cloud computing
3.2 Intelligence artificielle
3.2.1 Gรฉnรฉralitรฉs
3.2.2 Mรฉthodes utilisรฉes dans le dรฉveloppement de lโIA
3.2.3 Donnรฉes de lโIA
3.2.4 Utilisation de lโIA dans le domaine de la santรฉ
3.3 Textes juridiques de protection des donnรฉes de santรฉ
3.3.1 Dรฉfinitions
3.3.2 Principes
3.3.3 Droits des personnes
3.3.4 Sรฉcuritรฉ et confidentialitรฉ des donnรฉes
3.3.5 Transfert des donnรฉes hors de lโUE
3.4 Ethique
3.4.1 Ethique mรฉdicale ou thรฉorie du principisme
3.4.2 Dรฉontologisme
3.4.3 Utilitarisme
3.4.4 Ethique de la vertu
3.4.5 Prise de dรฉcision en mรฉdecine
4 Systรจme dโaide ร la dรฉcision mรฉdicale ร partir dโun espace vectoriel flou : cas de lโembolie pulmonaire
4.1 Diagnostic de lโembolie pulmonaire
4.1.1 Facteurs de risque thromboemboliques
4.1.2 Stratรฉgie diagnostique
4.2 Espace vectoriel flou : une extension de la logique floue
4.2.1 Proposition dโun espace vectoriel flou
4.2.2 Calcul de la norme de la rรฉsultante des trois vecteurs sur E
4.2.3 Gรฉnรฉralisations ร n paramรจtres
4.2.4 Reprรฉsentation du temps
4.3 Modรจle de la dรฉmarche clinique
4.4 Modรจle temporel flou du diagnostic clinique
4.5 Mรฉthodologie de la conception de notre score diagnostic
4.5.1 Choix des variables
4.5.2 Fonction caractรฉristique des variables
4.6 Intรฉrรชts de lโespace vectoriel flou temporel pour le diagnostic de lโEP
4.7 Mรฉthodologie pour la conception dโun EVFT dans un contexte clinique
4.8 Perspectives
5 Traces numรฉriques et pratique mรฉdicale
6 Conclusion gรฉnรฉrale