Estimation par intervalle de confiance
Statistique descriptive et recherche médicale
La statistique descriptive contient l’ensemble des termes, des définitions et des formules que nous résumons de la manière suivante:
• Une variable statistique est un caractère qui fait le sujet d’une étude statistique dans une population ou dans un échantillon de n individus observé, soumis à une analyse statistique (par exemple le taux des nouveau-nés à CHU Fès), Une variable statistique est dite :
– Qualitative (codage) si elle n’est pas mesurable, une classe contient tous les individus ayant la même modalité. Nous distinguons deux groupes de variables qualitatives :
une variable qualitative nominale dont les classes ne sont pas ordonnées (ex: groupe sanguin).
une variable qualitative ordinale dont les classes sont ordonnées ex: les classes de l’IMC
– Quantitative si elle est mesurable, Nous distinguons deux groupes de variables quantitatives discrètes ou continues :
Une variable statistique est discrète (discontinue) lorsqu’elle ne peut prendre que certaines valeurs xi, exemple : (le nombre de patients qui ont une hypertension, le poids des enfants juste après la naissance…) une classe contient tous les individus ayant la même valeur du caractère (les patientes qui ont pris des contraceptifs oraux, et les patientes qui ne l’ont pas pris).
Une variable statistique est continue lorsqu’elle peut prendre toutes les valeurs d’un intervalle fini ou infini. une classe est un intervalle représentée par son centre, qui est le milieu de l’intervalle.
Statistique inférentielle et recherche médicale
Tests paramétriques
Les tests paramétriques se basent sur des distributions statistiques supposées dans les données.
Par conséquent, certaines conditions de validité doivent être vérifiées pour que le résultat d’un test paramétrique soit fiable.
Les tests paramétriques sont adaptés à de multiples situations et doivent êtres privilégiés chaque fois que cela est possible. Leur utilisation facilite les calculs et les interprétations. Ils sont d’usage courant ce qui aide à la lecture des résultats d’une analyse. Ils sont les plus puissants si leurs conditions d’application sont remplies. Ils sont robustes aux faibles écarts à ces conditions.
Tests non paramétriques
Les tests non-paramétriques ne se basent pas sur des distributions statistiques. Ils peuvent donc être utilisés même si les conditions de validité des tests paramétriques ne sont pas vérifiées. Ils ne nécessitent pas d’estimation de la moyenne et de la variance. En fait, ils n’utilisent même pas les valeurs x recueillies dans les échantillons, mais seulement leur rang dans la liste ordonnée de toutes les valeurs.
Analyse statistique multidimensionnelle et recherche médicale
ACP (Analyse en Composante Principales)
L’ACP est une méthode exploratoire (descriptive) multi-variée de réduction dimensionnelle, son objectif est de condenser l’information d’un tableau (n individus décrits par p>3 variables numériques), de manière à retirer les relations vraiment caractéristiques : proximités (corrélations) entre variables et ressemblance entre individus, ceci en limitant la perte d’information.
La classification
Les méthodes de classification ou de typologie ont une utilité assez importante dans le domaine médicale, elles ont pour but de regrouper les individus en un nombre restreint de classes homogènes. Par exemple, imaginez une étude dans laquelle un chercheur en médecine a collecté des données sur diverses mesures d’aptitude physique (variables) dans un échantillon de patients cardiaques (observations). Le chercheur peut créer des classes d’observations (patients) afin de détecter les groupes de patients présentant des symptômes similaires. Dans le même temps, le chercheur peut réaliser des classes de variables (mesures de l’aptitude physique) afin de détecter les classes de mesures qui semblent révéler les mêmes capacités physiques.Il s’agit de décrire les données en procédant à une réduction du nombre des individus.Les méthodes de classification reposent sur la notion de dissimilarité (distance) entre les objets que l’on souhaite regrouper en classes homogènes.
Segmentation d’images médicales
Le but du traitement des images médicales est d’extraire à partir des images acquises, les informations utiles au diagnostique, de révéler des détails difficiles à percevoir à l’œil nu, tout en évitant la création d’artefacts, faussement informatifs. Pour cela le traitement fait appel à des outils, des algorithmes, qui permettent d’agir sur l’image numérisée. La reconstruction de forme, les segmentations, les quantifications, l’analyse fonctionnelle, jusqu’aux simulations (organes virtuels, malades virtuels), tous ces outils de traitement ont contribué à l’amélioration de la qualité des images acquises, à leur interprétation et surtout à une meilleure approche au diagnostic. Elle joue un rôle important dans la détection des microcalcifications à un stade précoce, ce qui va nous aider à éviter d’avoir recours au traitement radical comme l’ablation du sein.
La segmentation d’images est une opération fondamentale et importante, c’est l’étape préliminaire a à tout traitement d’images.
La segmentation consiste à rassembler des pixels d’une image entre eux en formant des régions connexes, homogènes et bien séparées. Ces régions possèdent une certaine uniformité pour une ou plusieurs caractéristiques (intensité, couleur, texture, …) et sont différentes pour au moins une de ses caractéristiques des régions voisines(R).
Le big data dans la recherche médicale
Le Big Data, ce sont des montagnes de données stockées sur des serveurs, dans d’immenses entrepôts. Et parmi toutes ces données, certaines concerneront l’histoire médicale de chaque personne, accessible au médecin via un futur dossier médical informatisé. Il indiquera tous les éléments utiles du patient depuis la naissance, comme le carnet de vaccination, les maladies chroniques… Il suivra le patient dans le temps et l’espace et deviendra un vrai outil de coordination des soins.
Alors les données de santé peuvent être collectées:
1- Des informations patientes récoltés en ville et à l’hôpital et des données de recherche.
2- Des objets connectés et des conversations sur internet.
3- De l’analyse du génome humain…
Depuis le séquençage du premier génome humain en 2001, le coût du séquençage a été divisé par plus de 100000, et il est aujourd’hui possible de séquencer un individu en quelques jours pour environ 1000 dollars (Figure 9); le séquençage est ainsi entrain de devenir un examen de routine, générant environ 100 Go de données par échantillon.
|
Table des matières
Remerciements
Dédicaces
Introduction
Partie 1: Statistique descriptive et recherche médicale
I. Notions de base
II. Exemple de la statistique descriptive dans la recherche médicale
III. Conclusion
Partie 2 : Statistique inférentielle et recherche médicale
I. Echantillonnage
1) Estimation ponctuelle
1.1) Principe
1.2) Exemples
2) Estimation par intervalle de confiance
2.1) Principe
2.2) Exemple : Application de la SI sur les données médicales
II. Tests statistiques
1) Tests paramétriques
1.1) Test t de Student
1.1.1) Test de Student pour échantillon unique et exemple
1.1.2) Test t de Student pour échantillons indépendants et exemple
1.1.3) Test-t de Student pour échantillons appariés
1.2) Test de khi deux
1.2.1) principe
1.2.2) Exemple dans la recherche médicale
1.3) L’analyse de variance l’ANOVA
1.3.1) principe
1.3.2) Exemple
2) Tests non paramétriques
2.1) Test de normalité (Shapiro-Wilk)
2.1.1) Principe
2.1.2) Exemple
2.2) Test de Levene (test d’homogénéité des variances)
2.2.1) Principe
2.2.2) Application
2.3) Test de Wilcoxon (le test des rangs signés de Wilcoxon)
2.3.1) Principe
2.3.2) Exemple
2.4) Test de Kruskal-Wallis
2.4.1) Principe
2.4.2) Exemple
3) Conclusion
Partie 3 : Analyse statistique multidimensionnelle et recherche médicale
I. Analyse des données
1) ACP (Analyse en Composante Principales)
1.1) Principe
1.2) Application et interprétation de l’ACP en recherche médicale
2) La classification
2.1) La classification ascendante hiérarchique(CAH)
2.2) La classification non hiérarchique
2.3) Application de Classification
2.4) Conclusion
II. Segmentation d’images médicales
1) Approche par classification
1.1) Principe
1.2) Application en recherche médicale
2) Approche contours
III. Le big data (Analyse des données en masse)
1) Définition
2) Traitement big-data
3) Le big data dans la recherche médicale
3.1) Les différentes applications du Big Data dans la recherche médicale
3.2) Le big data pour une médecine préventive
4) Conclusion
Conclusion générale
Bibliographie et web-graphie
Télécharger le rapport complet