Application de la théorie de mesure de Rasch à la recherche clinique

La mesure et la métrologie

Qu’est-ce qu’une mesure ? Le terme lui-même revêt plusieurs sens. En effet, en Français comme en Anglais, la mesure peut désigner l’entité qui est mesurée (par exemple, dans la phrase : « la longueur est une mesure géométrique »), le procédé de mesure (« cette mesure a été difficile à réaliser »), et le résultat de ce procédé (« cette mesure permet de prendre une décision »). [1] Cet exemple témoigne d’emblée des difficultés définitionnelles associées à ce domaine. La définition de la mesure la plus célèbre est probablement celle de Stevens, selon lequel mesurer est « l’attribution de valeurs numériques à des objets ou évènements selon des règles » La question étant, bien sûr, de savoir quelles sont ces règles .

La métrologie, qui est la science de la mesure, a pour objectif de répondre à cette question. Elle définit les principes et les méthodes permettant de garantir et maintenir la confiance envers les mesures résultant des procédés associés (les procédés de mesure). Il s’agit d’une science transversale qui s’applique dans tous les domaines où des mesures sont effectuées. Le but de la mesure est d’attribuer des nombres (quantités) aux caractéristiques d’un objet considéré (grandeurs), de manière fiable en lien avec son utilisation.

Les humains cherchent à mesurer les objets et concepts qui les entourent depuis des temps très anciens. Initialement, la mesure a avant tout un usage économique. Des études suggèrent que des premières mesures étaient effectuées en -6000 avant JC en Mésopotamie, sur la base de boules d’argile. [2] Celles-ci étaient utilisées afin de mesurer le volume des récoltes afin d’en assurer un partage équitable. La mesure était alors basée sur un processus de comptage. Très tôt, des références ont ensuite été introduites, afin d’assurer la fiabilité des mesures en vue d’échanges économiques. Il s’agit des premières unités de mesure, basées par exemple sur la longueur d’un bâton comme c’était le cas en Mésopotamie avec la « Coudée de Gudéa ». [4] Le premier système d’unités cohérent (le système métrique initié lors de la Révolution française) fut consacré sur le plan international par un traité diplomatique lors de la Convention du mètre du 20 mai 1875. [5] Le Bureau International des Poids et Mesures (BIPM) est alors créé. En 1960, lors de la onzième Convention Générale des Poids et Mesures (CGPM), apparaît le Système International d’unités, le SI, qui comprend à ce jour deux classes d’unités: les unités de base, au nombre de sept, et les unités dérivées. De nos jours, la métrologie est utilisée dans de nombreux domaines de l’économie, de l’industrie et de la recherche, mais également dans des applications du quotidien.

En plus de la métrologie énoncée précédemment, la science de la mesure que l’on peut qualifier de métrologie fondamentale, on distingue également la métrologie légale. Celleci représente un ensemble d’exigences et de procédures imposées par les états afin de garantir la qualité et la fiabilité de certains instruments de mesure ou d’opérations de mesurage touchant l’intérêt public : la sécurité des personnes, la protection des consommateurs, de l’environnement et de la santé, la loyauté des transactions commerciales ou encore la bonne application des lois et des règlements. Devant la mondialisation et la multiplicité des échanges qu’elle engendre, des organisations internationales se sont réunies, depuis quelques décennies, pour définir des guides métrologiques. L’un de ces guides est le Vocabulaire International de Métrologie (VIM), publié par le Comité Commun pour les Guides en Métrologie (ou « Joint Committee for Guides in Metrology », JCGM). [6] Le JCGM était constitué à l’origine de représentants du BIPM, de la Commission électrotechnique internationale (CEI), de la Fédération internationale de chimie clinique et de biologie médicale (IFCC), de l’Organisation internationale de normalisation (ISO), de l’Union Internationale de Chimie Pure et Appliquée (UICPA), de l’Union Internationale de Physique Pure et Appliquée (UIPPA) et de l’Organisation Internationale de Métrologie Légale (OIML). En 2005, la Coopération internationale sur l’agrément des laboratoires d’essais (ILAC) a rejoint officiellement les sept organisations internationales fondatrices.

En santé, la métrologie joue un rôle dans la fiabilité des mesures dites physiques, issues de la physique, chimie et biologie : la température mesurée par un thermomètre, la concentration dans un dosage biologique mesurée par un analyseur en biologie médicale, etc. En revanche, les mesures issues des sciences sociales (psychologie, sciences de l’éducation) n’ont pas formellement, en pratique, trait à la métrologie, dans le sens où elles ne répondent pas actuellement de manière systématique aux standard métrologiques. Le VIM ne considère d’ailleurs pas l’application de ses principes et termes aux sciences sociales. [6] Pourtant, la quantification de concepts d’intérêt est bien présente en sciences sociales, par exemple lors de la production de « scores » dans les tests d’aptitude, ou dans la mesure d’un état de santé perçu. Ces mesures présentent des critères de qualité ou de validité, qui peuvent se rapprocher des critères métrologiques. Par ailleurs, ces mesures étant parfois utilisées en lien avec des enjeux majeurs, on peut supposer, ou du moins souhaiter, que les principes métrologiques s’appliquent aux sciences sociales. Un certain nombre de travaux s’intéresse ainsi à appliquer les principes métrologiques aux sciences sociales. Parmi ceux-ci, on peut citer les travaux de William P. Fisher Jr, Stefan Cano, Leslie Pendrill ou Andrew Maul, entre autres.

La mesure d’attributs subjectifs en santé et les mesures dites « Patient-Reported Outcomes » (PROs)

Les dernières décennies ont vu un intérêt croissant en santé et recherche clinique pour la perception du patient. S’intéresser au patient en tant que sujet pensant et sensible implique la mesure de grandeurs qui sont par définition subjectives : le niveau d’anxiété, de fatigue ou de douleur, par exemple. Par opposition, les mesures de grandeurs physiques sont considérées comme « objectives ». Un exemple d’attribut subjectif est constitué par la qualité de vie. L’Organisation mondiale de la Santé (OMS) définit la santé comme « un état de complet bien-être physique, mental et social, [qui] ne consiste pas seulement en une absence de maladie ou d’infirmité ». [11] La santé est ainsi prise en compte dans sa globalité. Elle est associée à la notion de bien-être. Ceci a amené au concept de qualité de vie dans les années 1970, qui sera définie ainsi par l’OMS en 1993: « La qualité de vie est définie comme la perception qu’un individu a de sa place dans la vie, dans le contexte de la culture et du système de valeurs dans lequel il vit, en relation avec ses objectifs, ses attentes, ses normes et ses inquiétudes. C’est donc un concept très large qui peut être influencé de manière complexe par la santé physique du sujet, son état psychologique et son niveau d’indépendance, ses relations sociales et sa relation aux éléments essentiels de son environnement” .

Plus précisément dans le cas de la santé, soit dans l’évaluation de l’impact des maladies et des traitements, on considère la notion de « qualité de vie associée à la santé » (ou « Health Related Quality of Life », HRQoL). Avec le développement de l’évaluation de la qualité de vie, on considère ainsi que d’autres critères que les mesures de grandeurs physiques traditionnelles, comme par exemple la survie, sont pertinents (sans pour autant remettre en question l’importance de ceux-ci). Ceci est particulièrement important dans le cas des maladies chroniques (et avec la « chronicisation » de certaines maladies), où les patients vivent avec la maladie.

La qualité de vie s’inscrit, comme d’autres attributs subjectifs, dans le champ des «Patient-Reported Outcomes » (PROs). Les mesures PROs sont définies par la Food and Drug Administration (FDA), comme : « La mesure de tout aspect de l’état de santé du patient qui provient directement de ce patient (c’est-à-dire, sans interprétation des réponses du patient par un clinicien ou une quelconque autre personne) ». [13] En pratique ces mesures PROs prennent la forme de questionnaires remplis le plus souvent directement par le patient. Ces questionnaires sont constitués d’items (ou questions) qui comportent le plus souvent plusieurs catégories de réponses qui expriment différents niveaux de la grandeur ou concept d’intérêt mesuré (par exemple, le niveau de fatigue, d’anxiété ou de dépression, l’impact de la maladie sur les activités quotidiennes, etc.). Ces catégories de réponses ou options sont au minimum de 2 (items dichotomiques, de type « oui » ou « non »), mais peuvent être plus nombreuses (items polytomiques, de type échelles de Likert, où les catégories de réponses sont classées dans l’ordre croissant ou décroissant du niveau du concept d’intérêt mesuré, par exemple « jamais fatigué », « parfois fatigue », « souvent fatigué » etc.). On peut aussi trouver des échelles visuelles analogiques (EVA), où le patient indique son niveau de concept mesuré sur une ligne continue (par exemple, il positionne un trait correspondant à son niveau de douleur, sur une échelle allant de 0 à 100).

Par opposition aux mesures traditionnellement utilisées en santé, qui mesurent des grandeurs physiques, les mesures PROs ont pour objectif de mesurer des grandeurs non physiques, qui sont qualifiées de variables ou de traits « latents ». On qualifie souvent le trait latent de variable « non-observable », en considérant que ces variables sont reflétées par les réponses du patient aux items, qui sont, elles, observables (variables dites « manifestes »). De ces réponses aux items est dérivée un nombre ou quantité qui représente le niveau de trait latent (qui peut être, dans le cas le plus simple, la somme des réponses aux différents items). Parce que la mesure des attributs subjectifs fait appel à la perception des patients, ces mesures PROs ont traditionnellement trait à la psychométrie, qui est la science de la mesure des caractéristiques psychologiques des individus. Afin d’assurer une bonne mesure des concepts d’intérêt ciblés, le développement et la validation de ces mesures PROs passe par plusieurs étapes, dites quantitatives et qualitatives. Ces étapes peuvent être conduites de manière séquentielle, ou, en particulier dans le cas de méthodes dites « mixtes », se compléter de manière simultanée ou parallèle de manière à s’informer mutuellement. [14] La recherche dite qualitative comprend l’élaboration d’un cadre conceptuel pour le concept ou grandeur d’intérêt, comme par exemple, caractériser les différentes composantes de la fatigue ressentie chez les patients atteints de sclérose en plaques. Ceci peut se faire par revue de la littérature et par entretiens avec des patients. Les items sont ensuite formulés sur cette base, et leur pertinence est ensuite évaluée par des entretiens avec les patients (évaluation de la validité du contenu). Un second aspect est associé à de la recherche quantitative, sur la base des réponses des patients aux items de la mesure PRO.

Les analyses quantitatives pour le développement et la validation des mesures PROs s’inscrivent dans différents paradigmes ou théories. Parmi celles-ci, on trouve la théorie classique des tests (ou « Classical Test Theory », CTT [15-18]), la théorie de la réponse à l’item (ou « Item Response Theory », IRT [15, 17]) et la théorie de la mesure de Rasch (ou « Rasch Measurement Theory », RMT [19]). La CTT considère le calcul d’un score pour l’individu, à partir de la somme des réponses aux items. En ce sens, les approches de validation basées sur la CTT se font à l’échelle de ce score (reproductibilité, sensibilité au changement au cours du temps, corrélation du score avec des mesures de concepts proches…). Les analyses basées sur l’IRT et la RMT utilisent des modèles probabilistes de réponse aux items, et informent sur la capacité des items à constituer une mesure cohérente du concept d’intérêt. La RMT, basée sur le modèle de Rasch, en particulier, présente des propriétés intéressantes qui permettent une évaluation de la mesure PRO qui est indépendante du niveau de trait latent des patients de l’échantillon considéré pour la validation. Cette caractéristique essentielle fait que la RMT, basée sur le modèle de Rasch, a précédemment été mise en avant concernant son intérêt pour l’obtention de mesures qui satisfont les exigences de la métrologie. [20-22] Ces différentes théories sont utilisées dans les études quantitatives pour le développement et la validation des mesures PROs. La CTT reste toutefois aujourd’hui largement prédominante.

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

1 INTRODUCTION
1.1 LA MESURE ET LA MÉTROLOGIE
1.2 LA MESURE D’ATTRIBUTS SUBJECTIFS EN SANTÉ ET LES MESURES DITES « PATIENT-REPORTED OUTCOMES » (PROS)
1.3 LA MESURE DE L’EFFET DU TRAITEMENT DANS LES ESSAIS CLINIQUES
1.3.1 Présentation
1.3.2 Caractéristiques et difficultés rencontrées avec les critères de jugement PROs
2 OBJECTIF
3 ETAT DES CONNAISSANCES
3.1 LA MÉTROLOGIE
3.1.1 La traçabilité et l’étalonnage
3.1.2 L’incertitude de mesure
3.2 LA PSYCHOMÉTRIE
3.2.1 Introduction et historique
3.2.2 Les différents paradigmes en psychométrie
3.3 LIENS ENTRE MÉTROLOGIE ET PSYCHOMÉTRIE
3.4 LE MODÈLE DE RASCH
3.4.1 Le modèle de Rasch pour les items dichotomiques
3.4.2 Méthodes d’estimation des paramètres du modèle
3.4.3 Extension du modèle de Rasch aux items polytomiques
3.4.4 Méthodes de comparaison des groupes de traitement dans un essai clinique
4 L’ESSAI CLINIQUE : UN SYSTÈME DE MESURE
4.1 INTRODUCTION
4.2 OBJECTIF DE L’ESSAI CLINIQUE : QUE CHERCHE-T-ON À MESURER ?
4.3 LE VOCABULAIRE DE MÉTROLOGIE APPLIQUÉ AU CONTEXTE DES ESSAIS CLINIQUES
4.4 REPRÉSENTATION GRAPHIQUE DU SYSTÈME DE MESURE
4.5 DISCUSSION
5 L’INCERTITUDE DE MESURE DANS LES ESSAIS CLINIQUES
5.1 INTRODUCTION
5.2 LES SOURCES D’INCERTITUDE DE MESURE DANS LES ESSAIS CLINIQUES
5.3 EXPRESSION DE L’INCERTITUDE DE MESURE
5.4 DISCUSSION
6 L’ÉTALONNAGE DANS LES ESSAIS CLINIQUES
6.1 INTRODUCTION
6.2 ARTICLE : « EVALUATING THE IMPACT OF CALIBRATION OF PATIENT-REPORTED OUTCOMES MEASURES ON RESULTS FROM RANDOMIZED CLINICAL TRIALS: A SIMULATION STUDY BASED ON RASCH MEASUREMENT THEORY »
6.3 ELÉMENTS ADDITIONNELS
7 DISCUSSION GÉNÉRALE
7.1 APPORTS DE CES TRAVAUX
7.2 PROPOSITIONS POUR LES CRITÈRES DE JUGEMENT PROS DANS LES ESSAIS CLINIQUES
7.3 FREINS À L’ADHÉSION À CES PROPOSITIONS
7.4 PERSPECTIVES
8 CONCLUSION
RÉFÉRENCES
ANNEXES