Les suspicions de fractures du squelette appendiculaire représentent le premier motif de consultation au sein des urgences pédiatriques (1), avec un taux correspondant à plus d’un tiers des admissions. L’exploration de ces patients repose sur l’imagerie médicale et plus particulièrement, en première intention, sur la radiographie standard (2). Cette modalité d’imagerie est relativement accessible tant sur le plan économique que technique. Elle représente, de ce fait, la principale méthode d’imagerie dans le monde (3)(4). Bien qu’accessible, l’interprétation des radiographies traumatiques du squelette appendiculaire demande une expertise certaine, a fortiori lorsqu’il s’agit de radiographies pédiatriques où les différentes phases de croissance osseuse et les variantes anatomiques peuvent prêter à confusion et se révéler être une source d’erreurs diagnostiques (5)(6). Le territoire français présente une carence en médecins spécialisés en radiologie avec une forte disparité territoriale. Cette disparité est encore plus marquée quand il s’agit de radiologie-pédiatrique, discipline principalement pratiquée dans les centres hospitalouniversitaires (7)(8).
CONFLITS D’INTERETS ET AFFILIATION A L’ENTREPRISE GLEAMER
L’étude en objet, a été menée et écrite par des praticiens hospitaliers non rémunérés et non affiliés à l’entreprise Gleamer. Ladite entreprise, développant le logiciel d’IA, n’a financé par aucun moyen les différentes étapes de l’étude. En outre, les professionnels de santé n’ont aucun conflit d’intérêts à déclarer en lien avec le sujet d’étude.
AUTORISATION DE L’ETUDE ET PROTECTION DES DONNEES PERSONNELLES
La présente étude a fait l’objet d’une approbation préalable par le Conseil d’Administration de l’Hôpital Nord de Marseille. Conformément au RGPD, les modalités de mise en place de l’étude n’ont pas nécessité le consentement du patient. En conséquence, un numéro RGPD a été attribué à l’étude par le délégué à la protection des données de l’A.P.H.M.
LOGICIEL D’INTELLIGENCE ARTIFICIELLE D’AIDE A LA DETECTION DE FRACTURES : BONEVIEW®
Notre étude et les interprétations radiologiques qui en découlent, se basent sur l’utilisation d’un logiciel d’IA d’aide à la détection des fractures mis à notre disposition par l’entreprise française Gleamer, nommé Boneview®. L’ensemble de données d’entraînement comprenait 15% de patients âgés de moins de 18 ans. Le logiciel Boneview®, d’aide à la détection de fracture, a été développé à partir d’un ensemble de données provenant de 312 602 radiographies de patients souffrants de traumatismes. Ces patients ont été hospitalisés dans plus de 60 services de radiologie privés français, de janvier 2011 à mai 2021. Sur la base de cet échantillon de données, divisé de manière aléatoire en 70% d’ensemble d’entraînement, 10% de validation et 20% de tests internes, un réseau neuronal de deep-learning, basé sur le framework « Detectron 2 » (7), a été conçu, entraîné, optimisé et validé pour détecter et localiser les fractures sur radiographies numériques à résolution native. L’ensemble de données d’entraînement comprenait 15% de patients âgés de moins de 18 ans. Ce système d’IA met en évidence chaque région d’intérêt par une case et fournit un score de confiance concernant l’existence d’une fracture dans la région d’intérêt.
Ladite intelligence artificielle affiche l’information « fracture » dès lors que la certitude diagnostique avoisine les 90 % ou « doute fracture » lorsque la certitude diagnostique est comprise entre 70 et 90 %.
MATERIEL UTILISE POUR LES RADIOGRAPHIES
Les tables de radiographie utilisées pour réaliser les examens des patients venant consulter au service d’accueil des urgences pédiatriques de l’Hôpital Nord de Marseille, sont des tables PHILIPS® capteur plan. Les incidences en cas de traumatisme sont acquises en face et profil. Aucune incidence oblique n’a été réalisée chez les patients de notre étude et aucun cliché comparatif n’a été réalisé.
POPULATION ETUDIEE ET CRITERES D’INCLUSION/EXCLUSION DES PATIENTS DANS L’ETUDE
L’échantillon de 400 examens radiographiques, correspondant à 804 radiographies, utilisé au cours de l’étude, a été construit rétrospectivement à partir du 31 janvier 2020. Une recherche ante-chronologique, dans la base de données d’examens radiologiques, a permis de réunir 100 patients consécutifs, ayant fait l’objet d’une exploration radiographique lors d’une consultation aux urgences pédiatriques à l’hôpital Nord de Marseille, pour l’examen des articulations du coude, du poignet, du genou et de la cheville. L’ensemble des radiographies sélectionnées a été pris à un moment (t) unique pour chaque patient, moment correspondant à la consultation initiale aux urgences. Les patients sélectionnés devaient avoir moins de 16 ans, avoir été admis au service d’accueil des urgences pédiatriques de l’hôpital Nord de Marseille pour traumatisme et avoir bénéficié d’un examen radiographique d’une des quatre articulations précitées. Les patients présentant une incertitude sur leur âge ou un historique clinique flou, avec une notion traumatique incertaine, n’ont pas été retenus. Le suivi du patient après le traumatisme a été vérifié grâce au dossier patient informatisé (Axigate ®) afin d’exclure les dossiers dont l’évolution clinique n’était pas en faveur du diagnostic initial. Les radiographies de contrôle « post-réduction d’une luxation » ou « réfection de plâtre » ont également été exclues de l’analyse de la présente étude.
ANONYMISATION DES DONNEES A CARACTERE PERSONNELLE
Dans le but de garantir une anonymisation des données relatives aux patients, deux étapes de codification ont été nécessaires. La première étape a associé le nom du patient à un numéro d’hospitalisation. Ledit numéro d’hospitalisation a, par la suite, été remplacé par un numéro, créer aléatoirement, non rattachable au nom du patient. Cette codification aléatoire a permis une interprétation anonymisée de l’ensemble des examens inclus dans l’étude tel que le prévoit la loi sur la protection des données personnelles.
LECTURE ET INTERPRETATION DES IMAGERIES MEDICALES
L’ensemble des 400 examens radiographiques, recueilli dans le cadre de l’étude, a été interprété par un radiologue senior spécialisé en radiopédiatrie ayant plus de 20 ans d’expérience (Pr. K.Chaumoître et Pr. M.Panuel). Ces imageries ont également fait l’objet d’une interprétation par un Interne de radiologie en fin de cursus (M. A. Planche). Les lecteurs étaient aveugles aux comptes rendus des autres radiologues impliqués ainsi qu’au diagnostic formulé par l’IA. L’ensemble des interprétations a été réalisé sur des consoles de radiologie dédiées, sans limite de temps et avec l’accès au « bon d’examen », comportant les données cliniques du patient, rédigées par le médecin urgentiste. Il doit être notifié, qu’afin d’être en adéquation avec les capacités de détection du logiciel Boneview®, que la recherche d’épanchement sur les imageries recueillies a été secondairement exclue. Un tel épanchement ne pouvant être détecté par l’IA que dans la région du coude, sa prise en compte aurait entravé l’homogénéité des résultats. Par la suite, les imageries médicales ont été extraites du serveur de l’Assistance Public Hôpitaux de Marseille sous format DICOM, anonymisées et envoyées, de manière sécurisée, à la société Gleamer. Après traitement de ces examens, par le logiciel d’aide à la détection de fracture Boneview®, un envoi sécurisé des résultats obtenus à destination de l’Interne de radiologie a été effectué.
Ultérieurement, l’Interne a réalisé une nouvelle interprétation, en aveugle de sa précédente analyse, de l’ensemble des examens d’imagerie recueillis avec l’aide du logiciel d’intelligence artificielle Boneview®. Après cette seconde interprétation, l’Interne n’a modifié son compte-rendu dans le seul cas où, le logiciel Boneview® avait décelé une fracture non visualisée lors de sa première interprétation. A contrario, les comptes rendus n’ont fait l’objet d’aucune normalisation dès lors que l’IA signifiait une absence de fracture. Un défaut de confiance dans les performances de l’intelligence artificielle, notamment dans sa spécificité, a conduit l’Interne à ne prendre en considération que les diagnostics dits « en excès ». Les comptes rendus résultants desdites interprétations, rédigés par l’Interne et le senior, ont été classés de manière binaire en deux catégories : « présence d’une fracture ou doute sur l’existence d’une fracture » versus « pas de fracture visible sur l’imagerie ». La même dichotomie catégorielle a servi de classification à l’interprétation des imageries faites par le logiciel Boneview®.
|
Table des matières
Introduction
Matériels et Méthodes
Conflits d’intérêts et affiliation à l’entreprise Gleamer
Autorisation de l’étude et protection des données personnelles
Logiciel d’Intelligence Artificielle d’aide a la détection de fractures : Boneview®
Matériel utilisé pour les radiographies
Population étudiée et critères d’inclusion/exclusion des patients dans l’étude
Anonymisation des données à caractère personnelle
Lecture et interprétation des imageries médicales
Analyse statistique des données recueillies
Résultats
Caractéristiques de la population étudiée
Interprétations radiologiques, analyse par articulation
• Coude
• Poignet
• Genou
• Cheville
Interprétations radiologiques, analyse générale des concordances diagnostiques
• Senior et Interne, sans le concours de l’intelligence artificielle, analyse des
concordances diagnostiques
• Interne et IA, analyse des concordances diagnostiques
• Senior et IA, analyse des concordances diagnostiques
• Senior et Interne, avec le concours de l’intelligence artificielle, analyse des
concordances diagnostiques
Significativité statistique de la modification des performances et de la concordance
diagnostique
Discussion
Conclusion
Bibliographie