Télécharger le fichier pdf d’un mémoire de fin d’études
BCI dépendant et indépendant
Même si les BCI n’utilisent que la mesure de l’activité cérébrale, certains nécessitent que l’utilisateur ait un certain contrôle de ses muscles, par exemple la capacité à contrôler la direction du regard (Section 1.3.1). Ceux-ci sont les BCI dépendants. La plupart des BCI utilisant des Potentiels Evoqués Visuels (PEV) sont dépendants [Gao et al., 2003].
Certains handicaps ne permettent pas le moindre contrôle musculaire. Dans ce cas, un BCI indépendant est obligatoire. Ces derniers utilisent les potentiels corticaux lents, les potentiels P300 évoqués ou le contrôle des rythmes β et µ [Pfurtscheller et al., 2000].
Les BCI dépendants sont plus robustes et plus faciles à utiliser. Ils sont destinés à des personnes valides pour des applications plutôt ludiques telles que les jeux vidéo. Les BCI indé-pendants, pour le moment sujets à un taux d’erreur par bit (probabilité d’erreur de l’interface pour une action) plus important, sont destinés à des applications dans le domaine médical pour des personnes souffrant de grands handicaps moteurs.
BCI invasif et non invasif
La distinction entre ces deux types de BCI se fait par la manière dont l’activité cérébrale est enregistrée.
Les capteurs utilisés pour les BCI invasifs sont placés sous le crâne, alors que pour les méthodes non invasives ils sont placés à sa surface.
Les méthodes invasives sont réputées avoir des signaux plus faciles à traiter et donc de meilleures performances. Cependant des opérations lourdes à intervalles réguliers sont néces-saires.
Les signaux obtenus avec des méthodes non invasives sont beaucoup plus bruités et donc plus durs à utiliser (le signal enregistré passe à travers la boîte crânienne avant d’atteindre les capteurs), mais le placement des capteurs est beaucoup moins contraignant.
On pense souvent que les méthodes invasives sont plus performantes, cependant ceci reste à confirmer et est encore débattu au sein de la communauté. Même si les signaux des méthodes non invasives sont plus bruités, certaines études montrent que les deux méthodes peuvent atteindre des taux de transfert d’information (nombre de bits par minutes) similaires. Wolpaw et McFarland [2004] montrent qu’avec un algorithme adapté, un BCI non invasif peut atteindre des perfor-mances similaires à celles des BCI invasifs en terme de nombre de commandes à reconnaître.
Les techniques non invasives sont actuellement les plus utilisées.
BCI synchrone et asynchrone
Pour les méthodes synchrones, l’utilisateur doit effectuer la tâche mentale sur des périodes de temps imposées, au contraire des BCI asynchrones où l’utilisateur peut effectuer la tâche mentale à n’importe quel moment.
A terme le but serait que toutes les BCI soient asynchrones. Cependant elles sont dans ce cas beaucoup plus difficiles à mettre en œuvre car l’activité cérébrale doit être analysée en continu pour déterminer quand l’utilisateur souhaite interagir avec le système. Et une fois cet instant déterminé, l’interface doit être capable de déterminer l’état mental de l’utilisateur.
La complexité de la mise en œuvre de systèmes asynchrones fait que la majorité des BCI sont synchrones. Toutes les classes de BCI présentées précédemment fonctionnent sur le même
principe. Le système dans son ensemble, représenté figure 1.1 :
– mesure l’activité cérébrale,
– extrait des caractéristiques du signal,
– utilise ces caractéristiques pour déterminer l’intention de l’utilisateur,
– transforme la décision du classifieur en commande,
– renvoie à l’utilisateur un retour de la décision du système.
1.2 Mesure de l’activité cérébrale
Il existe de nombreuses techniques pour mesurer l’activité cérébrale :
– Magnétoencephalographie
– Imagerie à résonance magnétique fonctionnelle
– Electrocorticographie : électrodes posées à la surface du cortex
– Electrodes implantées dans le cerveau
– Electroencéphalographie (EEG) : électrodes posées à la surface du scalp
C’est cette dernière technique qui est le plus souvent utilisée et qui nous intéressera plus particulièrement. Elle est peu coûteuse, non invasive, portable et fournit une bonne résolution temporelle.
Les signaux EEG sont enregistrés à l’aide d’électrodes (de 1 à 256) placées à la surface du scalp et maintenues généralement grâce à un casque. Afin de minimiser l’impédance entre les électrodes et le crâne, un gel ou une pâte conducteurs sont utilisés, ce qui peut être long et fastidieux à installer.
Certains systèmes n’utilisent pas de gel, cependant leurs performances sont moindres.
Le placement des électrodes se fait suivant le modèle standard « 10-20 international system » représenté figure 1.2 (conçu pour 19 électrodes mais pouvant être étendu à plus).
Chaque électrode est référencée par une lettre et un chiffre ou la lettre « z ». La première lettre indique le lobe du cerveau dont l’activité est enregistrée et le chiffre l’hémisphère considéré (droit : chiffres pairs, gauche : chiffre impair et ligne médiane : « z »). Sur la figure 1.3 sont représentées les principales parties du cerveau. L’activité électrique du lobe :
– frontal est associée aux électrodes commençant par « F » ou « C ». Il n’existe pas de lobe central et la lettre « C » est juste introduite dans un but de différenciation.
– pariétal est associée aux électrodes commençant par « P »,
– occipital est associée aux électrodes commençant par « O »,
– temporal est associée aux électrodes commençant par « T ».
Les lettres « A » et « G » correspondent respectivement aux électrodes de référence et à la masse.
Il est possible d’utiliser plus de 19 électrodes pour enregistrer les signaux EEG. Dans ce cas certaines électrodes seront référencées par deux lettres au lieu d’une seule. Par exemple, on peut avoir l’électrode FCz. Cette électrode sera placée entre les électrode Fz et Cz.
L’EEG mesure la somme des potentiels post-synaptiques générés par des milliers de neurones qui ont la même orientation radiale par rapport au scalp. Selon une terminologie médicale, les ondes cérébrales sont composées de différents rythmes :
– Delta : fréquence inférieure à 4Hz, c’est le rythme dont l’amplitude est la plus élevée. Il s’observe chez les adultes en état de sommeil profond, et est localisé principalement dans le cortex frontal.
– Thêta : fréquence entre 4 et 7Hz. Il s’observe surtout chez les jeunes enfants ou chez l’adulte lors de somnolence ou de phase d’éveil. Il est aussi associé à des états de méditation ou de relaxation.
– Alpha : fréquence comprise entre 8 et 13Hz et d’amplitude comprise entre 30 et 50µV. Ce rythme s’observe dans le cerveau d’une personne au repos, yeux clos, et prédomine dans les cortex pariétaux, occipitaux et temporaux. Il s’interrompt dès lors qu’une stimulation est appliquée (blocage alpha aussi appelée réaction d’arrêt) ou que le sujet démarre une activité intellectuelle. Ce rythme, présent dès les premières années de l’enfant, se développe avec l’âge.
– Mu : fréquence comprise entre 8 et 13Hz (principalement 9-11Hz). C’est un cas particulier de rythme alpha. Observable en situation de veille à partir du cortex frontal et pariétal. D’amplitude inférieure à 50 µV, il émerge principalement de l’activité du cortex moteur mais également du cortex sensoriel. Il est bloqué ou largement diminué par l’initiation d’un mouvement, ou seulement sa préparation mentale, ainsi que par une stimulation tactile.
– Bêta : fréquence supérieure entre 13 et 30Hz et d’amplitude faible caractérisant le tracé encéphalographique de l’éveil. Le rythme bêta est un rythme rapide observable principale-ment durant l’éveil lorsque le sujet est alerte et traite de l’information, et s’atténue pendant l’endormissement. Ce rythme trouve son origine dans les régions antérieures (frontales) et pariétales du cortex, ce qui explique que certains auteurs l’associent à l’émergence de la conscience.
– Gamma : fréquence élevée supérieure à 30Hz et d’amplitude légèrement supérieure à celle du rythme bêta, caractérisant l’activité consciente, les processus cognitifs en phase d’éveil, et présent également lors de la phase de sommeil paradoxal. Cependant l’activité motrice entraîne une décohérence significative de ce rythme.
Les types de signaux utilisés pour contrôler les BCI
Les BCI actuels peuvent être divisés en 2 groupes principaux selon les types de signaux utilisés.
– Les signaux évoqués : ils sont générés de manière inconsciente par l’utilisateur en réponse à un stimulus extérieur. Ils sont appelés potentiels évoqués (EP)
– Les signaux spontanés : ils sont volontairement générés par l’utilisateur lorsqu’il réalise différentes taches mentales.
Les potentiels évoqués
Ils se divisent en deux catégories principales : les Steady State Evoked Potentials (SSEP) et les Event Related Potentials (ERP). L’avantage des EP est qu’ils permettent de créer des BCI qui ne nécessitent que peu ou pas d’entrainement pour l’utilisateur. Leur désavantage est que l’utilisateur doit attendre que le stimulus utile apparaisse. De plus l’utilisateur doit rester concentré constamment sur des tâches rapides et répétitives, ce qui peut être fatiguant.
Steady State Evoked Potentials Les SSEP sont émis en réponse à un stimulus visuel ou auditif périodique. Le signal à une fréquence fixe provoque une augmentation de l’activité cérébrale à cette fréquence ainsi qu’à ses harmoniques et/ou sous-harmoniques (cf Figure 1.4). Un SSVEP (Steady State Visual Evoked Potentials) peut être détecté en examinant le spectre du signal issu des électrodes O1 et O2 du système international 10-20 (cf Figure 1.2).
Pour une utilisation dans les BCI, on associe une action particulière à des cibles cligno-tant à des fréquences différentes. L’utilisateur peut alors contrôler le BCI en regardant la cible correspondant à l’action désirée.
Event Related Potentials Les ERP sont des potentiels qui apparaissent dans l’activité cérébrale en réponse à un stimulus rare et pertinent. Parmi les ERP, le plus connu et utilisé pour les BCI est le P300. C’est une ondulation positive dont le pic se situe à environ 300ms après que le stimulus soit apparu. Ce potentiel est principalement localisé dans la région pariétale.
Les BCI basés sur le P300 fonctionnent de la même façon que ceux basés sur les SSVEP : Plusieurs boutons ou objets sont affichés sur un écran. Ces boutons sont surlignés aléatoirement et l’utilisateur doit compter le nombre de fois, sur une certaine durée, que le bouton qu’il veut est allumé. Une des applications les plus connues de l’utilisation de ce potentiel est le « P300-speller » [Farwell et Donchin, 1988]. Dans une matrice de lettres (Figure 1.5), les colonnes et les lignes s’éclairent séquentiellement. L’utilisateur compte le nombre de fois que la lettre désirée s’éclaire. Une fois la séquence terminée, le BCI analyse les signaux enregistrés pour en déduire la lettre choisie.
Présentation du système proposé
Dans le cadre de ma thèse, le BCI développé est de type indépendant, non-invasif et syn-chrone. Indépendant : Il est destiné à des utilisateurs pouvant être dans l’incapacité d’utiliser la totalité de leurs muscles, même les mouvements oculaires.
Non-invasifs : Les électrodes sont posées sur le scalp.
Synchrone : Au stade expérimental nous développons une interface synchrone car plus ro-buste et plus facile à mettre en place, l’objectif à long terme étant de développer un système asynchrone. Nous rappelons que l’objet de ce travail : développer un système précis capable d’améliorer ses performances en cours d’utilisation et de s’adapter à l’utilisateur sans nécessiter de multiples sessions d’apprentissage.
Travaux antérieurs
Pour adapter le système de décision à l’utilisateur, il est possible d’utiliser directement les sorties du système sans aucune autre information, ceci correspond à une adaptation non supervisée. Cette approche a été développée dans [Yuanqing et Cuntai, 2006] pour réduire les sessions d’entraînement et dans [Vidaurre et al., 2011] pour donner à l’utilisateur un retour pendant l’entraînement et ainsi éviter un changement entre les conditions d’entraînement et celles d’utilisation du BCI en ligne. L’approche non supervisée semble se révéler efficace lorsque le taux d’erreur du BCI, avec l’apprentissage initial, est suffisamment faible. Cependant pour un système ayant une précision viable (entre 65% et 85% selon les sujets), cette technique est inefficace et déstabilise le système car l’étiquette des nouveaux individus ajoutés à l’ensemble d’apprentissage n’est pas assez fiable.
Une adaptation supervisée implique de pouvoir identifier l’ensemble des essais correctement étiquetés par le système de décision. Plusieurs auteurs ont travaillé sur la possibilité d’ob-tenir une information sur la validité des décisions du système en utilisant les signaux EEG. Falkenstein et al. [2000] ont montré que, lorsque le sujet réalise qu’il a fait une erreur, des chan-gements spécifiques apparaissent dans son EEG. Schalk et al. [2000] ont présenté des résultats lors du contrôle du mouvement d’un curseur et ont prouvé la présence d’un potentiel d’erreur lorsque le sujet commet une erreur. Blankertz et al. [2002] ont proposé une méthode permettant de détecter ces potentiels d’erreur à chaque essai. Cependant dans tous ces cas, l’erreur est effectuée par le sujet lui-même et non par le système de décision.
Ce n’est que plus récemment que certains auteurs ont identifié et détecté des potentiels d’erreur (ErrP) générés en réponse à une erreur faite par le système de décision et ont montré qu’il était possible d’améliorer les performances du BCI dans le cas d’interface utilisant des signaux spontanés [Buttfield et al., 2006 ; Chavarriaga et Millán, 2010 ; Ferrez et Millán, Graz 2008] ou évoqués [Dal Seno et al., 2010].
Système proposé
La thèse s’inscrit dans ce contexte, le système étudié comporte ainsi 2 modules d’analyse et décision de signaux EEG. Le module principal produit et affiche une décision de mouvement à partir des signaux EEG images de l’intention de mouvement. Le module secondaire estime la présence ou l’absence d’une erreur sur la décision précédente en analysant les signaux évoqués. Sa sortie est utilisée pour adapter les règles de décision du module principal, et enrichir la base d’apprentissage.
Sur la figure 1.6 est représenté le fonctionnement de l’interface adaptative. Un tel schéma nécessite un système de décision pouvant apprendre en ligne, un dispositif permettant de détecter ses erreurs et une stratégie de mise à jour de la population d’apprentissage :
1. Un système de décision pouvant apprendre en ligne. Le cœur du BCI est un algorithme de décision dans lequel les signaux sont représentés dans l’espace des descrip-teurs et classés par des fonctions de décision apprises sur un ensemble d’apprentissage. Les performances de cette étape dépendent de l’espace de représentation et des fonctions discriminantes.
. Espace de représentation. Des travaux précédents de l’équipe ADTSI [Vautrin et al., 2009 ; Farina et al., 2007] ont montré l’intérêt de l’utilisation des marginales de trans-formées en ondelettes comme descripteurs des signaux : ce type de descripteurs permet, en optimisant l’ondelette mère ou la base d’ondelettes, d’adapter l’espace de représen-
tation aux signaux. Nous reprendrons et développerons cette caractérisation.
. Apprentissage des règles de décision en ligne. Dans cet espace de représentation, des fonc-tions discriminantes doivent être calculées sur une population d’apprentissage afin de reconnaître les différentes intentions de mouvement de l’utilisateur. Il existe différentes méthodes de classification correspondant à différents types de fonctions : classifieurs bayésiens, réseaux de neurones, machines à noyau… Dans notre système la méthode utilisée doit donner des résultats satisfaisants même avec de petites populations d’ap-prentissage (vis-à-vis de la dimension de l’espace de représentation) et doit pouvoir fonctionner en ligne en intégrant et oubliant des individus afin d’adapter la population d’apprentissage aux évolutions éventuelles du sujet et d’enrichir l’ensemble d’apprentis-sage avec de nouveaux exemples. C’est pourquoi nous avons retenu les SVM : l’approche est réputée robuste dans ce contexte et peut être utilisée en ligne de façon décrémentale et incrémentale. Nous avons utilisé les méthodes décrites dans [Cauwenberghs et Poggio, 2001] et [Vishwanathan et al., 2003].
2. Un dispositif permettant de détecter ses erreurs. Afin de corriger le système de décision il est impératif de pouvoir détecter les erreurs commises par le système. Ceci est fait dans un premier temps en analysant les potentiels cérébraux évoqués après avoir donné la réponse du BCI à l’utilisateur. Nous avons étudié et mis en œuvre deux méthodes permettant d’estimer la justesse de la réponse du système de décision (1) :
– la première méthode est une approche détection basée sur le principe du filtrage adapté,
– la seconde méthode est une approche classification classique.
Pour déterminer la meilleure méthode, nous avons quantifié théoriquement l’amélioration apportée par chaque méthode en terme de probabilité d’erreur en sortie du système corrigé.
3. Une stratégie de mise à jour de la population d’apprentissage. Une fois la réponse donnée par le SVM et l’avis de l’expert pris en compte, on doit intégrer ou retirer des exemples dans l’ensemble d’apprentissage afin de l’adapter à l’évolution de l’utilisateur et d’améliorer les décisions du BCI. Cependant toutes les données ne sont pas forcément pertinentes. Pour tester différentes stratégies, nous avons développé un simulateur.
Protocole d’acquisition du BCI étudié dans la thèse
Les différentes parties du BCI ont été testées de façon indépendante sur des signaux EEG enregistrés à l’Université d’Aalborg au Danemark ainsi qu’à l’Université de Göttingen en Alle-magne. Le protocole correspondant à un fonctionnement complet en ligne ne pouvait être mis en œuvre sans que chacun des modules du système ne soit développé et testé. Nous avons défini un protocole permettant d’enregistrer les signaux EEG1 et de produire des signaux d’EEG2 en réponse à un pseudo-feedback du BCI (la décision affichée par le BCI est aléatoire). Les résultats présentés dans la thèse utilisent les signaux enregistrés selon ce protocole.
Nous allons détailler dans un premier temps l’obtention des signaux EEG1 (intention de mouvement) puis celle des EEG2 avant de voir le déroulement d’une session complète. Tous les essais ont été réalisés sur des sujets sains ne souffrant d’aucun handicap sensorimoteur.
Enregistrement des EEG1
L’enregistrement des EEG1 correspond à un fonctionnement classique d’un BCI. Les ins-tructions sont affichées sur un écran d’ordinateur. Un essai se décompose en quatre phases :
– Concentration : Dans la première phase on demande au sujet de se concentrer, il doit :
– fixer l’écran,
– ne pas bouger,
– ne pas cligner des yeux.
– Préparation : Ensuite on affiche au sujet la tâche motrice qu’il devra effectuer. Dans notre protocole il y a deux possibilités :
– une flexion rapide du bras droit,
– une flexion lente du bras droit.
Pendant que le type de mouvement s’affiche un compte à rebours se déclenche.
– Tâche motrice : A la fin du compte à rebours le sujet doit réaliser la tâche demandée. Durant les essais à l’Université d’Aalborg ils devaient réellement effectuer le mouvement. Lors des essais à l’Université de Göttingen ils devaient imaginer le mouvement sans le réaliser. Les différences électrophysiologiques entre une tâche motrice réelle et imaginaire se situent après le début de la tâche. Les différences dépendent des zones du cerveau. Cependant les potentiels des cortex frontal et moteurs sont similaires pour les mouvements réels et imaginaires [Sano et Bakardjian, 2009].
– Maintien : La durée de la phase de la tâche motrice variant suivant le type de mouvement, on demande ensuite au sujet de maintenir la contraction de son bras de façon réelle ou imaginaire. La durée de cette phase varie de manière à ce que la somme des durées des phases « Tâche motrice » et « Maintien » soit identique quel que soit le mouvement demandé au sujet.
Les EEG enregistrés 0.5s avant le début de la tâche motrice et durant 2s constituent les signaux d’EEG1 que nous avons utilisés pour tester les différentes méthodes d’extraction de caractéristiques dans le chapitre 2.
Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.
|
Table des matières
matières
Introduction générale
1 Contexte et présentation du système proposé
1.1 Différentes catégories de BCI
1.1.1 BCI dépendant et indépendant
1.1.2 BCI invasif et non invasif
1.1.3 BCI synchrone et asynchrone
1.2 Mesure de l’activité cérébrale
1.3 Les types de signaux utilisés pour contrôler les BCI
1.3.1 Les potentiels évoqués
1.3.2 Les signaux spontanés
1.4 Présentation du système proposé
1.4.1 Travaux antérieurs
1.4.2 Système proposé
1.4.3 Protocole d’acquisition du BCI étudié dans la thèse
2 Espaces de représentation optimaux
2.1 Potentiels corticaux relatifs aux mouvements
2.2 La transformée discrète en ondelettes (DWT)
2.2.1 L’analyse multirésolution
2.2.2 AMR et mise en œuvre de la DWT
2.3 Descripteurs issus de la transformée discrète en ondelettes
2.3.1 Coefficients de la DWT
2.3.2 Marginales de la DWT
2.4 Optimisation de l’ondelette mère
2.4.1 Paramétrisation de l’ondelette
2.4.2 Critères de qualité
2.4.3 Optimisation des paramètres dans le cas de signaux mono-voies
2.4.4 Optimisation des paramètres dans le cas de signaux multi-voies
2.5 Meilleure base de décomposition
2.5.1 Décomposition en paquets d’ondelettes (DWPT)
2.5.2 Sélection d’une meilleure base pour la classification
2.6 Comparaison des méthodes sur des signaux simulés et réels
2.6.1 Simulation des signaux
2.6.2 Résultats sur des signaux simulés mono-voie
2.6.3 Résultats sur des signaux EEG expérimentaux
2.7 Conclusion
3 Classification
3.1 Théorie des machines à vecteurs supports (SVM)
3.1.1 Notations
3.1.2 Séparatrice linéaire, cas séparable
3.1.3 Séparatrice linéaire, cas non séparable
3.1.4 Séparatrice non linéaire, cas général
3.1.5 SVM pour des problèmes à plus de deux classes
3.2 Les principaux algorithmes de résolution des SVM
3.2.1 Reformulation du problème d’optimisation
3.2.2 Méthodes de point intérieur
3.2.3 Méthodes de décomposition
3.3 Algorithmes de contraintes actives
3.3.1 Incremental/decremental SVM
3.3.2 SimpleSVM
4 Détection des erreurs
4.1 État de l’art sur les potentiels d’erreur
4.2 Analyse qualitative des signaux
4.3 Détection des potentiels évoqués
4.3.1 Approche détection (détecteurd)
4.3.2 Approche classification (détecteurc)
4.3.3 Choix du classifieur
4.4 Performances théoriques du BCI corrigé
4.4.1 Notation
4.4.2 Probabilité d’erreur
4.4.3 Probabilité d’erreur totale du BCI corrigé
4.4.4 Probabilité de répétition et taux de transfert
4.5 Résultats
4.5.1 Reconnaissance des ErrP
4.5.2 Résultats de l’amélioration du BCI corrigé
4.6 Conclusion
5 Simulation du BCI adaptatif
5.1 Simulateur
5.1.1 Simulation des données à classer
5.1.2 Le système de classification (SVM1)
5.1.3 Le détecteur d’erreur
5.1.4 Ensemble d’apprentissage et mise à jour
5.1.5 L’interface
5.2 Résultats de simulations
5.2.1 Influence de la taille de la fenêtre glissante
5.2.2 Comparaison des stratégies de mise à jour
5.3 Conclusion
Conclusion et perspectives
A Filtrage spatial
A.1 Notations
A.2 filtrage spatial
Liste des publications
Bibliographie
Télécharger le rapport complet