Diagonalisation conjointe de matrices
La diagonalisation d’une matrice est un problème important en traitement du signal. En effet, on l’utilise notamment en analyse spectrale, en estimation de sous-espace signal ou bruit, en analyse en composantes principales, en réduction de dimension ou encore en blanchiment de données et en analyse en composantes indépendantes. De manière plus applicative, en traitement d’antennes, par exemple, à partir de l’analyse en composantes principales de la matrice de covariance des observations, on peut estimer les angles d’arrivée ainsi que le nombre de sources actives, autrement dit l’espace signal associé.
Cependant, il est parfois intéressant, voire nécessaire, de traiter un ensemble de matrices estimées à partir d’un même jeu de données. On parle alors de diagonalisation conjointe de matrices [24]. Elle se rencontre dans des problèmes pratiques comme la formation de faisceaux [14, 58, 60], le débruitage de signaux [5], l’égalisation aveugle de canaux pour des systèmes de télécommunications multi-entrées multi-sorties [32], l’extraction des différences de marche d’échos Doppler en radar [72], l’analyse en composantes indépendantes [3, 91] et la séparation aveugle de sources [31, 83]. Pour cette dernière, par exemple, on peut estimer une matrice de séparation en diagonalisant conjointement un ensemble de matrices cibles.
Les matrices cibles sont, de manière générale, construites à partir d’opérateurs d’analyse ou de statistiques. On trouve, notamment, des matrices liées à :
• des décompositions spectrales des données
• des décompositions temps-fréquence
• des statistiques d’ordre deux (comme la covariance des signaux d’observation ou les covariances retardées)
• des statistiques d’ordres supérieurs (comme les moments ou les cumulants d’ordre supérieur) .
Comme ces matrices sont « seulement » construites à partir d’un nombre fini d’observations, la diagonalisation conjointe d’un ensemble de plus de deux matrices ne pourra pas être exacte, on l’appellera alors diagonalisation conjointe approchée. De par leurs différentes constructions, vues précédemment, les matrices cibles présentent souvent des propriétés de symétrie. Dans le cas réel, elles peuvent être symétriques tandis que dans le cas complexe, elles peuvent être soit hermitiennes, soit symétriques. Initialement, on considérait principalement les ensembles de matrices hermitiennes, mais récemment, un intérêt croissant s’est porté sur les ensembles de matrices complexes symétriques que l’on peut retrouver, notamment, en télécommunications numériques lorsque les signaux considérés sont non circulaires . Il existe aussi d’autres domaines d’applications où l’on peut considérer ce type de symétrie . Afin d’augmenter le nombre de matrices cibles, il est aussi possible de construire, à partir d’un jeu de données adéquat, un ensemble contenant des matrices complexes symétriques et hermitiennes . La diagonalisation conjointe de matrices possédant les types de symétrie énoncés précédemment est dite par congruence. Il est cependant important de noter que les matrices cibles ne présentent pas toujours ces types de symétries, c’est le cas notamment pour la diagonalisation conjointe par similitude ou encore la diagonalisation conjointe de matrices cibles non-symétriques .
Décompositions tensorielles
En traitement de signal, de nombreux problèmes peuvent être modélisés sous forme tensorielle [27, 30]. Ces tenseurs sont très souvent construits grâce aux différentes diversités des problèmes considérés. Tout d’abord, certaines données sources peuvent être directement générées sous forme de tenseurs. C’est le cas, par exemple, pour des images couleurs RGB ou hyperspectrales, pour des vidéos ou encore pour les affichages de champs lumineux [130]. De manière plus générale, tout signal multidimensionnel peut être stocké sous forme de tenseurs. Par exemple, en télécommunications sans-fil, les signaux ont des dépendances temporelles, spatiales et spectrales, ils pourront alors être stockés dans des tenseurs d’ordre trois [102]. Il en est de même en spectroscopie où le tenseur d’ordre trois contiendra d’une part les différents échantillons, d’autre part les longueurs d’onde avec lesquelles les échantillons sont excités et enfin les longueurs d’onde qu’ils émettent en réponse à cette excitation [103]. En électroencéphalographie, on peut considérer initialement un tenseur d’ordre trois contenant des informations temporelles et spectrales des signaux selon les différents canaux. Si cela s’avère insuffisant, on peut prendre en compte plus d’informations en considérant des diversités supplémentaires comme les différents sujets d’étude (patients), les différentes conditions d’examen ainsi que les différents essais. Ainsi on augmentera l’ordre du tenseur [86]. Finalement, le tenseur de stockage pourrait être ici d’ordre six. Enfin, les tenseurs peuvent être construits à partir d’opérateurs d’analyse. En effet, à partir des données on peut obtenir directement des tenseurs, à l’aide de statistiques d’ordre supérieur [89]. Dans le cadre de procédures d’analyse électroencéphalographique multicanale, des diversités supplémentaires pourront être considérées à l’aide des représentations temps-fréquence ou des transformées en ondelettes [28, 79].
En séparation de sources, par exemple, on cherche à décomposer ces tenseurs de manière à estimer une matrice de séparation ou la contribution des différentes sources, à faire de la réduction de dimension ou du débruitage. Pour traiter ce type de problème, certaines méthodes consistent à considérer le tenseur cible comme un ensemble de matrices cibles. On retombe ainsi sur un problème de diagonalisation conjointe de matrices. Cependant, même si cette méthode offre l’intérêt de pouvoir utiliser des algorithmes de diagonalisation conjointe de matrices, elle nécessite une phase de dépliement du tenseur parfois peu intuitive. Il a aussi été proposé différentes méthodes de décomposition tensorielle, comme, par exemple, la décomposition canonique polyadique (aussi connue sous le nom de factorisation parallèle) appliquée à la psychométrie dans [16] et la linguistique [57] ou encore la décomposition de Tucker introduite en psychométrie [120, 121]. Ces décompositions n’ont toutefois pas la même utilité. En traitement de signal, la décomposition canonique polyadique est, en général, utilisée pour factoriser des données qui seront ainsi facilement interprétables. C’est typiquement le cas en séparation de sources où cette décomposition permettra de révéler la contribution des différentes sources. La décomposition de Tucker, quant à elle, est plutôt utilisée pour de la compression de données. Ces méthodes ont donné lieu au développement de nombreux algorithmes.
|
Table des matières
1 Introduction générale
1.1 Cadre de la thèse
1.1.1 Diagonalisation conjointe de matrices
1.1.2 Décompositions tensorielles
1.2 Objectifs de la thèse et contenu du manuscrit
1.3 Notations et définitions
1.3.1 Notations classiques
1.3.2 Notations spécifiques
1.3.3 Opérations sur les matrices
1.3.4 Opérations sur les tenseurs
1.3.5 Définitions
1.4 Contributions
2 Formulation du problème et approches proposées
2.1 Diagonalisation conjointe de matrices
2.1.1 Ensemble de matrices complexes non-symétriques
2.1.2 Ensembles importants
2.2 Diagonalisation conjointe de tenseurs d’ordre trois
2.2.1 Ensemble de tenseurs complexes non-symétriques
2.2.2 Ensembles importants
2.3 Lien avec l’ICA et la séparation de sources
2.3.1 La séparation de sources
2.3.2 La diagonalisation conjointe comme méthode de séparation de sources
2.4 Etat de l’art des méthodes de diagonalisation conjointe
2.4.1 Approches envisagées
2.4.2 Un problème d’optimisation
2.5 Méthodes proposées pour les algorithmes développés
2.5.1 Procédure de Jacobi
2.5.2 Critères choisis
2.5.3 Contrainte considérée
2.5.4 Structure générale des algorithmes proposés
3 Algorithmes de diagonalisation conjointe non-unitaire de matrices
3.1 Introduction
3.2 Stratégie d’estimation découplée
3.2.1 Approche classique
3.2.1.1 Modèle complexe symétrique
3.2.1.2 Modèle hermitien
3.2.2 Approche adaptée
3.2.2.1 Modèle complexe symétrique
3.2.2.2 Modèle hermitien
3.2.2.3 Description de l’algorithme
3.3 Stratégie d’estimation couplée
3.3.1 Approche classique
3.3.1.1 Modèle complexe symétrique
3.3.1.2 Modèle hermitien
3.3.2 Approche adaptée
3.3.2.1 Modèle complexe symétrique
3.3.2.2 Modèle hermitien
3.3.2.3 Etape de normalisation
3.3.2.4 Remarque
3.3.3 Description des algorithmes
3.4 Simulations
3.4.1 Modèle complexe symétrique
3.4.2 Modèle hermitien
3.4.3 Complexité algorithmique
4 Algorithmes de diagonalisation conjointe non-unitaire de tenseurs d’ordre trois
4.1 Introduction
4.2 Stratégie d’estimation découplée
4.2.1 Approche classique
4.2.2 Approche adaptée
4.2.3 Description des algorithmes
4.3 Simulations
4.3.1 Algorithmes de décomposition CP
4.3.2 Complexité algorithmique
4.3.3 Cadre de simulations
4.3.4 Influence des différents paramètres
4.3.5 Statistiques sur la vitesse de convergence
5 Conclusion générale
Télécharger le rapport complet