L'implémentation parallèle des FFTs indépendantes avec DPDK

LTE (Long Term Evolution)

Tout a commencé avec les réseaux mobiles de première génération tels que les AMPS aux Etats-Unis, le TACS au Royaume-Uni et la Radiocom en France, ces technologies étaient les meilleures parmi leur genre au cours des années 80. Elles étaient basées sur les accès multiples en fournissant à chaque utilisateur une fréquence, mais leur capacité reste limitée avec un nombre d’utilisateurs qui a atteint seulement 60 000 utilisateurs. Toute la conception était analogique. En outre, il y avait un fardeau de transmission lorsque deux appels viennent à l’utilisateur mobile au même temps, les bornes n’ont pas été optimisées avec un équipement grand et lent. Ils n’ont pas duré longtemps [2] [3] [4]. Dans les années 90, le GSM en Europe est venu avec une grande amélioration. Grâce à l’évolution du traitement des signaux numériques et les tâches hyperfréquences, les équipements ont été réduits en taille et ils deviennent plus modernisés en permettant une grande mobilité pour l’utilisateur [2] [4]. Technologiquement parlant, les technologies 2G étaient basées sur la modulation numérique comme FDMA et TDMA, en utilisant le temps et la fréquence de multiplexage.

À la fin des années 90, la station de base pour le réseau GSM est devenue connectée avec le GPRS pour améliorer la vitesse qui a atteint 240 kbit/s. Le GSM était un succès dans le monde entier et a duré longtemps, mais sa capacité système était limitée. Ce qu’était une raison pour la migration vers les technologies 3G. Prendre le GSM comme un exemple réussi, l’UMTS est né comme une nouvelle fixation du GSM et la technique de codage du CDMA. Cet UMTS représente la nouvelle ère de la 3e génération dans les systèmes de communication mobiles [2] [4]. La 3G a commencé avec l’UMTS, CDMA a évolué pour W -CDMA avec une porteuse occupant un canal de 5 MHz et une bande passante de 3,8 MHz [2]. L’objectif était de réduire la taille des terminaux et des systèmes mobiles. La vitesse UMTS était de 380 kbit/s au lieu de 118 kbit/s du GSMlGPRS. Donc, pour améliorer cette vitesse, il y avait une migration vers une nouvelle technologie appelée HSPA. Cette technologie a utilisé une nouvelle technique de modulation avec le nom de la QAM16 pour le « downlink » et QPSK pour le « uplink ». Le mélange de ces nouvelles façons a donné naissance au HARQ pour la transmission entre l’émetteur et le récepteur afin de réduire la latence des paquets transmis entre les deux parties. Ce HSPA offre à l’utilisateur une vitesse de « download » de 14 Mbit/s et une vitesse de « upload » de 5 Mbit/s. Plus tard, une nouvelle version de HSPA a été libérée avec le nom de HSPA+ qui a utilisé les mêmes techniques de codage que le HSPA, mais avec une modulation améliorée qui est le QAM64. En conséquence, le temps de latence a été réduit à 30ms, et la vitesse de down/oad a atteint les 42 Mbit/s [2] [3].

LTE (Long Term Evolution)

LTE représente une technologie émergente et prometteuse pour fournir un accès Internet à large bande omniprésente. Pour cette raison, plusieurs groupes de recherche tentent d’optimiser ses performances [8]. Elle met en place des débits de données efficaces dans le processus de transmission, une largeur de bande flexible qui peut être commandée à partir de 1,4 MHz à 20 MHz et à faible temps de latence pour la couche physique [9]. En plus des autres blocs de la couche, 17 tels que le codage de canal, l’ordonnancement, l’adaptation de liaison, le mapping et l’optimisation de canal. Le plan de transmission en liaison descendante est construit sur l’OFDMA qui transforme le canal de fréquence disponible dans une collection de plusieurs sous-canaux; chaque sous-canal est basé sur la sous-porteuse représentant un utilisateur [6] [1 ]. Les sous-canaux profitent de la mise en oeuvre du MIMO contrairement à la transmission WCDMA [9]. L’utilisation de l’OFDMA se fait essentiellement dans le domaine des fréquences pour rendre le traitement plus facile et la programmation moins compliquée. Ces sous-canaux seront filtrés afin d’ avoir un bon gain pour les utilisateurs [5]. Dans les systèmes de télécommunications, les données améliorées sont souvent structurées autour des récepteurs/émetteurs radio. Ces récepteurs/émetteurs travaillent généralement dans les réseaux cellulaires où le traitement de signal numérique est en constante évolution afin d’améliorer la performance. L’augmentation massive des émetteurs/récepteurs ouvre des nouvelles voies d’ implémentation de la couche physique sur des plateformes Multicoeurs. Ces plateformes offrent principalement la flexibilité opérationnelle pour une meilleure fiabilité et l’efficacité des méthodes clés. Ainsi la modélisation du système embarqué doit passer par une étude détaillée de l’architecture et une bonne modélisation de l’émetteur/récepteur LTE .

Les caractéristiques du LTE Il est important de considérer la capacité des systèmes LTE, la vitesse de débit de données et la latence qui sont les défis les plus importants que nous rencontrons au cours de ce mémoire, en commençant par l’étude de la FFT et en terminant par l’ implémentation. Capacité: En expliquant la différence entre la capacité et la vitesse. La capacité est le nombre maximal d’utilisateurs par cellule qui sont en mesure de se connecter simultanément lorsque le réseau est entièrement chargé. Pour avoir une bonne capacité, nous devons avoir une bonne efficacité spectrale. Le problème reste lorsque plusieurs utilisateurs se connectent au réseau en même temps, donc la vitesse (Mbit/s) vient à être réduite et partagée entre tous les autres utilisateurs. Par conséquent, la vitesse pour un seul utilisateur peut être affectée à l’efficacité spectrale, divisée en nombre d’utilisateurs actifs. La capacité d’un réseau est liée au nombre d’utilisateurs actifs simultanément [2]. Les besoins accrus pour la capacité sont dans une évolution stable avec les réseaux mobiles. En effet, les progrès technologiques des réseaux encouragent l’utilisation de nouveaux types de méthodes pour assurer une expérience plus confortable à utilisateur.

L’utilisation intensive du réseau et le grand nombre d’utilisateurs font le problème de la capacité d’une énigme qui doit être résolu. Les exigences de capacité sont en croissance et la technologie doit évoluer [2]. Le gain de capacité pour le HSPA et HSPA+ sont améliorées si l’on compare au GSM et l’UMTS. Mais même avec cette amélioration, il ne répond toujours pas aux exigences du nombre croissant d’utilisateurs par jour. Grâce à la nouvelle progression de la technologie et de l’énorme diffusion des téléphones intelligents et les mobiles 4G+, le nombre d’utilisateurs est étonnamment en augmentation qui conduit à une augmentation du nombre d’utilisateurs et l’élargissement des capacités est devenu obligatoire. Le facteur de croissance annuelle du nombre d’utilisateurs dans le monde a dépassé les 100% en 20 Il et ce taux devrait se poursuivre dans les années suivantes. La solution est d’ajouter d’autres sous-porteuses dans la couche physique de LTE. Cela n’ est pas facile, car l’activation de plusieurs sous-porteuses est liée à la taille de la largeur de bande qui doit être respectée. Dans de nombreux pays, le nombre des sous-porteuses est limité et comme résultats, on peut remarquer un rejet des appels dans les heures de pointe. Vitesse: Une vitesse plus élevée que celle fournie par le réseau HSPA est nécessaire en raison de la forte demande des utilisateurs et des opérateurs.

Cette exigence est d’abord motivée par le désir d’offrir la mobilité à l’ utilisateur comparable aux réseaux résidentiels. La vitesse fait la différence entre les opérateurs et les pays, c’est pourquoi le déploiement de LTE est venu de prouver une meilleure confiance de vitesse [2]. Temps de latence : La latence en L TE est le retard généré et causé par le système. Il existe deux types de latence: Latence de commande et latence de l’ utilisateur. La latence de commande est le temps nécessaire pour la connexion et l’accès au réseau. Le temps de latence de l’utilisateur représente le temps nécessaire pour transmettre les paquets de données juste après la connexion. En général, le temps de latence donne une indication sur la capacité du système à traiter toutes les données à venir et de transmission. Par exemple, le HSPA offre un temps de latence de 70ms qui permet l’utilisation du service de jeux vidéo en ligne. La latence améliorée avec le L TE est l’un des objectifs les plus importants dans le projet LTE [2].

Les FFTs indépendantes et la FFT parallèle

Pour les FFTs indépendantes avec DPDK, le noyau Linux et les techniques DPDK trouvés dans la littérature « the network stack latency for game servers » [10] étudient l’effet du temps moyen et son écart-type sur la performance du système. Leurs mesures ont montré que la taille de mémoire tampon a une influence sur le retard. Une taille faible a conduit à un problème d’optimisation et débit. Avec « the fast user space packet processing » [11], l’implémentation a montré que l’utilisation de DPDK a aidé à gagner, jusqu’à 2,3 fois en gain de vitesse par rapport à d’autres implémentations logicielles. L’implémentation dans « DPDK implementation ofvarious applications using networks on end user nodes » a montré que les expériences peuvent atteindre des vitesses de transmission des paquets 9 fois supérieure à celle d’une implémentation basée sur les sockets [12]. Dans les systèmes d’exploitation Linux, l’application de la FFT est basée sur des serveurs Linux à l’aide des processeurs Intel Xeon E5506. Les expériences indiquent que le composant avec des threads peut être utilisé pour les applications à hautes performances [13] [17].

Un algorithme radix-2 de la FFT est développé pour les architectures SIMD (Single Instruction-Multiple Data) génère un temps de calcul moyen de 69 f..LS sur Intel Pentium 4 [14]. Notre contribution utilise toutes les techniques suivantes pour accélérer la mise en oeuvre de la FFT en utilisant DPDK avec FFTW et MKL sur la plateforme Intel Core i7. Cela comprend différents scénarios de taille de la mémoire, la configuration de la bande passante et de l’isolation des coeurs sur Linux. Cela devrait conduire à une connaissance précieuse sur le temps de traitement, la consommation d’énergie, la complexité du matériel, et l’efficacité du logiciel utilisé. Pour les FFTs indépendantes avec OpenMP, les techniques de parallélisation mis en évidence dans la littérature examinent l’implémentation de huit FFTs parallèles appropriées pour la OFDM en utilisant huit FFTs parallèles fonctionnant dans des longueurs variables de 64/128/256/512 [15]. En outre, les auteurs montrent comment l’augmentation du nombre de threads et de la taille des données d’entrée influence la performance avec OpenMP [16]. L’OFDM souffre d’un temps de traitement élevé dans la couche physique et la latence est une contrainte critique pour contester l’exécution des FFTs indépendantes. Les processeurs Multicoeurs sont convenables pour les réseaux radio centralisés (C-RAN) et offrent une plateforme plus configurable que la FPGA et l’ASIC [18] [24]. Le LTE peut adopter le Xeon-Phi comme un substitut au FPGA et DSP. Ces derniers nécessitent une programmation complexe de bas niveau à la différence d’une simple programmation standard en CIC ++ pour le Xeon-Phi. Notre contribution utilise toutes les techniques suivantes pour mettre en oeuvre 100 FFTs indépendants sur Xeon-Phi pour la couche physique de LTE. En utilisant les modes Native et Offioad pour l’implémentation sur Xeon-Phi, un gain de temps de calcul pourrait être obtenu pour notre code parallèle. De plus, nous allons comparer les résultats avec Xeon. Cela devrait conduire à des connaissances précieuses sur le temps de traitement et l’efficacité de chaque plateforme.

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

Résumé
Remerciement
Table des matières
Liste des tableaux
Liste des figures
Liste des symboles
Chapitre 1 – Introduction
1.1 Problématique
1.2 Objectifs
1.1 Méthodologie
1.2 Organisation du mémoire
Chapitre 2 – L TE et les FFTs indépendantes pour les systèmes MulticoeurlManycoeur
2.1 LTE (Long Term Evolution)
2.2 Les FFTs indépendantes et la FFT parallèle
2.3 Les outils logiciels pour le parallélisme
2.3.1 Data Plane Development Kit (DPDK)
2.3.2 Math Kernel Library (MKL)
2.3.3 Fastest Fourier Transform in the West (FFTW)
2.3.4 OpenMP (Open Multi-Processing)
2.3.5 MPI (Message Passing Interface)
2.4 Environnement et plateformes
Chapitre 3 – L’implémentation parallèle des FFTs indépendantes avec DPDK
3.1 Introduction
3.1 Le noyau Linux et DPDK
3.2 Implémentation et isolation des coeurs
3.3 Discussion
3.4 Conclusion
Chapitre 4 – Les FFTs indépendantes avec OpenMP
4.1 Introduction
4.2 Des FFTs indépendantes et l’affinité des threads
4.3 Les modes d’implémentation sur Xeon-Phi
4.4 . Évaluation de performance et résultats
4.5 Conclusion
Chapitre 5 – L’implémentation parallèle des FFTs indépendantes avec MPI
5.1 Introduction
5.2 L’implémentation parallèle et les outils logiciels
5.2.1 Les modes d’Implementation sur Xeon-Phi
5.2.2 Le modèle Fork-joint avec Open MultiProcessing (OPENMP)
5.2.3 La modélisation parallèle avec MPI
5.3 La hybridation OpenMP + MPI
5.4 Evaluation du performance et résultats
5.4.1 Simulation
5.4.2 Discussion des résultats
5.5 Conclusion
Chapitre 6 – La parallélisation d’une FFT
6.1 Introduction
6.2 Radix-2 Cooley Tukey
6.3 Les étages de parallélisation
6.3.1 L’étage de division
6.3.2 L’étage de traitement
6.3.3 L’étage de recombinaison
6.4 Évaluation des résultats
6.4.1 Performance
6.4.2 Conditions de simulations et les platefonnes utilisées
6.4.3 Discussion des résultats
6.5 Conclusion
Chapitre 7 – Conclusion générale
Bibliographie
Annexe A – Article publié – NORCAS 2015
Annexe B – Article publié – ISCAS 2016