DÉTÉRIORATION VISUELLE SUITE AU DÉCODAGE DE SÉQUENCES VIDÉO H.264 CORROMPUES 

TRANSPORT DE SÉQUENCES H.264

Notions élémentaires de la vidéo numérique

Avant de présenter les notions de blocs et de macroblocs, définissons une image numérique comme un ensemble fini d’éléments d’image, nommés pixels, contraction de la locution anglaise picture element. Un pixel est une unité de surface indivisible qui permet d’afficher une couleur . La variation de l’intensité des composantes d’un pixel permet d’afficher l’ensemble de couleurs contenues dans un espace colorimétrique. Le choix de ce dernier détermine les composantes, leur nombre et la portée de leur valeur. Un espace colorimétrique est un modèle mathématique permettant l’expression numérique d’un ensemble de couleurs.
L’espace colorimétrique RVB est très populaire, son nom est l’acronyme des trois couleurs qui le composent : rouge, vert et bleu. Cependant, les composantes de cet espace colorimétrique sont fortement corrélées avec la luminance (intensité lumineuse) ; une augmentation de celle-ci occasionnera une augmentation des valeurs des composantes RVB.

Survol de la norme H.264

La norme H.264 offre, pour une fidélité visuelle comparable à MPEG-2, une économie de 50 % du débit (Sullivan et Wiegand, 2005). Cette réalisation n’est pas l’œuvre d’une seule innovation, mais bien de l’effet combiné de plusieurs innovations importantes dans divers aspects de l’encodage vidéo. Pour mieux comprendre cette technologie, décrivons d’abord sommairement les étapes d’encodage vidéo. Par la suite, chaque étape sera expliquée dans les sections subséquentes.
L’efficacité de la prédiction de macroblocs repose sur la forte corrélation spatiotemporelle des pixels qui les composent. Dans un encodage prédictif, ce ne sont pas les pixels du bloc qui sont encodés, mais bien le différentiel entre le bloc et sa prédiction. Le différentiel, moins corrélé, augmente l’efficacité de la compression (Li et Drew, 2004). Néanmoins, le cout lié à l’utilisation du différentiel est l’encodage des données de prédiction. La norme H.264 permet deux types de prédictions : la première, basée sur les blocs d’une autre trame (inter) et la seconde, obtenue par l’interpolation du contenu des blocs voisins d’une même trame (prédiction intra). La norme prévoit aussi une transformée entière ainsi qu’une quantification, toutes deux appliquées au différentiel de la prédiction. Ces opérations augmentent l’efficacité de l’encodage entropique d’où résulte un meilleur taux de compression. La transformée entière ne fait que réorganiser les valeurs d’un bloc.

Prédiction de macroblocs inter

Une source importante de redondance exploitée par la norme H.264 est la redondance inter image, souvent appelée inter. La prédiction inter crée un modèle de prédiction basé sur une ou plusieurs trames vidéo préalablement décodées (Richardson, 2003). Ce modèle de prédiction est fondé sur la recherche et la compensation de mouvement dans le but d’accomplir l’appariement de blocs entre deux trames. Un macrobloc contient 16×16 valeurs de luminances qui peuvent être décomposées de quatre manières distinctes : une partition 16 × 16, deux partitions 16 × 8, deux partitions 8 × 16 et quatre partitions 8 × 8. De plus, chacun des sous-macroblocs 8 × 8 peut également être décomposé : deux partitions 8×4, deux partitions 4×8, et quatre partitions 4×4.
La décomposition de macroblocs permet d’optimiser l’encodage selon le niveau de détails d’une surface. Un macrobloc 16×16 est efficace pour les régions lisses où le différentiel de la prédiction possède peu d’énergie, ou pour de grandes zones où le mouvement est uniforme et translationnel. Des partitions plus petites sont utiles pour des régions plus complexes où le différentiel entre la prédiction et le macrobloc à encoder est élevé. La décomposition en partitions permet d’utiliser plusieurs vecteurs de mouvement (un par partition) pour mieux modéliser la surface. Cependant, les vecteurs de mouvement supplémentaires doivent, eux aussi, être encodés, ce qui décourage l’usage inutile de petites partitions.

Prédiction de macroblocs intra

Une seconde source considérable de redondance exploitée par la norme H.264 est la redondance spatiale à l’intérieur d’une image. La prédiction intra exploite cette redondance pour modéliser la texture d’un bloc à partir celle des blocs avoisinants.
Comme c’est le cas pour la prédiction inter, la prédiction intra repose sur le concept de blocs et de macroblocs et comprend la notion de blocs à tailles variables visant à améliorer la prédiction de régions complexes. La norme H.264 permet à l’encodeur de choisir entre des macroblocs 16 × 16 ou des sous-blocs 4 × 4 pour la luminance. Selon le choix, différents modes de prédiction sont offerts.
Deux faits intéressants sont à noter. Premièrement, la prédiction intra est accomplie dans le domaine spatial (contrairement à H.263 et MPEG-4 Visual qui utilisent le domaine fréquentiel (Wiegand et al., 2003)). Deuxièment, le recours aux pixels de blocs voisins pour établir une prédiction peut mener à une propagation d’erreurs, si celle-ci repose sur des pixels corrompus.

Encodage entropique

La norme H.264 innove dans le domaine du codage entropique en séparant le codage des paramètres de celui des données. Les paramètres sont représentés par des codes numériques qui sont, eux-mêmes, encodés avec des codes à longueur variable appelés codes exponentiels Golomb. Les valeurs des différentiels de prédiction sont encodées soit avec un codage entropique à longueur variable (CAVLC) ou un codage arithmétique binaire à contexte adaptatif (CABAC). Bien que CABAC offre un gain de compression d’environ 10 % par rapport à CAVLC, ce dernier est prédominant dans les applications mobiles à cause de sa simplicité. C’est pour cette raison que dans cet ouvrage, nous concentrons nos efforts exclusivement sur le CAVLC.
Un encodage à longueur variable, comme celui présenté par Huffman (1952), assigne des codes plus courts aux données plus fréquentes. Ceci implique que des codes plus longs sont attribués aux autres données. Cependant, la faible occurrence de longs codes assure que, comparé à un encodage à taille fixe, l’encodage à taille variable requiert moins de bits pour encoder la séquence.

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

INTRODUCTION
CHAPITRE 1 NORME H.264
1.1 Notions élémentaires de la vidéo numérique
1.2 Survol de la norme H.264
1.3 Prédiction de macroblocs
1.3.1 Prédiction de macroblocs inter
1.3.2 Prédiction de macroblocs intra
1.4 Transformée entière
1.5 Quantification
1.6 Encodage entropique
1.7 Filtre antibloc
CHAPITRE 2 TRANSPORT DE SÉQUENCES H.264
2.1 Tranches
2.2 Dissimulation d’erreurs dans le décodeur H.264
2.3 Ordonnancement flexible de macroblocs
2.4 Ensembles de paramètres
2.5 Couche d’abstraction réseau
2.6 Hiérarchie protocolaire RTP/UDP/IP
CHAPITRE 3 DÉTÉRIORATION VISUELLE SUITE AU DÉCODAGE DE SÉQUENCES VIDÉO H.264 CORROMPUES 
3.1 Décodage de paquets corrompus
3.2 Détérioration visuelle
3.3 Propagation de la détérioration visuelle
CHAPITRE 4 ÉTAT DE L’ART DE LA DÉTECTION DE LA DÉTÉRIORATION VISUELLE DANS LE DOMAINE DES PIXELS 
4.1 Prologue
4.2 Lien entre le décodeur vidéo et celui du canal de transmission
4.3 Amélioration des approches d’analyse syntaxique d’encodage vidéo
4.4 Combinaison de l’analyse syntaxique et de la détection de la détérioration visuelle dans le domaine des pixels
CHAPITRE 5 NOUVELLE APPROCHE D’IDENTIFICATION ET DE DISSIMULATION DE LA DÉTÉRIORATION VISUELLE 
5.1 Limitations des approches actuelles de détection de la détérioration visuelle
5.2 Effets de blocs compensés par le mouvement
5.2.1 Définition théorique du MCB
5.2.2 Explication de l’approche MCB
5.3 Approches sélectives de dissimulation de la détérioration visuelle
5.3.1 Approche sélective au niveau de la trame .
5.3.2 Approche sélective au niveau du macrobloc
CHAPITRE 6 RÉSULTATS DE SIMULATIONS ET ANALYSE 
6.1 Hypothèses de validation
6.2 Description des données d’essai
6.3 Analyse de la résilience aux erreurs du décodeur de référence H.264
6.4 Analyse de l’approche sélective
6.4.1 Approche sélective par trame
6.4.2 Approche sélective par blocs
CONCLUSION

Rapport PFE, mémoire et thèse PDFTélécharger le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *