Extension 3D de High Efficiency Video Coding (3D-HEVC)

Mรฉmoire de fin dโ€™รฉtudes systรจmes intelligents et rรฉseaux

LES FORMATS DES VIDEOS

Un flux vidรฉo est composรฉ dโ€™une succession dโ€™images qui dรฉfilent ร  un rythme fixe pour donner lโ€™illusion du mouvement, par exemple 25 images ou bien 30 images par seconde. On trouve gรฉnรฉralement un flux audio et dโ€™autres informations comme des sous-titres, des menus, des chapitrages, des interactions et des mรฉtadonnรฉes, des informations de propriรฉtรฉs sur la vidรฉo comme la date de crรฉation, le nom de la vidรฉo, son auteur, etc.
Il existe une multitude de formats vidรฉo, AVI (Audio Video Interleave) de Microsoft, MPEG (Moving Picure Expert Group) de lโ€™organisme du mรชme nom, FLV (Flash Video) dโ€™Adobe. Ce quโ€™il faut savoir, cโ€™est quโ€™un format rรฉsulte de deux concepts techniques distincts : les conteneurs et les CoDecs.

Le concept du conteneur

Le conteneur dรฉcrit la structure du fichier. Il est utilisรฉ pour stocker la vidรฉo, son flux dโ€™images, flux audio et mรฉtadonnรฉes, selon un schรฉma bien dรฉfini. Il prรฉcise notamment quel codec vidรฉo et potentiellement audio sont utilisรฉs. Il peut รฉgalement intรฉgrer des sous titres ou des chapitrages. Le principal objectif du conteneur est donc dโ€™organiser la coexistence entre lโ€™image, le son, รฉventuellement du texte et dโ€™autres donnรฉes liรฉes. Dans le langage du monde vidรฉo, on parle de multiplexage.
On peut imaginer un conteneur comme une boite avec plusieurs objets ร  lโ€™intรฉrieur mais rangรฉs dโ€™une faรงon bien dรฉfinie. Le conteneur utilisรฉ est gรฉnรฉralement identifiรฉ grรขce ร  lโ€™extension du fichier de la vidรฉo. Cโ€™est pour cette raison que cette notion est souvent confondue avec la notion de format, car il arrive que le nom du format soit identique au nom de son conteneur.

Le concept du CoDec

On retrouve donc dans chaque conteneur les donnรฉes audio et vidรฉo. Mais en amont, ces donnรฉes doivent รชtre encodรฉes pour correspondre au format attendu en optimisant la compression avec perte de qualitรฉ minimum. Cโ€™est le rรดle de CoDec, abrรฉviation de ยซ Codeur/Dรฉcodeur ยป. Il propose une mรฉthode pour encoder les signaux vidรฉo et audio selon un format attendu par le conteneur (figure 1.2). Sโ€™il lโ€™on reprend lโ€™image de notre conteneur en tant quโ€™une boite, le codec dรฉcrit la mรฉthode pour ranger ou dรฉballer correctement les diffรฉrents objets composants la vidรฉo. Lโ€™efficacitรฉ dโ€™un codec se mesure dโ€™une part dans ses capacitรฉs de compression, mais aussi de dรฉcompression, cโ€™est-ร -dire ร  rรฉtablir la vidรฉo lors de sa diffusion au plus prรจs de sa qualitรฉ dโ€™origine et dans un dรฉbit performant.
Ce quโ€™il faut comprendre cโ€™est que les conteneurs les plus utilisรฉs supportent diffรฉrents CoDecs, et un CoDec ne peut pas รชtre utilisรฉ avec nโ€™importe quel conteneur. Il y a une question de compatibilitรฉ (tableau 1.2).

CODAGE DES VIDEOS 2D

Les images de type I

Sont des images codรฉes en mode Intra-Frame. Ce sont des images de rรฉfรฉrence appelรฉes รฉgalement images clรฉs (KeyFrame en anglais). Ce sont des images autonomes, cโ€™est-ร -dire qui peuvent รชtre dรฉcodรฉes sans rรฉfรฉrences ร  dโ€™autres images (Fig 1.3). Elles permettent dโ€™assurer la cohรฉsion de la sรฉquence vidรฉo, comme elles permettent aussi de garantir la qualitรฉ rรฉsultante de la compression. La premiรจre image de la sรฉquence vidรฉo est de type I, en gรฉnรฉral il y en a une ou deux par seconde.

Les images P

Les images de type P, sont des images codรฉes en mode Inter-Frame. Ce sont des images prรฉdictives qui fait rรฉfรฉrence aux parties (macroblocsยน) des images I et/ou P antรฉrieures pour le codage de lโ€™image (figure 1.3). Une image P nรฉcessite gรฉnรฉralement moins de bits quโ€™une image I, mais elle peut รชtre sensible aux erreurs en raison de la dรฉpendance complexe vis-ร -vis des images P et/ou I antรฉrieures.

Les images B

Les images de type B, sont des images aussi codรฉes en mode Inter-Frame. Ce sont des images Bi-prรฉdictives ou images prรฉdites bi-directionnellement, appelรฉes aussi images prรฉdites en arriรจre (backwards-predicted frames ne anglais) [1]. Les images B sont assez similaires aux images P, ร  la diffรฉrence quโ€™elles peuvent รชtre prรฉdites ร  partir de deux images de rรฉfรฉrence, une antรฉrieure et lโ€™autre postรฉrieure ร  lโ€™image courante (figure 1.3), ce qui donne une meilleure compression, mais induit un retard au niveau de dรฉcodeur, puisque il doit dรฉcoder la prochaine image I ou P, afin dโ€™รชtre utilisรฉes comme rรฉfรฉrence future par lโ€™image B. le codage/dรฉcodage des images B est donc plus complexe et requiert des mรฉmoires de grandes tailles.

La structure de GOP

Un GOPยฒ dรฉbute toujours par une image I. Ensuite, plusieurs images P suivent ร  des intervalles rรฉguliers. Dans les espaces entre deux images P ou entre une image P et une image I, une ou plusieurs images B soit intercalรฉes. Certains codeurs vidรฉo permettent dโ€™utiliser des GOP contenant plus dโ€™une image I.
Plus le flux gรฉnรฉrรฉ par un codeur contient des images codรฉes en mode intra (I), plus il est รฉditable. Cependant, la taille des images codรฉes en intra (en termes de bits) est plus importante que celle des images P ou B. Augmenter le nombre dโ€™images I au sein du GOP aura donc pour consรฉquence lโ€™augmentation de la taille de la vidรฉo encodรฉe.
Afin de limiter la bonde passante ou lโ€™espace de stockage nรฉcessaire, les vidรฉos pour la diffusion sur internet nโ€™ont gรฉnรฉralement quโ€™une seule image I par GOP.

La taille de GOP

La distance entre deux image I successives est appelรฉe la taille du GOP. Les standards de codages utilisent gรฉnรฉralement des GOP de taille entre 15 et 18, ce qui signifie quโ€™il y a une image I toutes les 14 ou 17 images (combinaison dโ€™images P et B) (figure 1.4).
La structure de GOP est souvent indiquรฉe par deux nombres, par exemple M=3 et N=12. Le premier indique la distance entre deux images dโ€™ancrage rรฉfรฉrences (I ou P), le second indique la distance entre deux images codรฉes en intra (I), cโ€™est la longueur du GOP. La structure du GOP de lโ€™exemple oรน M=3 et N=12 est alors IBBPBBPBBPBBP.

Guide du mรฉmoire de fin d’รฉtudes avec la catรฉgorie High Efficiency Video Coding (HEVC)

ร‰tudiant en universitรฉ, dans une รฉcole supรฉrieur ou dโ€™ingรฉnieur, et que vous cherchez des ressources pรฉdagogiques entiรจrement gratuites, il est jamais trop tard pour commencer ร  apprendre et consulter une liste des projets proposรฉes cette annรฉe, vous trouverez ici des centaines de rapports pfe spรฉcialement conรงu pour vous aider ร  rรฉdiger votre rapport de stage, vous prouvez les tรฉlรฉcharger librement en divers formats (DOC, RAR, PDF).. Tout ce que vous devez faire est de tรฉlรฉcharger le pfe et ouvrir le fichier PDF ou DOC. Ce rapport complet, pour aider les autres รฉtudiants dans leurs propres travaux, est classรฉ dans la catรฉgorie technique de Codage 3D-HEVC oรน vous pouvez trouver aussi quelques autres mรฉmoires de fin d’รฉtudes similaires.

Le rapport de stage ou le pfe est un document d’analyse, de synthรจse et d’รฉvaluation de votre apprentissage, c’est pour cela rapport gratuit propose le tรฉlรฉchargement des modรจles gratuits de projet de fin d’รฉtude, rapport de stage, mรฉmoire, pfe, thรจse, pour connaรฎtre la mรฉthodologie ร  avoir et savoir comment construire les parties d’un projet de fin d’รฉtude.

Table des matiรจres

Introduction gรฉnรฉrale
Chapitre 1 :Codage des vidรฉos 2D (H.264)
1.1 Les formats des vidรฉos
1.1.1 Le concept du conteneur
1.1.2 Le concept du CoDec
1.2 Les types des images et fonctionnement
1.2.1 Les images I
1.2.2 Les images P
1.2.3 Les images B
1.3 La structure et la taille de GOP
1.3.1 La structure de GOP
1.3.2 La taille de GOP
1.4 Espace de reprรฉsentation des donnรฉes images
1.4.1 Espaces couleurs
1.4.2 Echantillonnage dโ€™espace couleur YCrCb
1.5 La prรฉdiction en mode Intra-Frame
1.5.1 Prรฉdiction intra de blocs 16×16 de luminance
1.5.2 Prรฉdiction intra de blocs 4×4 de luminance
1.5.3 Prรฉdiction intra de blocs de 8×8 de chrominance
1.6 La prรฉdiction en mode Inter-Frame
1.6.1 Estimation du mouvement
1.6.2 Compensation du mouvement
1.7 Transformation, Quantification, Codage Entropique
1.7.1 Transformation
1.7.2 Quantification
1.7.2.1 Quantification scalaire
1.7.2.2 Quantification vectorielle
1.7.3 Codage Entropique
1.7.3.1 Run length Encoding (RLE)
1.7.3.2 Ziv, Lempel et Welsh (LZW)
1.7.3.3 Codage ร  longueur variable
1.7.3.3.1 Codage de Huffman
1.7.3.3.2 Codage Arithmรฉtique
1.7.3.4 Context-based Adaptive Variable Length Coding (CAVLC)
1.7.3.5 Context-Adaptive Binary Arithmetic Coding (CABAC)
1.8 Rate-distortion Optimization Cost
Chapitre 2: Hight Efficiency Video Coding (HEVC)

2.1 Echantillonnage et la reprรฉsentation de lโ€™image
2.2 La structure de codage
2.2.1 Blocs et Unitรฉs
2.2.2 Coding Tree Block & Coding Bloc
2.2.3 Bloc de Prรฉdiction
2.2.4 Transform Tree and Transform Block
2.3 Intra Prรฉdiction
2.3.1 Intra Prรฉdiction Angulaire
2.3.2 Intra Prรฉdiction Planar
2.3.3 DC Intra Prรฉdiction
2.4 Inter Prรฉdiction
2.4.1 Advanced Motion Vector Prediction
2.4.1.1 les candidats spatiaux
2.4.1.2 les candidats temporels
2.4.2 ModeMerge
2.4.2.1 les candidats spatiaux
2.4.2.2 Les candidats temporels
2.5 Transformation, Quantification, Codage
2.5.1 La transformation
2.5.2 Quantification
2.5.3 Codage entropique
2.6 Dโ€™autre outils
Chapitre 3: Extension 3D de Hight Efficiency Video Coding (3D-HEVC)
3.1 3D Video Coding
3.1.1 Stereo Video Coding
3.1.2 Multi-view Video Coding
3.1.3 Multi-view plus Depth Video Coding
3.2 La structure de codage Multi-view plus Depth
3.3 Technique de Codage 3D-HEVC
3.3.1 Advanced Texture Coding in 3D-HEVC
3.3.1.1 La prรฉdiction de disparitรฉ compensรฉe
3.3.1.2 Neighbouring Block-Based Disparty Vector Derivation (NBDV)
3.3.1.3 Inter-view motion prรฉdiction
3.3.1.4 Prรฉdiction de Rรฉsiduel inter-vue
3.3.2 Advanced Depth Coding in 3D-HEVC
3.3.2.1 Carte de profondeur et la prรฉdiction de disparitรฉ
3.3.2.2 le codage intra des cartes de profondeurs
Chapitre 4 : Implรฉmentations & rรฉsultats
4-1 Fast encode decision for texture coding in 3D-HEVC
4-1-1 Analyse statistique
4-1-1-1 Analyse le Mode Merge
4-1-1-2 le niveau de subdivision des blocs
4-1-2 Algorithme & rรฉsultats
4-2 Low complexity depth mode decision for 3D-HEVC
4-2-1 Fast depth inter mode selection
4-2-2 Adaptive Depth intra dรฉcision
4-2-3 Algorithme et rรฉsultatsConclusion
Bibliographie

Tรฉlรฉcharger le rapport completExtension 3D de High Efficiency Video Coding (3D-HEVC)

Tรฉlรฉcharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiรฉe. Les champs obligatoires sont indiquรฉs avec *