Mรฉmoire de fin dโรฉtudes systรจmes intelligents et rรฉseaux
LES FORMATS DES VIDEOS
Un flux vidรฉo est composรฉ dโune succession dโimages qui dรฉfilent ร un rythme fixe pour donner lโillusion du mouvement, par exemple 25 images ou bien 30 images par seconde. On trouve gรฉnรฉralement un flux audio et dโautres informations comme des sous-titres, des menus, des chapitrages, des interactions et des mรฉtadonnรฉes, des informations de propriรฉtรฉs sur la vidรฉo comme la date de crรฉation, le nom de la vidรฉo, son auteur, etc.
Il existe une multitude de formats vidรฉo, AVI (Audio Video Interleave) de Microsoft, MPEG (Moving Picure Expert Group) de lโorganisme du mรชme nom, FLV (Flash Video) dโAdobe. Ce quโil faut savoir, cโest quโun format rรฉsulte de deux concepts techniques distincts : les conteneurs et les CoDecs.
Le concept du conteneur
Le conteneur dรฉcrit la structure du fichier. Il est utilisรฉ pour stocker la vidรฉo, son flux dโimages, flux audio et mรฉtadonnรฉes, selon un schรฉma bien dรฉfini. Il prรฉcise notamment quel codec vidรฉo et potentiellement audio sont utilisรฉs. Il peut รฉgalement intรฉgrer des sous titres ou des chapitrages. Le principal objectif du conteneur est donc dโorganiser la coexistence entre lโimage, le son, รฉventuellement du texte et dโautres donnรฉes liรฉes. Dans le langage du monde vidรฉo, on parle de multiplexage.
On peut imaginer un conteneur comme une boite avec plusieurs objets ร lโintรฉrieur mais rangรฉs dโune faรงon bien dรฉfinie. Le conteneur utilisรฉ est gรฉnรฉralement identifiรฉ grรขce ร lโextension du fichier de la vidรฉo. Cโest pour cette raison que cette notion est souvent confondue avec la notion de format, car il arrive que le nom du format soit identique au nom de son conteneur.
Le concept du CoDec
On retrouve donc dans chaque conteneur les donnรฉes audio et vidรฉo. Mais en amont, ces donnรฉes doivent รชtre encodรฉes pour correspondre au format attendu en optimisant la compression avec perte de qualitรฉ minimum. Cโest le rรดle de CoDec, abrรฉviation de ยซ Codeur/Dรฉcodeur ยป. Il propose une mรฉthode pour encoder les signaux vidรฉo et audio selon un format attendu par le conteneur (figure 1.2). Sโil lโon reprend lโimage de notre conteneur en tant quโune boite, le codec dรฉcrit la mรฉthode pour ranger ou dรฉballer correctement les diffรฉrents objets composants la vidรฉo. Lโefficacitรฉ dโun codec se mesure dโune part dans ses capacitรฉs de compression, mais aussi de dรฉcompression, cโest-ร -dire ร rรฉtablir la vidรฉo lors de sa diffusion au plus prรจs de sa qualitรฉ dโorigine et dans un dรฉbit performant.
Ce quโil faut comprendre cโest que les conteneurs les plus utilisรฉs supportent diffรฉrents CoDecs, et un CoDec ne peut pas รชtre utilisรฉ avec nโimporte quel conteneur. Il y a une question de compatibilitรฉ (tableau 1.2).
CODAGE DES VIDEOS 2D
Les images de type I
Sont des images codรฉes en mode Intra-Frame. Ce sont des images de rรฉfรฉrence appelรฉes รฉgalement images clรฉs (KeyFrame en anglais). Ce sont des images autonomes, cโest-ร -dire qui peuvent รชtre dรฉcodรฉes sans rรฉfรฉrences ร dโautres images (Fig 1.3). Elles permettent dโassurer la cohรฉsion de la sรฉquence vidรฉo, comme elles permettent aussi de garantir la qualitรฉ rรฉsultante de la compression. La premiรจre image de la sรฉquence vidรฉo est de type I, en gรฉnรฉral il y en a une ou deux par seconde.
Les images P
Les images de type P, sont des images codรฉes en mode Inter-Frame. Ce sont des images prรฉdictives qui fait rรฉfรฉrence aux parties (macroblocsยน) des images I et/ou P antรฉrieures pour le codage de lโimage (figure 1.3). Une image P nรฉcessite gรฉnรฉralement moins de bits quโune image I, mais elle peut รชtre sensible aux erreurs en raison de la dรฉpendance complexe vis-ร -vis des images P et/ou I antรฉrieures.
Les images B
Les images de type B, sont des images aussi codรฉes en mode Inter-Frame. Ce sont des images Bi-prรฉdictives ou images prรฉdites bi-directionnellement, appelรฉes aussi images prรฉdites en arriรจre (backwards-predicted frames ne anglais) [1]. Les images B sont assez similaires aux images P, ร la diffรฉrence quโelles peuvent รชtre prรฉdites ร partir de deux images de rรฉfรฉrence, une antรฉrieure et lโautre postรฉrieure ร lโimage courante (figure 1.3), ce qui donne une meilleure compression, mais induit un retard au niveau de dรฉcodeur, puisque il doit dรฉcoder la prochaine image I ou P, afin dโรชtre utilisรฉes comme rรฉfรฉrence future par lโimage B. le codage/dรฉcodage des images B est donc plus complexe et requiert des mรฉmoires de grandes tailles.
La structure de GOP
Un GOPยฒ dรฉbute toujours par une image I. Ensuite, plusieurs images P suivent ร des intervalles rรฉguliers. Dans les espaces entre deux images P ou entre une image P et une image I, une ou plusieurs images B soit intercalรฉes. Certains codeurs vidรฉo permettent dโutiliser des GOP contenant plus dโune image I.
Plus le flux gรฉnรฉrรฉ par un codeur contient des images codรฉes en mode intra (I), plus il est รฉditable. Cependant, la taille des images codรฉes en intra (en termes de bits) est plus importante que celle des images P ou B. Augmenter le nombre dโimages I au sein du GOP aura donc pour consรฉquence lโaugmentation de la taille de la vidรฉo encodรฉe.
Afin de limiter la bonde passante ou lโespace de stockage nรฉcessaire, les vidรฉos pour la diffusion sur internet nโont gรฉnรฉralement quโune seule image I par GOP.
La taille de GOP
La distance entre deux image I successives est appelรฉe la taille du GOP. Les standards de codages utilisent gรฉnรฉralement des GOP de taille entre 15 et 18, ce qui signifie quโil y a une image I toutes les 14 ou 17 images (combinaison dโimages P et B) (figure 1.4).
La structure de GOP est souvent indiquรฉe par deux nombres, par exemple M=3 et N=12. Le premier indique la distance entre deux images dโancrage rรฉfรฉrences (I ou P), le second indique la distance entre deux images codรฉes en intra (I), cโest la longueur du GOP. La structure du GOP de lโexemple oรน M=3 et N=12 est alors IBBPBBPBBPBBP.
Guide du mรฉmoire de fin d’รฉtudes avec la catรฉgorie High Efficiency Video Coding (HEVC) |
รtudiant en universitรฉ, dans une รฉcole supรฉrieur ou dโingรฉnieur, et que vous cherchez des ressources pรฉdagogiques entiรจrement gratuites, il est jamais trop tard pour commencer ร apprendre et consulter une liste des projets proposรฉes cette annรฉe, vous trouverez ici des centaines de rapports pfe spรฉcialement conรงu pour vous aider ร rรฉdiger votre rapport de stage, vous prouvez les tรฉlรฉcharger librement en divers formats (DOC, RAR, PDF).. Tout ce que vous devez faire est de tรฉlรฉcharger le pfe et ouvrir le fichier PDF ou DOC. Ce rapport complet, pour aider les autres รฉtudiants dans leurs propres travaux, est classรฉ dans la catรฉgorie technique de Codage 3D-HEVC oรน vous pouvez trouver aussi quelques autres mรฉmoires de fin d’รฉtudes similaires.
|
Table des matiรจres
Introduction gรฉnรฉrale
Chapitre 1 :Codage des vidรฉos 2D (H.264)
1.1 Les formats des vidรฉos
1.1.1 Le concept du conteneur
1.1.2 Le concept du CoDec
1.2 Les types des images et fonctionnement
1.2.1 Les images I
1.2.2 Les images P
1.2.3 Les images B
1.3 La structure et la taille de GOP
1.3.1 La structure de GOP
1.3.2 La taille de GOP
1.4 Espace de reprรฉsentation des donnรฉes images
1.4.1 Espaces couleurs
1.4.2 Echantillonnage dโespace couleur YCrCb
1.5 La prรฉdiction en mode Intra-Frame
1.5.1 Prรฉdiction intra de blocs 16×16 de luminance
1.5.2 Prรฉdiction intra de blocs 4×4 de luminance
1.5.3 Prรฉdiction intra de blocs de 8×8 de chrominance
1.6 La prรฉdiction en mode Inter-Frame
1.6.1 Estimation du mouvement
1.6.2 Compensation du mouvement
1.7 Transformation, Quantification, Codage Entropique
1.7.1 Transformation
1.7.2 Quantification
1.7.2.1 Quantification scalaire
1.7.2.2 Quantification vectorielle
1.7.3 Codage Entropique
1.7.3.1 Run length Encoding (RLE)
1.7.3.2 Ziv, Lempel et Welsh (LZW)
1.7.3.3 Codage ร longueur variable
1.7.3.3.1 Codage de Huffman
1.7.3.3.2 Codage Arithmรฉtique
1.7.3.4 Context-based Adaptive Variable Length Coding (CAVLC)
1.7.3.5 Context-Adaptive Binary Arithmetic Coding (CABAC)
1.8 Rate-distortion Optimization Cost
Chapitre 2: Hight Efficiency Video Coding (HEVC)
2.1 Echantillonnage et la reprรฉsentation de lโimage
2.2 La structure de codage
2.2.1 Blocs et Unitรฉs
2.2.2 Coding Tree Block & Coding Bloc
2.2.3 Bloc de Prรฉdiction
2.2.4 Transform Tree and Transform Block
2.3 Intra Prรฉdiction
2.3.1 Intra Prรฉdiction Angulaire
2.3.2 Intra Prรฉdiction Planar
2.3.3 DC Intra Prรฉdiction
2.4 Inter Prรฉdiction
2.4.1 Advanced Motion Vector Prediction
2.4.1.1 les candidats spatiaux
2.4.1.2 les candidats temporels
2.4.2 ModeMerge
2.4.2.1 les candidats spatiaux
2.4.2.2 Les candidats temporels
2.5 Transformation, Quantification, Codage
2.5.1 La transformation
2.5.2 Quantification
2.5.3 Codage entropique
2.6 Dโautre outils
Chapitre 3: Extension 3D de Hight Efficiency Video Coding (3D-HEVC)
3.1 3D Video Coding
3.1.1 Stereo Video Coding
3.1.2 Multi-view Video Coding
3.1.3 Multi-view plus Depth Video Coding
3.2 La structure de codage Multi-view plus Depth
3.3 Technique de Codage 3D-HEVC
3.3.1 Advanced Texture Coding in 3D-HEVC
3.3.1.1 La prรฉdiction de disparitรฉ compensรฉe
3.3.1.2 Neighbouring Block-Based Disparty Vector Derivation (NBDV)
3.3.1.3 Inter-view motion prรฉdiction
3.3.1.4 Prรฉdiction de Rรฉsiduel inter-vue
3.3.2 Advanced Depth Coding in 3D-HEVC
3.3.2.1 Carte de profondeur et la prรฉdiction de disparitรฉ
3.3.2.2 le codage intra des cartes de profondeurs
Chapitre 4 : Implรฉmentations & rรฉsultats
4-1 Fast encode decision for texture coding in 3D-HEVC
4-1-1 Analyse statistique
4-1-1-1 Analyse le Mode Merge
4-1-1-2 le niveau de subdivision des blocs
4-1-2 Algorithme & rรฉsultats
4-2 Low complexity depth mode decision for 3D-HEVC
4-2-1 Fast depth inter mode selection
4-2-2 Adaptive Depth intra dรฉcision
4-2-3 Algorithme et rรฉsultatsConclusion
Bibliographie
Tรฉlรฉcharger le rapport complet