À propos de la compression MPEG
L’encodage MPEG repose sur l’élimination des informations vidéo redondantes, non seu-
lement au sein d’une image, mais sur une durée donnée. Sur un plan qui comporte peu
de mouvement, comme une interview, la majeure partie du contenuvidéo ne change pas
image après image, et l’encodage MPEG peut considérablement compresser la vidéo,
quasiment sans perte de qualité perceptible.
La compression MPEG réduit les débits de données vidéo de deux manières :
 Compression spatiale (intra-image) : compresse les images individuellement
 Compression temporelle (inter-image) : compresse des groupes d’images en éliminant
les données visuelles redondantes entre plusieurs images
Compression intra-image
Au sein d’une même image, les zones de couleur et de texture similaires peuvent être
codées avec moins de bits que l’original, ce qui réduit le débit de données touten limitant
au maximum la perte visible en termes de qualité perceptible. La compression JPEG fonc-
tionne de la même manière pour compresser les images fixes. La compression intra-image
est utilisée pour créer des images vidéo autonomes appelées images I (la version abrégée
de intra-image).
Compression inter-image
Au lieu de stocker des images complètes, la compression temporelle stocke uniquement
ce qui a changé d’une image à la suivante, ce qui réduit considérablement la quantité de
données à stocker tout en conservant toutefois des images haute qualité.
Groupes d’images
Les formats MPEG utilisent trois types d’images compressées, réunies sous forme
de groupe d’images ou GOP afin d’obtenir une compression inter-image :
 Images I : les images intra, également appelées images de référenceou images clé,
contiennent toutes les données nécessaires pour recréer une image complète.
Une image I existe par elle-même sans nécessiter de données provenant d’autres
images du groupe d’images ou GOP. Chaque GOP contient une image I. Cette image
n’est pas obligatoirement la première du groupe d’images. Les images I constituent les
images MPEG les plus volumineuses mais elles sont aussi plus rapides à décompresser
que les autres types d’images MPEG.
 Images P : les images prédites ou images P sont encodées à partir d’une image
« prédite » basée sur l’image P ou I précédente la plus proche. Les images P sont
également appelées images de référence, car les images P ou B qui les entourent
peuvent y faire référence. Les images P sont généralement beaucoup plus petites
que les images I.
Annexe A
Formats vidéo
431
V
 Images B : les images bidirectionnelles ou images B son encodées via une interpola-
tion effectuée à partir d’images P et I situées avant ou après elles. Les images B
nécessitent peu d’espace mais leur décompression peut prendre plus de temps
car elles dépendent d’images qui peuvent elles-mêmes dépendre d’autres images.
Une image B peut débuter un groupe d’images, mais elle ne peut pas le terminer.
Les GOP sont définies par trois facteurs : leur modèle d’images I, P et B, leur longueur,
et leur « ouverture » ou « fermeture ».
Modèle de groupe d’images
Un modèle de groupe d’images est défini par le rapport entre les images B et P au sein
d’un groupe d’images. Les modèles courants utilisés pour les DVD sont IBP et IBBP.
Un modèle ne contient pas obligatoirement les trois types d’images. Par exemple, un
modèle I-P peut être utilisé. Les modèles de groupe d’images IBP et IBBP, associés à des
longueurs GOP plus grandes, encodent la vidéo de manière très efficace. Des modèles
de GOP plus petits, associés à des longueurs plus courtes, fonctionnent mieux avec la
vidéo qui contient des mouvements rapides, mails ils ne compressent pas autant le
débit des données.
Certains encodeurs peuvent imposer l’ajout d’images I de façon sporadique dans le flux
d’un groupe d’images. Ces images I peuvent être positionnées manuellement au cours de
l’édition ou de manière automatique par un encodeur qui détecte des changements
visuels soudains tels que les coupes, les transitions et les mouvements rapides de caméra.
Longueur des groupes d’images
Des longueurs de GOP plus grandes permettent un encodage vidéo plus efficace grâce
à la réduction du nombre d’images I. Elles sont toutefois moins appropriées aux effets
brefs comme des transitions ou des panoramiques rapides. La vidéo MPEG peut être
répartie en deux catégories : GOP long et GOP court. L’expression GOP long fait réfé-
rence au fait que plusieurs images B et P sont utilisées dans les intervalles entre cha-
que image I. À l’autre extrémité, les images MPEG de type GOP court sont identiques
aux images I de type MPEG. Les formats tels que le format IMX utilisent les modèles
de compression MPEG-2 à images I uniquement, ce qui réduit les défauts temporels
et améliore les performances du montage. Toutefois, les formats à images I unique-
ment ont un débit de données nettement supérieur car chaque image doit stocker suf-
fisamment de données pour être complètement autonome. Par conséquent, bien que
les besoins en décodage soient diminués sur votre ordinateur, ceux relatifs à la rapidité
et à la capacité de traitement du disque de travail sont supérieurs.
La longueur maximale d’un GOP dépend des spécifications du périphérique de lecture.
La longueur minimale d’un GOP dépend du modèle de GOP utilisé. Par exemple,
la longueur d’un modèle I-P peut être très courte et comporter deux images.
432
Partie V
Annexes
Voici quelques exemples de longueurs de GOP utilisées dans les formats MPEG courants :
 MPEG-2 pour DVD : la longueur maximale du GOP est de 18 images pour NTSC et
de 15 images pour PAL. Ces longueurs de GOP peuvent être doublées dans le cadre
d’une séquence progressive.
 HDV 1080 lignes : utilise une structure de type GOP long de 15 images.
 HDV 720 lignes : utilise une structure de GOP à 6 images
 IMX : utilise uniquement des images I.
Groupes d’images ouverts et fermés
Un groupe d’images ouvert permet aux images B d’un GOP de référencer une image
I ou P d’un groupe voisin. Les groupes d’images ouverts sont très utiles mais ils ne
permettent pas d’effectuer certaines opérations, comme la vidéo DVD multi-angle
multiplexée. Un groupe d’images fermé utilise uniquement des GOP auto-contenus
qui ne dépendent pas d’images externes.
Un même modèle de GOP peut produire différents résultats selon qu’il est utilisé avec
un GOP ouvert ou fermé. Par exemple, un GOP fermé débutera un modèle IBBP par une
image I, alors qu’un GOP ouvert pourrait débuter le même modèle avec une image B.
Dans cet exemple, il est plus efficace de débuter par une image B car débuter par une
image I nécessiterait l’ajout d’une image P supplémentaire à la fin (un GOP ne peut pas
se terminer par une image B).
Flux et conteneurs MPEG
Les données audio et vidéo MPEG sont regroupées dans des conteneurs de données indi-
viduels appelés flux. Conserver des flux audio et vidéo distincts permet aux applications
de lecture de passer très facilement d’un flux à l’autre, à la volée. Par exemple, les DVD
qui utilisent de la vidéo au format MPEG-2 peuvent passer d’une piste audio à l’autre,
d’un angle vidéo à l’autre au cours de la lecture du DVD.
:06 :07 :08 :09
:09
:10 :11 :12 :13 :14 :15 :16 :17 :18 :19 :20 :21
:04 :05
GOP ouvert
(IBBP, 15 images)
I B B P B B P B B P B B P B B I
B B
P
:03
:06 :07 :08
:10 :11 :12 :13 :14 :15 :16 :17 :18
:04 :05
GOP fermé
(IBBP, 15 images)
P B B P B
P B
P B P
I B
B
B
B
Annexe A
Formats vidéo
433
V
Chaque norme MPEG présente des différences, mais en général, les formats MPEG
prennent en charge les deux types de flux de base suivants :
 Flux élémentaires : il s’agit de flux de données audio et vidéo individuels.
 Flux système : ces flux associent, ou multiplexent, des flux élémentaires audio et vidéo.
Ils sont également appelés flux multiplexés. Pour lire ces flux, les applications doivent être
capables de les démultiplexer en flux élémentaires. Certaines applications ne peuvent
lire que des flux élémentaires.