Informationen zur MPEG-Komprimierung
Die MPEG-Codierung basiert auf der Beseitigung redundanter Videoinformationen, nicht
nur innerhalb eines Bilds, sondern innerhalb eines Zeitraums. Bei einer Einstellung mit
wenig Bewegung wie einem Interview ändert sich der Großteil des Videoinhalts nicht von
Bild zu Bild. Die MPEG-Codierung kann das Video daher mit geringem oder keinem wahr-
nehmbaren Qualitätsverlust stark komprimieren.
Bei der MPEG-Komprimierung werden die Videodatenraten auf zwei Arten verringert:
 Räumliche Intraframe-Komprimierung: Komprimiert einzelne Bilder
 Im Zeitverlauf angewendete Interframe-Komprimierung: Komprimiert Gruppen von
Bildern, indem redundante visuelle Daten bildübergreifend entfernt werden
Anhang A
Videoformate
437
V
Intraframe-Komprimierung
Innerhalb eines einzelnen Bilds können Bereiche mit ähnlicher Farbe und Struktur mit
weniger Bit codiert werden als das Original, wodurch die Datenrate mit minimalem
visuellen Verlust reduziert wird. Die JPEG-Komprimierung arbeitet auf ähnliche Weise,
um Standbilder zu komprimieren. Die Intraframe-Komprimierung wird verwendet,
um eigenständige Videobilder, so genannte I-Bilder bzw. I-Frames (kurz für Intraframe),
zu erstellen.
Interframe-Komprimierung
Statt vollständige Bilder zu speichern, wird bei der zeitabhängigen Komprimierung nur
gespeichert, was sich von einem Bild zum nächsten geändert hat. Dies reduziert die
Datenmenge, die gespeichert werden muss, erheblich, während dennoch eine hohe
Bildqualität erreicht wird.
Gruppen von Bildern – GOP
MPEG-Formate verwenden drei Typen von komprimierten Bildern, die in einer Gruppe
von Bildern
bzw. Group of Pictures, GOP verwaltet werden, um eine Interframe-Kompri-
mierung zu realisieren:
 I-Frames: Intra (I)-Frames, auch als Bezugs- oder Keyframes bezeichnet, enthalten alle
erforderlichen Daten, um ein vollständiges Bild erneut zu erstellen. Ein I-Frame ist
eigenständig und erfordert keine Daten aus anderen Bildern in der GOP. Jede GOP ent-
hält einen I-Frame, dies muss jedoch nicht das erste Bild der GOP sein. I-Frames sind
zwar relativ groß, können jedoch schneller dekomprimiert werden als andere Arten
von MPEG-Bildern.
 P-Frames: Predicted (P)-Frames werden anhand eines „vorausgesagten“ Bilds basie-
rend auf dem unmittelbar vorangehenden I- oder P-Frame codiert. P-Frames werden
auch als Bezugsbilder bezeichnet, da die angrenzenden B- und P-Frames darauf ver-
weisen können. P-Frames sind normalerweise viel kleiner als I-Frames.
 B-Frames: Bidirectional (B)-Frames werden basierend auf einer Interpolation von
I- und P-Frames codiert, die vor und nach diesen kommen. B-Frames erfordern sehr
wenig Speicherplatz, ihre Dekomprimierung kann jedoch länger dauern, weil sie auf
Bildern basieren, die auf anderen Bildern basieren können. Eine GOP kann mit einem
B-Bild beginnen, aber nicht mit einem solchen enden.
GOPs werden durch drei Faktoren definiert: ihr Muster von I-, P- und B-Frames, ihre
Länge und ob die GOP „offen“ oder „geschlossen“ ist.
438
Teil V
Anhänge
GOP-Muster
Ein GOP-Muster wird durch das Verhältnis von P- zu B-Frames innerhalb einer GOP
definiert. Gängige für DVD verwendete Muster sind IBP und IBBP. Es müssen nicht
alle drei Bildtypen in einem Muster verwendet werden. So kann beispielsweise ein
IP-Muster verwendet werden. IBP- und IBBP-GOP-Muster in Verbindung mit längeren
GOP-Dauern ermöglichen eine sehr effiziente Videocodierung. Kleinere GOP-Muster
mit kürzeren GOP-Dauern funktionieren besser mit Videomaterial, das schnelle Bewe-
gungen aufweist, komprimieren aber die Datenrate nicht so stark.
Einige Codecs können erzwingen, dass I-Frames sporadisch in GOPs eines Datenstroms
hinzugefügt werden. Diese I-Frames können manuell während des Schnitts oder automa-
tisch durch einen Codec platziert werden, der abrupte visuelle Änderungen wie Schnitte,
Übergänge und schnelle Kamerabewegungen erkennt.
GOP-Dauer
Durch Verringern der Anzahl der I-Frames ermöglichen längere GOP-Dauern eine
effizientere Videocodierung. Sie sind bei Effekten mit kurzer Dauer wie schnellen
Übergängen oder schnellen Kameraschwenks aber weniger wünschenswert. MPEG-
Videos können als lange GOP oder kurze GOP klassifiziert werden. Der Begriff lange GOP
bezieht sich auf den Umstand, dass mehrere P- und B-Frames zwischen I-Frame-Inter-
vallen verwendet werden. MPEG-Material mit kurzer GOP ist hingegen gleichbedeu-
tend mit MPEG-Material nur mit I-Frames. Formate wie IMX verwenden eine „MPEG-2-
Komprimierung mit I-Frames“, wodurch zeitbasierte Bildfehler reduziert und die
Schnittperformance verbessert wird. Allerdings weisen reine I-Frame-Formate eine
bedeutend höhere Datenrate auf, weil jedes Bild genug Daten speichern muss, um voll-
ständig in sich abgeschlossen zu sein. Während die Komprimierungsanforderungen an
Ihren Computer geringer sind, steigen die Anforderungen an Geschwindigkeit und
Kapazität der Arbeitsvolumes.
Die maximale GOP-Dauer hängt von den Spezifikationen des Wiedergabegeräts ab. Die
minimale GOP-Dauer hängt vom GOP-Muster ab. So kann beispielsweise ein IP-Muster
eine Dauer von minimal zwei Bildern aufweisen.
Folgende Beispiele geben die in gängigen MPEG-Formaten verwendete GOP-Dauer an:
 MPEG-2 für DVD: Die maximale GOP-Dauer ist 18 Bilder für NTSC oder 15 Bilder für
PAL. Diese GOP-Dauern können für progressives Material verdoppelt werden.
 1080-Zeilen-HDV: Verwendet eine lange GOP-Struktur, die 15 Bilder lang ist.
 720-Zeilen-HDV: Verwendet eine GOP-Struktur mit sechs Bildern.
 IMX: Verwendet nur I-Frames.
Anhang A
Videoformate
439
V
Offene und geschlossene GOPs
Eine offene GOP ermöglicht B-Frames aus einer GOP, auf einen I- oder P-Frame in einer
angrenzenden GOP zu verweisen. Offene GOPs sind sehr effizient, können aber nicht
für Funktionen wie Multiplex-DVD-Video mit mehreren Kameraperspektiven verwen-
det werden. Ein geschlossenes GOP-Format verwendet nur eigenständige GOPs, die
nicht auf Bildern außerhalb der GOP basieren.
Dasselbe GOP-Muster kann unterschiedliche Ergebnisse erzeugen, wenn es mit einer
offenen oder geschlossenen GOP verwendet wird. So würde beispielsweise bei einer
geschlossenen GOP ein IBBP-Muster mit einem I-Frame beginnen, während bei einer
offenen GOP dasselbe Muster mit einem B-Frame beginnen würde. In diesem Beispiel
ist das Beginnen mit einem B-Frame etwas effizienter, weil das Beginnen mit einem
I-Frame bedeutet, dass ein zusätzlicher P-Frame am Ende hinzugefügt werden muss
(eine GOP darf nicht mit einem B-Frame enden).
MPEG-Container und -Datenströme
MPEG-Video- und -Audiodaten werden in getrennten Datencontainern (Datenströmen)
gesichert. Das Trennen von Video- und Audio-Datenströmen ermöglicht es Programmen
für die Wiedergabe, ohne großen Aufwand unmittelbar zwischen Datenströmen umzu-
schalten. So kann beispielsweise bei DVDs mit MPEG-2-Videomaterial zwischen mehreren
Audiospuren und Kameraperspektiven umgeschaltet werden, während die DVD wieder-
gegeben wird.
Jeder MPEG-Standard ist ein wenig anders, MPEG-Formate unterstützen im Allgemeinen
jedoch zwei grundlegende Arten von Datenströmen:
 ES-Datenströme (Elementary Streams, ES): Dies ist der Oberbegriff für codierte Video-
und Audio-Datenströme.
 SS-Datenströme (System Sreams, SS): Diese Datenströme bündeln Video- und Audio-
ES-Datenströme. Sie werden auch als Multiplex-Streams bezeichnet. Zur Wiedergabe
dieser Datenströme müssen Programme in der Lage sein, die Datenströme wieder in
die ES-Datenströme zu zerlegen. Einige Programme sind nur in der Lage, ES-Daten-
ströme wiederzugeben.
:06 :07 :08 :09
:09
:10 :11 :12 :13 :14 :15 :16 :17 :18 :19 :20 :21
:04 :05
Offenes GOP
(IBBP, 15 Bilder)
I B B P B B P B B P B B P B B I
B B
P
:03
:06 :07 :08
:10 :11 :12 :13 :14 :15 :16 :17 :18
:04 :05
Geschlossenes GOP
(IBBP, 15 Bilder)
P B B P B
P B
P B P
I B
B
B
B
440
Teil V
Anhänge