圧縮について
MPEG
エンコードは、基本的に
1
つのフレーム内だけでなく特定の期間にわたる冗長なビデオ情
報を除去します。インタビューなど動きがあまりないショットでは、ビデオの内容の大部分でフ
レーム間に変化がないので、品質をほとんど損なうことなく、
MPEG
エンコードでビデオを大幅
に圧縮することができます。
MPEG
圧縮では、次の
2
つの方法でビデオのデータレートを下げています:
Â
空間的(フレーム内)圧縮: フレームを個別に圧縮します。
Â
時間的(フレーム間)圧縮: 複数のフレームで冗長な素材データを排除し、複数のフレームを
まとめて圧縮します。
フレーム内圧縮
1
フレーム内で、色やテクスチャが類似する領域のコーディングをオリジナルよりも少ないビッ
ト数で処理し、イメージ品質の低下を最低限にとどめながら、データレートを低減します。
JPEG
圧縮における静止画の圧縮も、これと同じ手法がとられます。フレーム内圧縮を行うことで、I
フレーム(Intraframe(フレーム内)の略)と呼ばれる単独のビデオフレームが作成されます。
394
Part V
付録
フレーム間圧縮
時間的圧縮方式では、完全なフレームを保存する代わりに、フレーム間で変更された部分だけを
保存することにより、保存するデータ量を大幅に減らしながら、高品質のイメージを得ることが
できます。
イメージのグループ
MPEG
形式は
3
種類の圧縮フレームを使います。これらは、GOP(Group of Pictures)を構成
し、フレーム間圧縮を実行します:
Â
I フレーム:
I
(
Intra
)フレームは参照フレームまたはキーフレームとも呼ばれ、完成したイメー
ジを再現するために必要なすべてのデータが含まれています。
I
フレームは独立したフレームで
あり、
GOP
のほかのフレームの情報を必要としません。各
GOP
には
I
フレームが
1
つずつ必
ず含まれています。ただし、
I
フレームが
GOP
の最初のフレームである必要はありません。
I
フ
レームは一番大きなタイプの
MPEG
フレームですが、
ほかの種類の
MPEG
フレームよりも速く
伸張できます。
Â
P フレーム:
P
(
Predicted
)フレームは、直前の
I
フレームまたは
P
フレームに基づいて「予想」
されたピクチャを元にエンコードされます。
P
フレームは、隣接している
B
フレームや
P
フ
レームから参照されるため、参照フレームとも呼ばれます。通常、
P
フレームは
I
フレームよ
りも大幅に小さくなります。
Â
B フレーム:
B
(
Bi-directional
)フレームは、前後の
I
フレームおよび
P
フレームによる補完法
に基づいてエンコードされます。
B
フレームは少ない容量で済みますが、フレーム間の依存が
多くなるため伸張するのに時間がかかります。
B
フレームは、
GOP
の最初のフレームにでき
ますが、最後のフレームにはできません。
GOP
は次の
3
つの要因で定義されます:
I
、
P
、および
B
フレームのパターン、長さ、および
GOP
が「オープン」と「クローズ」のどちらであるかです。
GOP
のパターン
GOP
のパターンは、
GOP
内の
P
フレームと
B
フレームの比率によって決まります。
DVD
で一
般的なパターンは、
IBP
と
IBBP
です。
3
つすべてのフレームタイプをパターンで使う必要はあ
りません。たとえば、
IP
パターンも可能です。
IBP
および
IBBP GOP
パターンは、
GOP
の長さ
が長いほど、効率的にビデオをエンコードします。すばやい動きのビデオでは、パターンが小さ
く、長さが短い
GOP
になるほど効果的ですが、その分データレートは圧縮されなくなります。
一部のエンコーダは、ストリームの
GOP
全体に
I
フレームを散発的に追加することができます。
このような
I
フレームは、編集時に手動で配置できるほか、カット、トランジション、すばやい
カメラ移動など、視覚上の突然の変化をエンコーダで検出して自動的に追加できます。
付録
A
ビデオ形式
395
V
V
V
V
GOP
の長さ
GOP
の長さが長くなると、
I
フレームの数が減るためビデオは効率的にエンコードされます。し
かし、高速なトランジションやすばやいカメラパンなど短時間のエフェクトでは満足できる素材
が得られません。
MPEG
ビデオは long-GOP と short-GOP に分類できます。long-GOP は、
I
フレーム間で複数の
P
フレームと
B
フレームが使われることを意味します。一方、
short-GOP
MPEG
は
I
フレームのみの
MPEG
を指します。
IMX
などの形式では、
I
フレームのみの
MPEG-2
が使用され、一時的な生成物を減らして、編集時のパフォーマンスを高めています。ただし、
I
フレームのみの形式では、完全に独立再生できるよう各フレームに十分な量のデータを含める必
要があることから、データレートは大幅に増します。このため、コンピュータのデコードに要す
るリソースは少なく済みますが、取り込み先ディスクの速度と容量に対する要求が高くなります。
GOP
の最大長は、再生デバイスの仕様によって決まります。
GOP
の最小長は、
GOP
のパターン
によって決まります。たとえば、
IP
パターンの最小長は
2
フレームになります。
一般的な
MPEG
形式で使われる
GOP
の長さの例を示します:
Â
DVD 向けの MPEG-2の場合:
GOP
の最大長は、
NTSC
で
18
フレーム、
PAL
で
15
フレームになり
ます。これらの
GOP
の長さは、プログレッシブスキャンの素材の場合は
2
倍にできます。
Â
1080 ラインの HDV: 長さが
15
フレームの
long-GOP
構造を使用します。
Â
720 ラインの HDV:
6
フレームの
GOP
構造を使用します。
Â
IMX:
I
フレームのみを使用します。
オープン
GOP
とクローズ
GOP
オープン
GOP
では、ある
GOP
の
B
フレームが隣接する
GOP
の
I
フレームまたは
P
フレームを
参照できます。オープン
GOP
は非常に効率的ですが、マルチプレクス処理されたマルチアング
ルの
DVD
ビデオなどには使えません。クローズ
GOP
形式は、その
GOP
内に含まれるフレーム
のみが使われ、外部のフレームは使われません。
396
Part V
付録
GOP
がオープンかクローズかによって、同じ
GOP
のパターンでも結果は異なります。たとえば、
IBBP
パターンのクローズ
GOP
は
I
フレームで始まりますが、同じパターンのオープン
GOP
は
B
フレームで始めることができます。この例で、
I
フレームで始めると、 余分な
P
フレームを最後
に追加する必要があるため(
GOP
は
B
フレームで終了できないため)、
B
フレームで始める方が
若干効率的になります。
MPEG
のコンテナとストリーム
MPEG
のビデオとオーディオデータは、ストリームと呼ばれる別個のデータコンテナにパッケー
ジ化されます。ビデオストリームとオーディオストリームを別々にすることで、再生アプリケー
ションでストリーム間を簡単にすばやく切り替えることができます。たとえば、
MPEG-2
ビデオ
を使う
DVD
は、
DVD
の再生時に複数のオーディオトラックとビデオアングルを切り替えられ
ます。
MPEG
の各標準規格にはさまざまなバリエーションがありますが、一般に、
MPEG
形式は基本的
に次の種類のストリームをサポートしています:
Â
エレメンタリーストリーム: ビデオとオーディオデータのストリームが分かれています。
Â
システムストリーム: これらのストリームは、ビデオおよびオーディオのエレメンタリースト
リームを結合、つまり多重化します。これらは、多重化ストリームとも呼ばれます。これらの
ストリームを再生するアプリケーションは、多重化を解除してストリームを元のエレメンタ
リーストリームに戻す必要があります。アプリケーションの中には、エレメンタリーストリー
ムしか再生できないものもあります。
:06 :07 :08 :09
:09
:10 :11 :12 :13 :14 :15 :16 :17 :18 :19 :20 :21
:04 :05
オープン
GOP
(
IBBP
、
15
フレーム)
I B B P B B P B B P B B P B B I
B B
P
:03
:06 :07 :08
:10 :11 :12 :13 :14 :15 :16 :17 :18
:04 :05
クローズ
GOP
(
IBBP
、
15
フレーム)
P B B P B
P B
P B P
I B
B
B
B
付録
A
ビデオ形式
397
V
V
V
V