おいしくいただくMPEG2の料理法

 

尾上泰夫

 

 

DVDを創ろうと考える諸兄へ

これからはHDTVよりネットワーク配信のビデオが重用になる。

そう独断で前置きをしながら話をしたいと思う。

なぜなら、今の日本でコストが増えるHDTVがもたらすビジネスメリットを制作の立場で見つけ難いと思っているからだ。映像屋の商品はコンテンツと、制作技術である。ご賛同頂けると思うが、現実の制作見積りに並ぶのは機材のレンタルや、頭数の拘束時間を日当で計算する人材派遣に似た項目である。違った商品形態を考えなくてはならない。

権利問題を考えていく中で、まずは映像を商品としたときの納品形態の変化に注目していただきたいのである。そして、その制作課程で権利の所在を模索する試みも行なっていただきたいのである。

従来の完パケ納品のVTR原版を野菜に例えるなら、農家が出荷する野菜そのものであろう。

食品は加工することで納品形態を変えて、新しい商品へと変貌して行く。

野菜炒めになった時に、利益率も素材とは違う次元へ変化していく。

映像も期待される利用シーンの変化に先んじて、加工技術を取り入れ、新しい納品形態に映像ビジネスを成り立たせていきたいものだ。

そのきっかけとなりそうなのがDVDであり、ネットワーク配信のストリームビデオなのだ。

 

今月はDVD制作を考える上で避けて通れない、ビデオをMPEG2へエンコードする作業を考えて見たい。

ビデオ制作の現場から考えるとVTRという機械は、ブラックボックスとして程よい映像の入れ物だったと言えよう。従来、記録方式を変えることは、すなわちデッキを交換することだった。実際の記録方式がベータカムであろうとDVCAMであろうと、出力コネクターから出てくるビデオ信号だけ意識していれば編集は良かったものだ。しかし、DVDの場合は記録方式に目を向けないと、品質をコントロールすることができない。

 

瑞々しいビデオ品質を守る圧縮の「いろは」

ビデオの編集室で見るマスターテープは美しい物だ。それが配布用のVHSなどにダビングされてくると、がっかりするほど品質が落ちてしまう。そんな経験をお持ちの方が多いだろう。この品質を上げることはアナログコピーであるかぎり至難の業だ。

ところが、デジタルメディアであるDVDは、極端な話、マスターそのままのデーターを入れる事も出来るのである。

注意していただきたいのは、現時点では入れる事は出来ても再生不可能なシロモノに成ってしまう。だが、再生能力さえ追いついてくれば原版データと寸部違わぬ 物が作ることが可能になっているということだ。

ここで、DVDというディスクメディアの機械的な再生能力という制約を知っておく必要が出てくる。現在のDVD規約では映像のビットレートの最大は9.8Mbpsに制限されているのだ。1秒間に9.8Mビットの転送に映像を押さえ込むには高度な圧縮技術が必用になる。

この工程をエンコードと呼び、実行する物をエンコーダと言っている。

ビットレートを限界まで高くすれば品質は向上するが、当然、収録できる時間は減ってしまう。必用な時間を収録しつつ、最良の品質のパラメータやビットレートを探ることがノウハウになってきているのだ。

エンコーダいろいろ

一口でエンコーダと言っても、昨今売り出されている数10万円のそれから、メーカーの威信をかけた数億円のシステムまでピンキリの激しい世界で、「いったい何が違うんだ!」と迷われている諸兄も多いことだろう。実は、そのピンで作られたデータも、キリで作られたデータも同じ環境で再生できるのだ。それは、MPEG2が再生のみを保証する規格だからだ。MPEG2のファイルを作るだけなら安価に出来る。

再生こそ同一に出来るファイル構造になっているが、そのファイルの作り方のプロセスにルールはない。安価なエンコーダと高価なエンコーダの違いは、プロセスのアルゴリズムの違いなのだ。

さて、いったいプロセス処理が違うと、どのような差になってくるのだろう。高性能エンコーダとは、なにをしてくれるのだろう。

今回試用させていただいたのは三菱電機のEN-250と、カスタムテクノロジー社のシネマクラフトシリーズだ。

EN-250はDVD制作に「シナリスト」と併用で多く用いられるエンコーダボードであるが、ビデオサーバー用などの汎用エンコーダとしても定評がある。

シネマクラフトシリーズは最高機種のハードエンコーダの他に、高性能のリアルタイム・ソフトエンコーダをラインアップしている。

耐える圧縮と破綻する処理の違い

ビデオ素材の中で、エンコードしやすい素材と、しにくい素材があることを確認しておこう。特に弱い素材をあげてみよう。

 

これらの素材は注意して確認しないとノイズ発生がしやすいものだ。

そこで、わざと高圧縮(2Mbps)にして強引にノイズを発生させてみた。

A:スモーキーノイズ

これは移動していく女性の髪の毛を取り込んで拡大した物だ。

煙がかかったように質感が失われている。動きの激しいシーンには顕著に表れる。

B:ブロックノイズ

輝度差の激しい場所付近にモザイク状の四角いブロックが並んで、質感が失われている。

合わせて色ムラやノイズの発生も見られる。水着の女性などは、特に多くの情報量 を必要とするようだ。

他の部分はきれいに再生しているのに、画面の中の部分的にノイズが発生するのはどうしてだろう。

それはMPEG2の圧縮原理に関係がある。

 

簡単にMPEG2の圧縮をおさらいしてみよう。

MPEG2の始めのカットは必ず「Iフレーム」(画面全部の情報を持ったインデックス・フレーム)から始まる。次のフレームになったら前のIフレームに対して変化した部分の情報だけを記録するのだ。

計算の単位は画面を4×4の16分割したブロックから始まる。

そのブロック単位で前のビデオフレームといっしょの映像が映るようなら情報は記録せずに同じである旨記録される。絵に変化があった場合、さらに細かくそのブロックの中を4×4の16分割して変化を探る。そこで変化のあったブロックはさらに分割して検証を繰り返して行く。情報量 (ビットレート)の上限を決めなければ、情報分配は、破たんをすることなく、美しい画面 情報を毎秒30フレームのビデオ画像すべてに割り当ててしまうが、膨大な情報量 を時間単位で規制することで、どこの情報を間引いていくかの判断が必要になってくるのだ。

言い変えると、次の時間までにどのような動きがあり、どの程度、情報量を消費するかの推測による判断処理が失敗したところから破たんをしていくわけだ。

この場合、破たんした小さなブロックセルから順次大きなセルまで同じような描画情報が与えられてしまうので、質感の無い平坦なブロックが出現することになる。

この予測処理をする仕組みをMPEG2圧縮アルゴリズムと呼び、各メーカーの特徴となってくるのだ。

技術的な難しさは予測する条件が多くなるほど激増する。

時間単位で均一な情報を分配するCBR(コンスタントビットレート)では、画面 の中で決まった情報量を割り当てれば良いから処理は簡単になる。しかし、静止画に近い画像にはもったいないほどの情報量 を与えることになり、逆に動きの激しいシーンには割り当てる情報量が足りずに無残な圧縮破たんを招く事になる。

そこで流動的にビットレートを配分し、動きの激しいシーンに多くの情報を与えて、静止画のようなシーンには節約した情報量 を与えることで、結果的に平均値が予定した情報量になるように加減するのがVBR(バリアブルビットレート)だ。この能力にエンコーダの価格差が象徴される。

予測計算が出来なかったブロックの記録は、いい加減な近似値に塗られる事になる。

さらにその周辺ブロックも同様の結果になることで、大きな面積のノイズ発生と認識されてしまう。

そうは言っても先読みすることは難しいので、あらかじめ何度もビデオを再生して各フレームに必要な情報量 の分配を記録して計算するのがマルチパスVBRだ。高価なエンコーダにはもれなくこの機能がある。VBRは、最小、最大、平均のビットレートを指定し、最低2パスの作業が必要だ。1パス目は映像の複雑さを調べるためにCBRまたは1パスVBRを実行し、この作業で得られた複雑さをフレーム毎に記述したファイルを作成する。2パス目以降は、その情報を元にして個々のフレームに配分するビット量 を計画し、それに従って実際のエンコードを行なうのだ。パスを重ねる毎に画質を改善できるため、ハリウッドの映画では平均的に20回から60回のパスをエンコードで行なうとの話もある。高圧縮と高画質を両立させるため、エンコードは膨大な時間を費やす作業なのだ。

最近の技術は、できるだけ1パスでベストな数値を予測することに向いている。わずかなバッファーに貯めた時間の中で将来を予測する技術がエンコーダの性能といっても過言ではない。

作業時間が数倍も違うと時間単価が気になる業界だけに、今後は1パスVBRを目指していくに違いない。(しかし安価な製品の予測のへたな1パスVBRなどはCBRと同じだ)

それにしても今回お借りした300~600万円クラスのエンコーダは安心して高品質の映像を作りだしてくれた。

ここでカスタムテクノロジー社シネマクラフトエンコーダの作業画面を見ながら、エンコード作業を紹介しよう。

同社のエンコーダはIntel PentiumIIIプロセッサで導入されたStreaming SIMD Extensions命令に最適化した処理を行い、高画質で驚異的な圧縮スピードを実現している。

最上位機種は専用筐体にフレームキャプチャーカードと、デコーダカードを組み合わせて提供される「Pro」¥4,200,000である。

EN-250同様にVTRからSDI入力を得てリアルタイムに処理を行うオンラインエンコーダだ。エンコード作業の状態がリアルタイムにプレビューできる高級機で、圧縮の画面 を見ながら作業を進められることは、高品質な映像を目指す場合に心強い。

特徴は独自のアルゴリズムによる「動き検出」で、動画を複数枚同時に何回もスキャンして「誤り動きベクトル」を訂正しながら動作する。

一般的なエンコーダの実装においては2フレーム以上離れているフレームの動き検出で、テレスコピックサーチ(過去の動きから未来の動きを予測し、その部分の周辺だけを動き検索する手法)が用いられるが、急激な輝度変化や、複雑な動きをする映像では予測が外れることが多い。これに対して「動き検出アルゴリズム」では、全ての隣り合うフレームの動きを調べてから、追いかけるように2フレーム以上の動き検出を行うので良好な結果 が得られる。

また、シーンチェンジにおいては、自動的にIフレームが設定され、このフレームから始まるGOPは自動的にClosed GOP(GOP内のフレームが他のGOPに属するフレームを参照しない構成)に設定される。ランダムアクセスを求めるオーサリングを予定している場合は、全てのGOPをクローズドにするオプションも用意されている。

設定できるパラメータも、およそMPEG2の圧縮において出来ないことの無いほどの徹底した職人向けのデスクトップが用意されている。

画面の中のセル単位で圧縮具合を制御できる機能は、高度な圧縮にもかかわらず高画質を要求する作業で必要になるだろう。また、任意にIフレームを挿入できる機能はDVDのチャプターを意識して決めたい場合に大変有効な機能だ。

デフォルトの状態でも効果的な圧縮を行ないながら、高品質な映像を維持できるのがこのクラスの強みでもある。さらに、映像によった設定を吟味できるところが大きな違いだ。安価なシステムは、ノイズが発生した場合にビットレイトを上げる以外に成す術が無い。

ソフトエンコーダの実力

次に紹介するのはソフトウェアエンコーダでありながら高機能なリアルタイム処理を可能にしたカスタムテクノロジー社シネマクラフトエンコーダ「SP」•398,000と、簡易なエンコードを目的とした「Lite」•24,800がある。AVIファイルやQuickTimeなどの動画ファイルをMPEG2ストリームへ変換してくれる。ノンリニアビデオ編集システムにインストールすることで、すぐにエンコードを行なうことが出来、DVDへの最短距離をとれるのだ。

変換スピードはCPUの能力に比例するが、PentiumIII 500 Dual以上で、ほぼリアルタイムのエンコードスピードを実現している。アルゴリズムは上位 機種と同じなので、設定個所が少なくなった分、かえって簡単に扱うことが出来るので、むしろ実用的ですらある。

簡単なオーサリングキット

MPEG2を制作する方法を体験する手っ取り早い方法は、ノンリニア編集システムとセットになったDVDオーサリングソフトのキットを利用してみる事だろう。

Canopus DVRex+MVR2000+ReelDVD

純国産の組み合わせの強みは安心感として表現される。DVDオーサリングソフトはダイキン社の「シナリスト」の廉価版だ。

Matrox RT2000+DVDit

DVおよびMPEG2での編集作業を可能にしたパッケージ。DVDオーサリングソフトはソニックソリューションズ社のDVDitで、複雑に考えがちなオーサリングを簡単な操作性で解決している。

PINNACLE DV500+Impression

ネイティブDVの編集と、タイムラインベースでオーサリングできるミネルバ社のソフトがシームレスにつながる絶妙の組み合わせだ。

このクラスのオーサリングソフトで、凝った作業はできないが、映像のメニュー分岐程度の構成は簡単に行なうことが出来る。オーサリングソフトのメーカである3社は、それぞれに上位 の高級機種を備えているので、将来を考えて研究費として複数機種を同時に使い比べてみることをお勧めする。

こんな使い方も!

MPEG2を再生し視聴するための準備は、意外と簡単だ。

オーソドックスなデコーダカードを利用し、外部のテレビへビデオ出力するタイプと、ソフトだけでエンコードを行い、パソコン画面 へ表示してくれるものまで様々ある。

ソフトデコーダは7800円台に価格もそろってきている。

また、商品を買わなくてもパソコンに詳しい方ならレジストリを細工するだけで標準のWindows Media PlayerにMPEG2を、だまして再生させることすら可能なのだ。

ファイルサーバーに置いたMPEG2ファイル

エンコードされたMPEG2はコンピュータで視聴するのに向いている。

オフィスで必要な社員教育教材や、ノートパソコンで画面いっぱいの迫力ある動画はビジネスプレゼンテーションの大きなパワーになるだろう。

このためのMPEG2データーを保管するのに最適な場所はファイルサーバーだ。

専用のビデオサーバーでなくてもファイル共有されたMPEG2は面白いようにネットワークを超え、大画面 で再生してくれる。

多人数での同時アクセスには向かないが、通常の社内教育の教材を考えた場合などは、特にビデオサーバーまでの設備は必要無いことが多い。

お試しあれ。

CD-ROMに入れたDVDイメージ

サーバーに置くことが出来るMPEG2のファイルや、DVDのディスクイメージは、当然コンピュータで扱えるメディアなら何でも(転送スピードさえ満たせば)利用可能だ。

高価なDVD-Rを導入できない時点では、手軽なCD-RにDVDのディスクイメージを保存することで、コンピュータなら映像を再生することができる。

容量はかなり小さく(650MB)なるが、短時間の映像なら十分に利用可能だ。

この場合、通常のDVDプレーヤーでは作動しない。

便利なソフトデコーダ

既存のコンピュータ環境だけでは改造無しにMPEG2を再生する事は出来ない。

そこで登場するのがソフトデコーダーと呼ばれるDVDプレーヤーソフトである。

サイバーリンク社 PowerDVD

ラビセントテック社 Cinemaster

バロビジョン社 VaroDVD

MGI社 SoftDVD

他多数

多くのパッケージが市販されているが、NT上で作動する製品は少ないので吟味が必要だ。

価格はほとんどの製品が¥7800と安価で市販されている。

また、プレゼンテーションやCD-ROMなどの制作で活躍しているMM・DirectorでMPEG2をキックし、オーバーレイ表示や、外部出力するためのエクストラや、ソフト開発用キットも登場しているので、CD-ROM制作のノウハウも活かした活用方法も大きく広がっている。この場合はクライアント側にとくべつな準備は要らない。

映像は加工料理の時代へ

MPEG2を納品する形態は、ファイルサーバーや、ビデオサーバーなどのネットワーク送出の設備であったり、パッケージ形のCD-ROMやDVDなどのディスクであったりするが、

多くの場合は複数メディアにまたがって同一コンテンツを利用することが多くなるに違いない。

インターネットのWeb上からRealVideoやQuickTimeなどのストリームビデオをインデックス変わりに映像の分岐システムを利用する手法なども、同一コンテンツのバリエーションとして加工できるものだ。

品質が悪いと馬鹿にしている間に、既存の放送レベルは追い抜かれてしまう時代に入ったのだ。

なにせ、15Hz程度のインターレスNTSC映像に比べ、60~75Hzプログレッシブは当たり前のパソコンモニターを利用するのだから、圧縮、データ転送技術の進歩次第で逆転しないとは誰も言えないだろう。

そう言えばデジタルHDの最も安価なディスプレーは、NAB2000で発表される予定のデジタルHDチューナーボードを利用した、パソコンモニターになるそうだ。

納品形態の変化で飛躍する映像制作会社

従来の映像制作は番組納品のように、一度放送したら終わりの仕事といえよう。

作品のバージョンアップの概念は無い。

だが、時代は確実に映像の多用な利用方法を模索している。

プロモーション映像なら視聴者の反応をフィードバックできる仕組みが望まれている。

教材映像なら生徒の習得度や効果測定をフィードバックできる仕組みが望まれている。

販売促進映像なら直接購買に結びつく仕組みが望まれている。

映像の必要な部分だけのバージョンアップをすばやく行なえることも望まれている。

撮影技術では、複数のメディアに適した収録方法と、圧縮に対抗するカメラワークを研究する必要がある。

映像の演出にも双方向システム全体のデザインにかかわる覚悟が必要になってきている。

編集技術はデジタルデータのフォーマット変換の精通していくことが必要になってきている。

制作進行には、各種の業界を横断的に交流できるパフォーマンスが必要になっている。

さらに、プロデューサーにはネットワークでの映像利用をイメージでき、双方向メディアの世界観を語れるスケールが求められている。

飛び出してくる才能を既成概念で潰さないでほしい。必ずや登場するであろう映像の魔術師の活躍を期待してやまない。


取材協力:

カスタム・テクノロジー株式会社

ソニックソリューションズ株式会社

ダイキン工業株式会社

ピナクルシステムズ株式会社

日立計測器サービス株式会社

三菱電機株式会社