リアルタイムエンコーダー
Digital Rapids StreamZ* and. WinNov XStreamEngine BroadCaster

 

2003-02-11

尾上泰夫


☆ リアルタイムエンコーダーの魅力

ストリーミングイベントや、ブロードバンド対応サイトが充実して、エンコードも多量かつ高品質のクリップを、迅速に要求される時代になってきた。
従来のソフトエンコードだけで仕事が回しきれなくなったり、画質に満足しなくなったら、専用エンコーダーの出番だ。
リアルタイムエンコーダーを使い始めたら、もう戻れない。

☆ 両製品の概略とターゲット用途について
ストリーミングデータを効率よく作り出すための道具として、リアルタイムでエンコードが行える「Digital Rapids社StreamZ*」と、「WinNov社XStreamEngine BroadCaster」は、「PINNACLE社のStreamFactry」で埋め尽くされていたリアルタイムエンコーダーの市場を、にわかに活性化してきた。両社の違いはエンコード作業の現場特性に合わせたチューニングが施されているところだ。
よく、ハードエンコーダーと誤解されるリアルタイムエンコーダーだが、正確にはエンコード作業はCPUで行うソフトエンコードである。
MPEG-1やMPEG-2のように専用エンコードチップを搭載したボードのような製品は、技術的な仕様が固定化しているからこそ可能だ。現在のストリーミングで多く利用されるRealVideoや、WindowsMediaは、数ヵ月毎に大きな進歩をとげ、バージョンアップが繰り返される。そこへ専用ハードを開発したら、多大な開発コストを回収する前に陳腐化してしまうだろう。
では、いったいリアルタイムエンコーダーは、なにが特化しているのだろうか。それは、エンコード作業へデータを渡すまでのプリプロセスと呼ばれる前処理を高度化しているのだ。
ストリーミングビデオで舞台となるパソコン画面ではプログレッシブで表示を行っている。また、NTSCを表示するテレビ画面はインターレスで表示している。走査方式の違いは、動きの激しい画像では顕著に現れる。
そのインターレス画面をプログレッシブ化する工程で、専用ハードの能力が大きく関わっているのだ。
また、フィルム素材のようなテレシネ作業で秒間24コマを30コマへ増やした素材などもエンコードには悪影響がある。これも綺麗に処理しておく必要がある。詳しくはエンコード作業の中で紹介していこう。
では、エンコード現場の特徴を考えてみよう。
ストリーミングデータの作り方では、大きく分けて、ライブ配信のために現場で行うエンコードと、オンデマンド配信のためにスタジオなどでファイルを作成する作業に分類される。
それぞれの作業で求められる特性を考えてみよう。

☆ WinNov社のXStreamEngine BroadCasterは、ライブ配信に特化している。
ライブ配信では、高品質な映像をつくれて当たり前の上に、安定性と、柔軟な操作性が求められる。現場では何が起こるか分からないからだ。
特に臨時回線で作業することの多いライブの現場では、エンコーダーとサーバーとの間で、何らかの回線不調があると簡単にプッシュ型のエンコーダーは止まってしまう。
多くの視聴者を期待するイベントでは、複数のサーバーへ同時に接続しているケースが多いので、止まったセッションを個別に対処したいものだ。
操作画面で状況を一望できるデザインは、WinNov社のXStreamEngine BroadCasterが見やすく考えられている。さらに、ビデオ入力信号を4枚のボードで、それぞれに受け持つため、トラブルが起きたときに接続を切り離して対処できるなど安心な面が多い。
エンコード後の画像確認や、レベルインジケータが見やすく表示されたり、動作中のパラメータ微調整などが可能であることも現場では重宝される。

☆ 一方、Digital Rapids社のStreamZ*は、ライブだけでなくオンデマンドファイルを作りこむのにも適している。
デッキコントロールは、同一クリップを何度も必要とする場合や、正確な再現性を要求される仕事にはうってつけだ。
StreamZ*の各パラメータはXML形式のファイルで管理されているため、拡張性が多彩に考えられる。SDK(開発キット)でも、自動化をしやすい配慮が感じられる。
CPUの能力が上がるとエンコード能力が上げられるので、陳腐化が防げる。
多彩なフォーマットへも対応する幅の広さも魅力のひとつだ。
☆ リアルタイムエンコーダーの実際
今回の検証ではWindowsMedia9のエンコードで設定作業を見てみよう。
基本的な手順は、ソース設定 、プロファイル設定 、エンコードとなる。
Windows Media 9 は、日本では2003年1月29日に正式なリリースが始まったばかりの最新コーデックだ。

☆ エンコードの準備
Windows Media9を使用してリアルタイムでエンコードする場合は、高速な CPU が必要だ。特に 640x480 サイズのコンテンツをエンコードするには、マイクロソフト社では、4CPU のシステムが推奨となっている。
ちなみに今回検証したシステムは、以下のとおりだ。
時期によって必ずしも同一のシステムとはならないので、あくまでも参考としていただきたい。

Digital Rapids社StreamZ*
OS Name Microsoft Windows XP Professional(Japan)
System Type X86-based PC
Processor x86 Family 15 Model 2 Stepping 4 GenuineIntel 2.80B Ghz
Processor x86 Family 15 Model 2 Stepping 4 GenuineIntel 2.80B Ghz
Total Memory 1GB(ECC)
HDD 18GB Ultra320(1500rpm) SCSIx2

WinNov社 XStreamEngine BroadCaster
OS Name Microsoft Windows 2000 Professional(English)
System Type X86-based PC
Processor x86 Family 15 Model 2 Stepping 4 GenuineIntel ~1983 Mhz
Processor x86 Family 15 Model 2 Stepping 4 GenuineIntel ~1983 Mhz
Total Memory 261,612 KB
HDD Ultra ATA 38GB

CPUには多少WinNovにハンディがあった。
ただし、リアルタイムに処理する作業は遜色のない状態だ。

☆ リアルタイムでエンコードする場合、CPU 使用率が 80 % を超えないようモニターする必要がある。

1本のストリームで最大の情報量を与えたエンコードは、WinNovでは3MBbps以上の設定はできないようになっている。StreamZ*では5Mbpsまで走らせることができた。
また、同時に処理できるエンコード本数は、WinNovでは4本の設定が可能だ。StreamZ*ではCPUの許す限り何本でも実行することができる。
同時に扱える入力ソースは、WinNovでは4入力を同時にCPUの許す限り処理できる。StreamZ*では2入力の選択とメディアファイルからのトランスコードをCPUの許す限り複数行うことができる。

☆ どの場合でもCPUの負荷率は80%を超えないように注意しないと、コマ落ち、音のひずみなどの原因になるため、神経を使う。
さらに、オーディオレベルも確認する。録音レベルが適切でないと、ノイズが発生したり、最適な品質が得られなかったりするからだ。
事前にテスト的にエンコードして、クライアントでの再生具合をチェックし、ソースのエンコード音量を調整しておくことが肝要だ。映像の調整に関しては、ノイズカットのセッティングやカラーコレクターの値などは一度設定したら通常はいちいちリアルタイムに調整する必要がないのであまり問題ないが、音の場合は、変化に合わせてリアルタイムにある程度調整をおこなうファクターが多いので、この点は今後どのような形でLIVEでのオペレートを行うのか検討する必要がある。

☆ 音声のエフェクトといっても、リアルタイム性が必要なものと、そうでもないものに分かれるが、やはり音量のレベルはダイナミクスコントロールを行う必要性が高い。
エンコーダー搭載の機能としてダイナミクスコントロール用のエフェクトにも重点がおかれるが、自然界におけるダイナミックレンジの広さを考えれば、何らかの形でこのダイナミクスを制御しないことには、音声を有効に記録することは出来ない。ミキサーを用いたレベルコントロールの他に、従来からの手法で、リミッターやコンプレッサー、最近ではマルチバンドコンプレッサーやピークリミッター等にパラメトリック・イコライザーなどを組み合わせて用いることで、より自然に聞こえるような形でダイナミクスのコントロール方法が発達してきた。

☆ 近年、発達してきたエフェクターに複合的なダイナミックプロセッサーがある。コンプレッサー・リミッター・レベラー等バランス良くプログラムしたエフェクターで、録音の手前の最終段や、送出の手前の最終段にインサートすることで、効果的にダイナミクスをコントロールできるエフェクターだ。主にマスタリングに使うので、マスタリングプロセッサー等と呼ばれているようなダイナミクスコントローラーが有効なのだ。ダイナミクスコントローラーをエンコーダーの手前にインサートして、過大入力やレベルの低下を防ぎ、より良い状態のエンコードデータが生成されるようにする必要があるのだ。
またエンコーダー自体の処理の負荷を分散させるような構成での機器のセッティングが今後の負荷の多いブロードバンドLIVEエンコードを考える上で重要な要素になっていくのだ。
ライブエンコードの場合そのソースが声であろうと音楽であろうと、マイクロフォンからの信号のエンコードが主な用途になってくるが、人間の声は録音や伝送するのにもっとも困難な題材の一つだ。レベルを一定に保ち、なおかつ明瞭な音声を提供するのはとてもテクニックのいる作業だ。声のレベルの変化に応じて、一定のレベルを保つように自動的にエフェクトして出力してくれるダイナミクスコントローラーが有効なのだ。
この調整は、codec の選択よりも重要で、品質向上に効果的だ。

☆ キャプチャ済みのメディアファイルを変換する場合には、リアルタイムではないため、CPU スピードに合わせてエンコーディングプロセスが進むので、特別に高速な CPU は必要ない。エンコードにかかる時間が長くなるだけだ。
同じ素材を何度も利用する場合や、高品質エンコードを行う場合には、非圧縮AVIなどのファイルでプリプロセスをしっかり掛けて、後にエンコードプロジェクトを複数同時に行うこともコマ落ちを防ぐ安心なやり方だ。
また、事前に AVI ファイルにキャプチャしておくと、エンコーダがリアルタイムでエンコードする必要が無いので本来の画質を保つことができる。AVIファイルは編集が容易になり、複数の同一コンテンツの制作も容易だ。
また、高品質なAVI にキャプチャする場合はバススピードに負荷がかかるので、高速な Disk アクセスが必要になる。ハードディスクはデフラグを行い、このボリュームをネットワーク接続やファイル共有しないようにしておくことも重要だ。手作りでエンコーダーを用意する場合などは、キャプチャカードと SCSI カードの DMI バッファでの衝突には十分注意することが必要になる。Dual PCI Busシステムを利用するようにマザーボードの選択も慎重にしておこう。 このあたりはノンリニア編集システムに通じるところが多い。

☆ リアルタイムではないが、StreamZ*ではWindows Media、2pass encoding や VBR (可変ビットレート) の設定が簡単にGUIで行えるのもありがたい。
2 パスエンコーディングでは、ビデオのエンコードプロセスを2回実施し、1 回目では場面の性質によって、ビットレート、フレームレート、バッファサイズの最適な組み合わせを探し、2 回目で実際のエンコードをする。このため通常の 2 倍の時間がかかるが、品質の向上に役立つ。
VBR (可変ビットレート) エンコードは、画質に合わせて使用するビットレートを変動させることができ、ファイル総量を節約し、結果的に高画質となる。しかし、帯域が可変するような特性のため、ストリーミングサービスには向かないので、ローカル再生を目的としたディスクコンテンツの制作時に利用することが有効だ。

☆ 高ビットレートなコンテンツを制作する場合配慮しなければならないポイントは、再生クライアントの負荷だ。 320 x 240 のコンテンツを表示させるには 300 MHz 以上の CPU、640x480 や、320 x 240x 60 fps では 700 MHz 以上の CPU を搭載したクライアントが必要になる。 1 Mbps を超える高ビットレートコンテンツの場合には、敢えて最新でない CODEC−WindowsMedia 7 CODEC を使用することで、多少クライアントの再生負荷を軽減することもできる。(画質は損する)

☆ エンコード素材
プリプロセスが重要な理由と同様に、エンコードでの圧縮を有効に機能させるためには素材も、放送品質のものを用意する必要がある。DV-Cam、DVC-Pro、BetaCamSP または Digital Betacam などの放送品質のテープ形式を使用することがジッターを防ぎ、無駄な圧縮ノイズを発生させることなくエンコードが可能になる。miniDV や、S-Videoのような、より低級なコンシューマ形式を使用しなければならない場合は、TimeBase Corrector (TBC)を備えた業務用再生デッキを使用しよう。ノイズと映像のぶれ(ジッター)を抑えることが、低データ レートに負けない品質の圧縮ビデオを制作する鍵となる。
今回の検証はSDI (CCIR-601) - デジタル信号のまますべての作業を行った。

☆ キャプチャ方式の指定
キャプチャカードの設定で、ピクセルフォーマットを確認する。
RGB は、ファイルは大きくなり、バスの負荷もあがる。 YUV は、多くのバリエーションがあり、YUY2 は最高品質を実現する。リアルタイムエンコードの時は、デフォルトにするか、YUV ベースのフォーマットにする。

☆ ソース設定
より高品質なエンコードをするには、まずソースのタイプに応じたキャプチャ手順を考慮する必要がある。ソースファイルの形式によって、最適なフレームレート、画面サイズ、処理手順が変わってくるからだ。
NTSC の場合は、ソースが 30 fps でかつ インターレース化されている。そこで、まずプログレッシブ化 ( ノンインターレース化 ) をし、30 fps か 60 fps で出力する。帯域幅に制限がある場合は、30 の半分の 15fps にする。重要なのはプリプロセッサーの機能と、ソフトエンコーダーの機能をダブルで使用しないように注意することだ。きちんとプリプロセス出来ている素材なら、まったくフィルターの必要なくエンコードを行える。
ノンインターレース化とは、NTSC 向けにインターレース化されたコンテンツをプログレッシブ化する処理だ。
インターレース化されたコンテンツは、奇数フィールドのみのフレームと偶数フィールドのみのフレームのセットを表示し、2 フレームで1セットの画像を完成させるようになっている。
これにより、ちらつきが解消し、早い移動物などの表示が有利になる。また圧縮にも有利だ。

☆ Film コンテンツの場合は、ソースは 24 fps から 30 fps に変更されており(テレシネ)、また画面サイズは PC ディスプレイと同一ではない。逆テレシネ 処理をし、上下の黒い部分を省くようクロップ設定する。そのままにしておくと、上下の黒い部分も帯域幅を消費するからだ。
こちらのフレームレートは、24 を基数として計算する。
PAL の場合は ソースと同じ 25 fps にする。この時フレームレートは、25 を基数として計算しよう。この場合もプリプロセッサーの機能と、ソフトエンコーダーの機能をダブルで使用しないように注意することだ。
ビデオのトリミング 映画コンテンツの場合には、画面サイズを調整する必要がある。
ここで、上下の切り詰めるべき空間を設定するが、その際、必ず8 ピクセルの倍数となるように設定する。また、通常の4:3素材の場合でも、上下左右の端にノイズがのっている場合があるので、その場合も必要量をトリミングする。
また、60 フィールドのデータをリサンプリング化することで、 60 fps のコンテンツに変換することもできる。60 fps にする場合、300 Kbps 以上の帯域幅が必要だ。
テレシネとは、映画用フィルムコンテンツを TV (NTSC) 向けにコンバートする処理のことだ。
24 fps を 30 fps に変更し、インターレース化している。
ということは、元がフィルムのコンテンツは、みな 30 fps に増幅され、インターレス処理されているということだ。

☆ そこで、逆テレシネ (Inverse Telecine) という機能を利用する。
このプロセスでは、テレシネ処理で水増しされたデータを除去し、ノンインターレース化する。
これにより、より圧縮に適した形になり、インターレースの問題も除去される。ただし、テレシネ処理後に編集されていると、正しく逆テレシネできないことがある。またこの処理をおこなうと、CPU使用率が10 - 25 % 上がる。この処理をハードウェアでおこなう今回のシステムは、CPUの負荷は軽減され、高品質だが、システム価格はそれなりになる。これをソフトウェアだけで処理すると、安価なシステムを実現できるが、時間と品質が損なわれる。

☆ プロファイル設定
プロファイルは自由なカスタマイズが可能だ。プロファイルは、拡張子.PRX のXMLファイルに保存することもできる。
WinNovでは専用のGUIから簡単な数値入力で設定を行う。

☆ マルチビットレートでは、10 までの複数の帯域を選択しての指定にすることができる。
これを Windows Media Server から配信することで インテリジェントストリーミングが可能だが、 CPU 負荷 及び ファイルの容量は大きくなる。
「指定帯域幅より実際の帯域幅の方が大きい」といった場合には、間違えてマルチビットレートの指定をしている場合があるので確認しておこう。また、配信対象 新規作成時の最大ビットレートの値は、実帯域幅ではない。たとえば 500Kbps の指定をした場合、実ビットレートは 509Kbps になる。メディアビットレートを 500 Kbps に設定したことになるので、実ビットレートである効果的なビットレートは 509 Kbpsになる。実ビットレートを 500 Kbps にしたい場合は、効果的なビットレートが 500 Kbps になるよう、メディアビットレートを微調整する。(この場合 491 Kbps)
ここで、上記トリミング で画面サイズを変更している場合は、変更後の画面サイズを指定する。

☆ バッファ量を大きくすることで、コンテンツの変化に対応が可能だ。
たとえば高画質なコンテンツを提供する場合は、バッファ量を大きくしておくことで、再生開始までの待ち時間が長くなるが、その分高品質な画像を提供することができる。
デフォルトではこの値は 3 秒になっているが、ストリーミングの場合では 20秒まで、ダウンロードの場合は 90 秒まで増やすことができる。
なお、バッファ量を大きく設定すると、クライアントでのメモリ使用量も大きくなる。

☆ WindowsMedia9で紹介された「Fast Streaming」は、Windows2003.netサーバーからの機能となっている。Windows2003で実装される新しいWindowsMediaServerは、多くの改善が見られた。
これは、従来のストリーミング配信で付きものだった再生が開始されるまでのバッファ時間をなくして、瞬間的に再生を開始するものだ。
テレビチャンネルを切り替える感覚でコンテンツのザッピングすることも夢ではない。
また、回線帯域に余裕があれば、再生時間軸に関係なく早めにデータをプレーヤーにキャッシュさせることで、ネットワークトラブルによる再生中断を最小化できる。
実際にネットワークケーブルを途中で抜いても、再生を継続するし、また接続すれば再生にブランク無く継続することができた。
次に、サーバーサイドでのプレイリスト編成による広告の挿入も行うことが可能になった。従来複雑だったユーザーごとに広告を変えた配信を実行するなどのカスタマイズも可能になった。
動的にプレイリストを編集しながら配信を止める事なく運用できる。
従来のサーバーの配信能力を2倍に向上させただけでなく、コンテンツ配信ネットワーク(CDN)への対応も可能になった。
SDKの開放によってキャッシュサーバーやプロキシーサーバーとしても構築が可能。
充実した管理ツールと、プラグインによる拡張でプラットフォームで稼動するストレージ、課金、ロギングのシステムとシームレスに統合できる。

☆ キーフレームの間隔 の設定では、Encoder はその間隔中にかならず1つキーフレームを挿入する。
ただ、キーフレームが途中で必要になった場合にも自動的に挿入されるので、間隔が大きくて問題となるようなことはない。
この間隔を小さくすると、早送り、巻き戻しがきれいになるが、当然より多くの帯域が必要となる。

☆ 画像の品質とは、最低限の画質を示している。
たとえば、30 fps で 品質 0 の設定をした場合、とにかく 1/30 秒 で1フレーム表示、画質は二の次、という動作をする。
品質の設定をあげていくにしたがって、設定された品質を満たさない限り次のフレームを表示しない、という動作になる。
そこで、帯域幅が限られている中で、品質をあげればあげるほど、要求されたフレームレートに対応できないという結果となり、フレームのコマ落ちが発生する。ただし、画像の品質は高くなる。
この設定は、「コマ落ちが発生しない上限まであげる」ことが最適と考えられている。
また画質に合わせてフレームレートを調整する場合もあるので、動きが少ない場合はフレームレートより品質を優先して 80-100 の設定、動きが激しい場合はフレームレートを優先して 50-70 の設定、といった使い分けをする必要がある。

☆ エンコード
すべての設定が完了したところで、エンコードを開始する。
StreamZ*では、入力・出力画面を、WinNovでは出力画面をリアルタイムで表示できるので、出力品質をその場で確認できる。また、エンコードプロセスをモニター可能だ。
ただし、この表示により余計なCPU負荷があるので、高品質なエンコードをする場合は、ビデオ画面のリアルタイム表示を無効にする必要がある。


☆ 実際の操作StreamZ*
起動したら、基本設定として入力信号をNTSCで、セットアップなしを忘れずに確認しておこう。
起動したときのプロジェクト環境の中へ使用するプロファイルを作成、または選択する。


Xmlファイルで定義されるプロファイルでは、利用するコーデックを選択し、圧縮を定義する。基本的にはOSで利用できるコーデックは殆ど利用可能だ。
アーカイブなどに便利なMPEG-2での高品質保存から、高圧縮で有利なDivixや、変わったところではDPSファイルなど多彩なプロファイルをセットできる。また、1280x720のサイズでも加工ができる。データ上で加工したHD素材を用いれば、そのまま高品質なコンテンツ加工も可能だ。
現在Windows Media 9対応、Real Media (Helix応済み)、Quick Time 6、MPEG-1、MPEG-2、MPEG-4(Divix)、AVI、DPSファイルなどに出力対応だ。
同一プロジェクトにはプロファイルをいくつでも設定できる。
もちろんリアルタイムで処理できる組み合わせは、CPU使用率との相談だ。

 

ソースの選択
プロジェクト単位では一つのソースを決めることになる。Inputタブで映像の入力設定をする。ここでの映像ファイル設定も保存可能である。
入力を選ぶと映像表示部分にソース映像と音を出すことが出来る様になる。
このタブで重要なのはデ・インターレースにチェックを入れる事だ。
「StreamZ*」の動き補償型デ・インタレースはハードウェア処理のためCPUに負荷が掛からない。
入力はアナログモデルとデジタルモデルからの選択になる。


アナログモデル:
コンポジット×2
S-Video×2
バランスオーディオ×2(XLRキャノン)
アンバランスオーディオ×2(RCAコネクター)
デジタルモデル:
上記アナログモデル入力系統に追加して 
シリアルデジタルD1(SDI)×2
DV(IEEE1394)×1
AES/EBU×2
SDIからのAudioではAES/EBU以外にエンベッドも扱うことが出来る。


ライブ入力以外に、OSでサポートできる「DirectShow」経由でも、多彩な変換が行える。デッキコントロールでは、業務用のRS422コントロールのVTRを制御してフレーム単位の使用ポイントを設定できる。
複数のポイントからファイルを作り出すのにも便利だ。
設定データはxmlファイルになるので、マネージメントも外部で行うことが可能だ。
ただしエンコードの精度はOS任せになるので、余裕を持った設定にしないと、頭が切れたり、絵がこぼれたりするケースがあるかもしれない。
正確を期すなら、ファイルとして完全なものを用意すればよい。
他の制御としてGPIが付いているので、GPIトリガーを受けられる機器の制御が可能だ。

 

☆ プリプロセス
この段階で「StreamZ*」の最大の特徴であるプリプロセスをかけることが出来る。
VideoプロセスとAudioプロセスタブがあり、両方ともリアルタイムに反映する。
クロッピングは任意の数値を打ち込むことが出来る。
もちろんエンコード中に数値を変更することも可能である。
また右クリックで数値を基本値に戻せるのも便利である。

オーディオのプリプロセス設定
音の品質は、出来る事なら信号段階で整理しておきたいものだが、エンコーダーの中でも、ここまで整えられるという機能だ。
パラメトリック・イコライザーと、ダイナミックレンジのコンプレッサーとエキスパンダーが用意されている。効果を確認するためにはダイレクトに再生しても意味が無いので、ネットワーク経由でプレーヤーからさ再生させた品質を評価しよう。


Audioプロセス:
  7バンド・パラメトリック・イコライザ(EQ)


  ダイナイックレンジコンプレッションコントロール
  ボリューム調整
高音/低音調整
20bit内部処理

☆ ビデオのプリプロセス設定
強力なプリプロセス機能を設定する画面がここになる。
ノイズリダクションは、不思議なほどすっきりとした綺麗な画像を作り出してくれる。
決定的な「デ・インターレース」処理は、StreamZ*ならではの出来で、他の方法では真似できないものだ。
デモ画面の中から特徴的なシーンを紹介しよう。


車輪が画面の中で横切っていくシーンだ。
インターレースを、そのまま取り込んだものは、ギザギザの櫛形ノイズと、車輪の輪郭が複数にブレて表示されている。


標準ソフトでのインターレース除去では、櫛形ノイズを消すことは出来ても輪郭がダブる表示は消すことが出来ない。


StreamZ*のインターレース除去は、綺麗に車輪の輪郭補正もリアルタイムに行っている。これは、動きの激しい画像を上質にエンコードする際には大変に重要なポイントだ。


Videoプロセス:
  クロッピング
  プロックアンプ/ブライトネス、コントラスト、サチュレーション、ヒュー、カラーゲイン、カラーバランス補正
テンポラル(3次元)ノイズリダクション
スペーシャル(2次元)ノイズリダクション
アスペクト比変換
変更した数値はリアルタイムで反映される。

出力設定
アーカイブとしてのファイル出力と、サーバーとの接続を設定する。
ライブ中継で流しっぱなしで終わりではなく、アーカイブ事により中継後も、素材の2次利用が出来る。
便利な機能としてファイル名を自動的に当てはめ、ユニークな名称を生成し、上書きの危険を回避してくれるファイル名のジェネレーター機能がある。設定はプロファイル毎に保存することが出来る。
多くのプロファイル設定や、まとめたプロジェクトを保存しておくことで、同様の作業を再度行う場合に大変重宝する。

複数の作業を行う場合の組み合わせ方
同一プロジェクト内の複数プロファイルは、エンコードの開始、停止をワンアクションで行うことが出来る。分けて実行したい場合は、プロジェクトを変えても同時に実行することが出来る。例えば、ライブ収録で、ネットワークへ配信する作業を行いながら、個別のシーンをアーカイブするなどの作業が同時に進行できるのだ。

エマジェンシー
緊急時の再起動時などで、指定のプロジェクトを強制的に開始する機能も新たに追加された。
遠隔で操作する場合など安心な機能だ。


☆ 実際の操作 WinNov XStreamEngine BroadCaster
ライブ専用として特化したインターフェースと、入力ソース毎にPCIカードでキャプチャーを行う安定志向が売りのエンコーダーだ。
ファイルからのトランスコードは別アプリケーションが必要。
起動するとブラウザーにJAVAベースのインターフェースで独特の画面が表示される。当然ネットワークからWebブラウザーを介して遠隔制御が可能だ。IDとパスワードを入力すれば離れていても、直接タッチするのとまったく変わらない作業ができる。

アナログモデル:
コンポジット×4(YUVと切り替え)
YUVコンポーネント(S-Video)×2
バランスオーディオ×2(XLRキャノンLR)
バランスオーディオ×2(TRS標準コネクターLR)
バランスオーディオ×2(TRS標準コネクターLR)スルーアウト
デジタルオプション:
上記アナログモデル入力系統に追加してビデオのみ。 
シリアルデジタルD1(SDI)×1
シリアルデジタルD1(SDI)×1 スルーアウト
オーディオのデジタル対応はない。


入力信号
NTSC、PAL

映像フォーマット
YV12、YUY2、YV12

対応フォーマット
WindowsMedia7(9に対応)
RealProduser8.5Plus

標準セットアップ
28.8k 160x120 15fps
50k 176x144 15fps
10k 240x180 30fps
300k 320x240 30fps

WindowsMedia
50k 176x144 15fps
250k 320x240 30fps

RealNetwork
50k 176x144 15fps
250k 320x240 30fps

マスターコントロール
同時に運用できる4本のストリームを一元管理する画面だ。
それぞれのストリームを開始、一時停止、停止することを基本に、オーディオレベル、フレームレート、ビットレート、動作時間、接続ユーザー数、そして重要なCPU使用率などが一目で確認できる。
従来型のプル方WindwsMediaサーバーでは重要なポート確認も簡単に行える。それぞれのストリームの画像確認も出来るが、CPUの余裕がない場合は消しておく必要があるだろう。

コンフィグレーション
ストリームごと個別の設定を行えるコンフィグレーション画面では、さらに詳細な設定を行える。
この画面からもストリームを開始、一時停止、停止することができる。
オーディオとビデオのソース決定は別の画面で行う。オーディオについては右側のブロックから、ビデオは左側のブロックからソースをセレクトできる。同一のデバイスに接続した複数のソースは、ライブエンコード中に切り替えることが出来る。

メタ設定
ストリーミング中には変更しない情報を裏の画面で行うようにデザインされている。
左側のブロックでは、使用するポートナンバーや、アーカイブ先の指定などは「STREAM SINK」タブの中で行う。


表示関係で使用する名称などの設定は「META INFO」で行う。
右側のブロックでは、ストリーミングからリンクするURLの設定や、キャプションを「SCRIPT」タブからコマンドを仕込むことが出来る。


ビデオセットアップではエンコードストリームの設定が「VIDEO」タブで行える。


ビットレートでの組み合わせは最大総量5Mbpsを超えないように組み合わせながら行うことが出来る。
ただし、「Deinterlasce」を設定しているとCPU使用率は大幅に上がるため注意が必要だ。

設定例 #1:1ストリーム出力- 3Mbps 640x480 30 fps
設定例 #2:2ストリーム出力- 1.5Mbps 640x480 15 fps
設定例 #3:4ストリーム出力- 1Mbps 320x240 30 fps

見やすく管理しやすいインターフェースは、ライブでの運用に実績があることを納得できる。

☆ 総括
今後エンコード作業は、幅広く新しいコーデックに柔軟に対応、ブロードバンドという広帯域に対応したクオリティの高い動画、インターネットという速い流れに乗り遅れないための大量、迅速な作業、プロ用映像機器との親和性これらすべてが必要になるであろう。
エンコーダー、サーバー、プレーヤー、そして、それぞれの開発キットと、著作権管理機能(DRM)を加えて、デジタルメディアの世界でブレイクスルーを迎えようとしている。
近づいてきたホームシアターでのハイビジョン時代。
地上波デジタル放送への移行を目の前にして、コンテンツビジネスのあり方が問われている。
高画質、高品質音響の伝達手段として、侮れなくなってきたのがネットワークを利用した配信だろう。もともとデジタルデータを扱うことは、コンピュータの得意な分野だ。
インターネットを見ても、情報の発信が距離を意識しなくなり、規模よりも内容と、サービスが重要なことは明白だ。
高画質のHD映像と、包み込むようなサラウンドオーディオを配信するのは放送だけだろうか?


戻る|次へ