ストリーミングビデオの音声品質
「圧縮オーディオのプリプロセスによる品質管理」

 

2002-06-04

尾上泰夫


ブロードバンドのコンテンツに高品質を期待することに無理のない環境が整ってきた。しかし、ネットワーク全体の回線環境を考えると非圧縮のデータを送ることは現実的ではない。必ず何らかの圧縮をおこなうことになる。ここで、映像と音声の品質について、特に音について考えてみたい。
パソコンで表示される映像の品質について、多少の色ずれ、画面の大きさ、コマ落ちなど、今までの経緯で許容できる範囲は多いが、音声はユーザーの許容できる限度が割りと早い。音楽を楽しむレベルの高品質はともかく、音が途切れたら会話も成立しない。話が聞き取れなければ雑音でしかない。
特に現在のライブエンコード環境での音処理はお粗末なものが多い。
現場でマイク収録した音声をPA用のラインから直接エンコードする場合、圧縮に対する準備は何もなされていない場合がほとんどだ。

「ストリーミング用データエンコードにおけるプリプロセスについて(音声編)」

ストリーミング用にデータをエンコードする場合にまず考えなければならないのがプリプロセスの工程だ。このプリプロセスの段階で高品質なストリーミングデータを生成するために条件の整った信号に変換することが重要となってきた。
RealにはRealの処理に適した信号の状態、WindowsMediaにはWindowsMediaの処理に適した信号の状態というようにそれぞれ違いがあるのだ。
一般的にエンコードデータに変換しやすい、整った状態(音声・映像ともに)というのがあるので、各社最終のエンコードデータの品質を上げるために、プリプロセスに工夫を凝らしているところだ。最近発表されたエンコーダーや定番商品の改良点は、どれもがこのプリプロセスの充実にあるといっても過言ではない。

ここでは音声データのプリプロセス、中でもLIVEエンコード主体に焦点を当てて見ようと思う。業務用エンコーダーの定番となっているPINNACLE STREAMFACTORYはプリプロセスの充実のためにHiQオプションというアドオンのボードを発表した。これはエンコーダーへの入力信号を音声・映像とも先にこのボード上でデジタル処理をして、信号を整える事によって、エンコード処理自体の負荷を軽減するためのボードだ。映像データ・音声データともに従来通り、WEBブラウザーからのコントロールで、映像のノイズの除去や音声信号のエフェクトをおこなうのだが、音声のエフェクトがとても充実している。プロセスとしては リミッター・コンプレッサー・ゲート・3バンドパラメトリックイコライザー・ローパス/ハイパスフィルターなど、音響用のマルチエフェクターもびっくりといった充実の内容なのだが、それぞれのエフェクター機能を使いこなすためには、かなり音響機器の取り扱いに関する専門知識が必要になる。また、コンピューターソフトベースの機器特有の問題だが、それぞれのエフェクトの値を変化させながら、つまりリアルタイムな反応を聞きながらのオペレートが難しいといった問題もある。


映像の調整に関しては、ノイズカットのセッティングやカラーコレクターの値などは一度設定したら通常はいちいちリアルタイムに調整することがないので問題ないが、音の場合は、変化に合わせてリアルタイムにある程度調整をおこなう必要のあるファクターが多いのでこの点は今後どのような形でLIVEでのオペレートを行うのか検討する必要がある。
音声のエフェクトといっても、リアルタイム性が必要なものと、そうでもないものに分かれるが、やはり音量のレベルはダイナミクスコントロールを行う必要性が高い。
上記のHiQオプションでもダイナミクスコントロール用のエフェクトに重点がおかれるし、自然界におけるダイナミックレンジの広さを考えれば、何らかの形でこのダイナミクスを制御しないことには、音声を記録することは出来ない。ミキサーを用いたレベルコントロールの他に、従来からの手法で、リミッターやコンプレッサー、最近ではマルチバンドコンプレッサーやピークリミッター等にパラメトリックイコライザーなどを組み合わせて用いることで、より自然に聞こえるような形でダイナミクスのコントロール方法が発達してきた。しかし、このようなコンプレッサーやリミッターを組み合わせて自然な感じにダイナミクスを制御するには経験に基づいたテクニックが重要になってくる。
そこで近年、発達してきたエフェクターに複合的なダイナミックプロセッサーがある。コンプレッサー・リミッター・レベラー等バランス良くプログラムしたエフェクターで、録音の手前の最終段や、送出の手前の最終段にインサートすることで、効果的にダイナミクスをコントロールできるエフェクターだ。


主にマスタリングに使うので、マスタリングプロセッサー等と呼ばれているようなダイナミクスコントローラーが有効なのだ。ダイナミクスコントローラーをエンコーダーの手前にインサートして、過大入力やレベルの低下を防ぎ、より良い状態のエンコードデータが生成されるようにする必要があるのだ。
またエンコーダー自体の処理の負荷を分散させるような構成での機器のセッティングが今後の負荷の多いブロードバンドLIVEエンコードを考える上で重要な要素になっていくのだ。
LIVEエンコードの場合そのソースが声であろうと音楽であろうと、マイクロフォンからの信号のエンコードが主な用途になってくるが、人間の声は録音や伝送するのにもっとも困難な題材の一つだ。レベルを一定に保ち、なおかつ明瞭な音声を提供するのはとてもテクニックのいる作業だ。声のレベルの変化に応じて、一定のレベルを保つように自動的にエフェクトして出力してくれるダイナミクスコントローラーが必要なのだ。
これまでのようなコンプレッサーやリミッター等を複合して調整するような煩雑な操作からオペレーターを開放しないと、社内コミュニケーションや議会中継などの定例放送などで、かならず運用上の問題がでてくる。

ブロードバンド対応は画質とともに、より良い音質での配信が重要になってきた。このようなダイナミクスコントローラーなど音響機器の活用を視野にいれて処理のプロセスを組み立てていくことが今後のシステムでは求められてくる。


戻る|次へ