音の基礎講座10 不連続な音?
またまたやって参りました、音の基礎講座であります。今回でなんと10回目、始めた当初はこんなに続くとは思っていませんでした。これもひとえに読んでくださる皆様がとても上手に褒めてくださるお陰であります。もう、ほんとにおだて上手なんだから。ゾウリムシ並みに単細胞な私は、おだてられるとほいほい木にも登ってしまうのですよ。
ホントにブログの原動力ってのは、アクセスしてくださる皆様なんです。
と、感謝の気持ちを抱きつつ、10回目の音の基礎講座を開講いたします。
今回は「デジタル音声」についてのお話しですよ。今や世の中、なんでもかんでもデジタルデジタルですけど、そもそもデジタルってどういう事なんでしょう? え、歯間ブラシ? それはデンタル。あー、そういえば今年は歯科検診に行かなかったなあ、来年歯医者さんに怒られるかしらん。心配性な私はメンタル弱いからな〜。誰か強靭な心をレンタルしてくれないかな〜。 …はい、いい加減にします。
開講のチャイムをどうぞ→
ホントにブログの原動力ってのは、アクセスしてくださる皆様なんです。
と、感謝の気持ちを抱きつつ、10回目の音の基礎講座を開講いたします。
今回は「デジタル音声」についてのお話しですよ。今や世の中、なんでもかんでもデジタルデジタルですけど、そもそもデジタルってどういう事なんでしょう? え、歯間ブラシ? それはデンタル。あー、そういえば今年は歯科検診に行かなかったなあ、来年歯医者さんに怒られるかしらん。心配性な私はメンタル弱いからな〜。誰か強靭な心をレンタルしてくれないかな〜。 …はい、いい加減にします。
開講のチャイムをどうぞ→
さて、いきなり復讐です。じゃなかった、復習です。そもそも復讐ってのは仕返しであって、いきなりそこから始まることはあり得ませんね。
で、復習です。音の基礎講座第1回からの引用になりますが、音とは「空気中で起こった何らかの振動が空気を押したり引いたりして、空気の密度の高い部分と低い部分が交互に発生し、波のように伝わっていく」ものでした。波はいつもなめらかに連続的に変化して伝わっていきますね。かっくんかっくんと段階的に動く波なんて見たことありません。この「連続的に変化する量(で示すこと)」を「アナログ」と言うのです。
空気の振動である「音」は、そもそもアナログなのです。だから「デジタル」という言葉が登場するまでは、あえて「アナログ」なんて言葉を使用する必要はありませんでした。「デジタル」という特殊なものが出てきたものだから、じゃあ今までのものは何だ? それなら「アナログ」だろう、みたいな感じですかね。
それじゃデジタルってなに? ということですが、「デジタル」を辞書でひくと「連続的な量を、段階的に区切って数字で表すこと」とあります。つまり「アナログを、段階的に区切って数字で表すこと」なんです。
連続的に、なめらかに変化する空気の振動を段階的に区切ってしまったら、かっくんかっくんした音になってしまいそうですね。てゆーかあ、連続的に変化しない音なんてアリエナーイ。と、JK風に反発したくなってしまいます。が、それがアリエールのですよ。と、P&Gの洗剤風に解説していこうと思います。…ああ、またひとりで何やってんだ状態になっちゃった。(ちなみにJKはジョン・カビラではありません、まあ言いそうではありますけどね。ここでのJKはジョシ・コウセイです。P&Gはプロクター・アンド・ギャンブルですね)
では具体的に、そしてできるだけカンタンに、デジタル音声って何なのかをお話ししていきましょう。
空気の振動である音をいきなりデジタル信号にすることは、たぶん現段階ではできないと思います。まず、マイクロホンなどの機材を使って、音を電気信号に変換します。この仕組みについては前回の音の基礎講座でお話ししました。この段階での電気信号は、空気の振動をそのまま電流の変化に置き換えたものなので、まだアナログ信号です。面倒くさいので、アナログの電気信号をひっくるめて音声信号と呼ぶことにします。
こんな音声信号があったとします。この講座ではもうお馴染みの波形表示です。

横方向に時間が進んでいき、縦方向は音の大きさを示しています。クネクネの上の頂点が空気を押しきった状態、下の頂点が空気を引ききった状態を表しているんでしたね。電気信号でも同じ意味合いと考えて問題ありません。本当はこれがもっと延々と続くのですが、そのうちの一部分(2サイクル分)を切り出したものです。ああ、前と同じ文章なんだからコピペすればよかった…。
さて、この音声信号をデジタル化してみましょう。これは連続的な変化を示した図ですから、これを段階的に区切って数字で表せばいいんですね。まずは段階的に区切ります。とりあえず適当な間隔のマス目をあてはめて、波形と近いマス目をトレースして(なぞって)いきます。

はい、段階的に区切れましたね。ではこれを数字で表しましょう。トレースした青い線は、下から数えて何マス目なのかを左からひとつずつ地道に数えていきます。まず、一番左は、えーと、10ですね。次が12、14、15、16、…ああ、もっと大きく描けばよかった。老眼鏡が必要だよ、こりゃ。って、パソコンでやってるんだから拡大表示すればいいじゃん。…をを、楽になったぞ(喜)。
10.12.14.15.16.15.14.12.10.8.6.4.3.2.3.4.7.9.11.13.15.16.16.15.13.11.8.6.4.3.2.3.4.6.8
ああ、やっとできた。それでは今日はこのへんで・・・という訳にはいきません。とりあえず、段階的に区切って数字で表すことはできました。が、ここでもう一段階の工夫が必要なんです。そう、詳しい方はご存知だと思いますが、デジタル化するためには、これらの数字を2進数で表す必要があるのです。
私たちが普段使用しているのは10進数です。数を数えていって、10になるごとに1桁増えていきますね。2進数では2になるごとに1桁増えます。つまり、1・2・3・4を2進数にすると、1・10・11・100 となります。
では、先ほどできた数字の羅列を2進数にしていきます。ざっと見て一番大きな数字は16なので、5桁の2進数で表していきましょう。理由は後ほど。
01010、01100、01110、01111、10000、01111、01110、・・・・・
ああああ、面倒くさい! あとはやりたい人だけやってください。私はもうやりません(笑)
あ、さっきの5桁にする理由は、16を2進数にすると10000で、5桁になるからです。もったいつけるほどの理由ではありませんが、すべての桁数をあわせる事はとても重要なのです。
さあ、これでいわゆる01(ゼロイチ)信号ができましたよ。デジタルはゼロイチ信号だ、なんてよく聞きますよね。2進数にすると、とてもシンプルな信号をつくることができるのです。つまり、0の部分は信号なし、1の部分は信号あり、ということにして、モールス信号のように、あるいは音符と休符のように、伝送することが可能になるのです。
上のゼロイチ表記をもっとわかりやすく、信号の無し・有りで記してみますね。信号なしは□、信号ありは■です。
□■□■□□■■□□□■■■□□■■■■■□□□□□■■■■□■■■□□■■■□・・・・・
じゃーん、デジタル信号が完成しました。
これでめでたくアナログ信号がデジタル信号に変換された訳です。この工程をA/D変換(エーディーへんかん)といい、この作業をする回路のことをA/Dコンバータといいます。AnalogからDigitalに変換するから、頭文字をとってA/D変換です。わかりやすいですね。
デジタル信号に変換することのメリットは、伝送する際のロスによって信号が多少ゆがんだとしても、あるいは何らかのノイズが混入したとしても、信号の有無さえ判別できれば正確に伝わることです。程度の問題はありますが、基本的に外部のノイズの影響は受けません。また、DSPという回路によって様々な加工を施すことも可能です。DSPはデジタル・シグナル・プロセッサーの略称であって、決して「夕暮れ時はさびしそう」を歌ったグループではありません。それはNSPですね。ふるっ。
そしてCPUの性能が充分に高くなった現代では一般のパソコンでも、波形編集や複雑なミキシングなどの加工をすることが可能になっています。
デジタル信号は電気信号だけとは限りません。信号の有無を光の点滅に置き換えれば、光ファイバーケーブルで伝送することもできます。また、CDではレーザー光線を当てて、その反射の強弱を信号の有無としてとらえデジタル信号を読み出しています。こういった伝送や記録についても応用性が広がるんですね。
さて、それではこのデジタル信号をまたアナログ信号に戻しましょう。せっかく作ったデジタル信号をなぜまた戻しちゃうの? と思いますか? 答えは簡単、デジタル信号はそのままだと聞くことができないからです。ほら、最初に「音」はアナログだと言いましたよね。デジタル音声は、最終的には必ずアナログに変換しなければなりません。
このデジタル信号は5桁ずつに区切ると、マス目ごとの高さを示す2進数になっています。それに見合った電流を発生させていけば、もとのアナログ信号が再現できる訳です。この工程はもちろんD/A変換(ディーエーへんかん)といいます。

ほら、元の音声波形とは似ても似つかないガッタガタの波形が再現できました。…だめじゃん。
でもね、最初に区切ったマス目をもっともっとずーっと細かくしていったら、限りなく元の音声波形に近づけることができますよね。デジタル音声というのは、そういう事なのです。かっくんかっくんした波なんだけど、そのかっくんかっくんがほとんど気にならないくらいに小さいかっくんかっくんにするんです。
これを読んでるみなさんの心もかっくんかっくんとずっこけていることでしょう。もう少しおつきあいくださいね。
どのくらい細かくするのかというと、オーディオCDの場合は「サンプリング周波数44.1kHz、量子化ビット数16bit」と決められています。あ、あ、あ、難しくないですから逃げないでください。
マス目を横方向(時間の進行方向)に区切ることを「標本化」または「サンプリング」といいます。サンプリング周波数44.1kHzとは、1秒間を44.1キロ、つまり44100回区切るということです。よんまんよんせんひゃっかいですよ。細かいですねえ。
そしてマス目を縦方向に区切って数字で表すことを「量子化」といいます。量子化ビット数16bitとは、縦方向の数を16桁の2進数で表すということです。これは10進数にすると65536までの数字を表すことができます。つまり、言い方をかえると、オーディオCDのデジタル信号は、音の大きさを65536に分割して、その数値を16桁のゼロイチ信号に換えて、1秒間に44100回も読み出したり伝送したりしているということになります。いやあ、本当に気が遠くなりそうなくらい細かいですね。
実際には音声信号の他に、伝送途中で欠落してしまった信号を復活させるためのヒントになる「誤り訂正」という信号なども一緒に含まれています。
デジタル信号のサンプリング周波数や量子化ビット数は、これひとつではありません。たとえばDVDやデジタルビデオの音声はサンプリング周波数48kHzが一般的ですし、プロ用機材などでは96kHzや192kHzなんてものも出てきてます。また、量子化ビット数もいろいろなものが存在します。
これらの数字は大きいほうがデータ量も増えて高音質ということになるのですが、最近ではデータの圧縮技術が進んで、簡単にそうとは言えなくなってきてしまいました。このあたりは複雑なので割愛させていただきますね。
ああ、今回もずいぶん長くなってしまいました。だいぶ大雑把な説明でしたが、デジタル音声が大体どんなものかというイメージはつかめたでしょうか。
アナログ音声信号は、伝送や加工、記録・再生などの行程を踏むごとに何らかのロスが起きたりノイズが混入したりして、信号にゆがみが発生し、程度の差はあれ必ず音質が劣化していきます。しかし、先にお話ししたようにデジタル音声信号ではこういった劣化は理論上発生しません。実際には信号の欠落と補正をいつも繰り返していて、それが微妙な音質の変化として表れることもあるそうですが。
しかし、こんなに便利で素晴らしいデジタル音声も、所詮はアナログ音声から作り出したもの、言い換えればアナログの模倣です。ですから、アナログとデジタルのどちらが音が良いか、ということは一概には言えません。
強いて言うならば、声帯が直接空気を振動させる人の声や、響体が直接空気を振動させる楽器の音など、身の回りにある自然の音を直接耳で聴いたときの音が、一番高音質だといえるのかもしれません。
だって、それこそが何の手も加えられていない、生まれたままの「音」なのですから。
ということで、今回の「音の基礎講座」は終了です。皆さん、おつかれさまでした。
チャイムをどうぞ→
よろしければランキング投票をお願いします→

Category: 音の基礎講座
11:37 | Comment(9) | TrackBack(1) | EDIT