2012/09/05

文系のための「デジタルデータ」(1)

コンピュータで情報を扱うこと」と「紙で情報を扱うこと」は根本的に異なる
概念的には理解できていても、実際に理解できている人は多くない
理解している人は、それなりに情報技術スキルを持ち合わせている人くらいである。

では、一体何が異なっているのか?また、何が問題なのか?

そもそも、コンピュータで情報を扱うということは、
コンピュータがその情報を理解できるということ。

コンピュータで扱う情報のことを「デジタル」と呼び、
紙で扱う情報のことを「アナログ」と呼ぶことがある。
まずは、この二つの用語を元にコンピュータが扱う情報について整理してみる。

そもそも、「デジタル」とはどのような意味であるのか?
英語の 「digital 」という言葉は、ラテン語の「digitus(指)」という言葉が語源。
要するに、「指」で数字を数えるというニュアンスである。

ふむ。なるほど。それで?

実を言うと、「」で数えて数量化できる事象というのは限られる

例えば、高速道路の街灯の数や、冷蔵庫の缶ビールの数などは数えることができるが、
お風呂の水位や、オーディオから流れる音量などは「指」では数えることができない

指で数えることができるのは、自然数(1以上の整数)のみであって、
連続的に変化する実数(虚数では無い数)全てを扱うことはできないのである。
つまり、digital というのは、「整数」で扱える「」と理解できる。

一方、「アナログ」というのは、古代ギリシア語の「analogon」に由来する言葉で、
比率や比例に従うもの、あるいは、連続的なもの、を意味する。

つまり、「デジタル化」というのは、かなり強引な言い方をすると、
「指」で数えられないものを、「整数値」にしてしまうということなのである。

ということで、もう少し、デジタル化のことについて考えてみる。
なお、文系向けの話なので、話はかなり大雑把。実は、私も門外漢。

詳しいことを知っている専門家の人は、
コメントの方で補足、訂正等をお願いします。

さてさて...

ここでは原初的な「デジタル」情報を考えてみる。
ふむ。「○」か「✕」あるいは、「有る」と「無い」、つまり「1」と「0」
実は、これだけの情報でも、かなり重要な情報を表現できる。


例えば、トイレの鍵。中に人が入っているかどうか、極めて重要な問題である。
「1」か「0」の二者択一という極めてデジタルな情報、これがデジタル信号の基礎

さて、もう少し、表現力のある「デジタル」情報を考えてみる。
ふむ。「1」と「0」つまり「ON」と「OFF」の状態というのはどうか?

これは、非常に良い考え方である。電流を流す「ON」と「OFF」で信号が送れる。

しかも、「ON」と「OFF」を組み合わせ、その状態を連続して送ることで、
伝達できる情報量を一気に増大させることができる。

例えば、モールス信号の場合、「-(押し続ける)」と「・(一回押す)
の二つの記号を連続して送信することで、アルファベットや数字を表現し、
伝達することができる。

つまり、頑張れば、「1」と「0」だけで論文だって書けてしまうのである。
もっとも、そんな稀有な人は極めて少ないだろうが。

出典:http://ja.wikipedia.org/wiki/%E3%83%95%E3%82%A1%E3%82%A4%E3%83%AB:J38TelegraphKey.jpg

さてさて、もっと、多くの情報を「デジタル」で表現するためには、
どうすれば良いか?ふむ。もっと一杯、モールス信号機を用意すればどうか?
つまり、「ON」と「OFF」の状態を並行して送れるような仕組みがあれば、
より複雑な情報を伝達できるような気がする。

例えば、ピアノのような機械。実際のピアノから出る音はアナログであるが、
仕組みは極めてデジタルである。つまり、鍵盤を「押す」か、「離す」か

ピアノの場合、楽譜に示された通りに鍵盤を弾くことで、
鍵盤がピアノ線を叩いて、音を出す。まさに、デジタル機器

ところで、自動演奏ピアノというものが存在するが、
電子化される前は、紙に穴を開けただけの、ミュージック・ロールを回転させ、
その穴を通過する「風の力」でピアノを演奏していた。

ちなみに、ガーシュインやラフマニノフの手によるミュージック・ロールは、
現在でも残っていて、自動演奏ピアノによって再現された音楽を聞くことができる。
私は、個人的な趣味で、CDを何枚か購入した。まぁ、どうでも良い話ではあるが。

Notenzeichner für Pianola-Rollen 1911 im Londoner Werk der Aeolian Company

さて、結局のところ、デジタルとは何か?
ここで、簡単な「信号(signal)」の例を出してみよう。

連続量としてのアナログの信号

   
離散量としてのデジタルの信号

アナログの信号は「連続量」なので「滑らか」な信号であるが、
デジタルの信号は「離散量」なので「直線的」な信号である。

デジタル機器の多くは電圧の違いによって信号を送受信するのであるが、
受信側では、送られてきた連続量としてのアナログの信号サンプリングし、
簡単な整数の値で近似させているのである。

受信側では、整数の値ごとに検知できる検知器で、
「ON」と「OFF」の状態を識別しデジタルの信号を処理する。
つまり、全て「1」と「0」で情報を扱っているのである。

このことを「量子化」と呼ぶ。よく耳にする「デジタル化」とは、
本来は連続量であるアナログ情報を量子化することである。

例えば、ディスプレイプリンタケーブルの先に付いている複数の端子は、
特定の値の「ON」と「OFF」の状態を検出するためのものなのである。


ところで...

アナログ情報の方が質が高く、デジタル化すると質が低くなる

などと言う人がいるが、要するに、
連続量であるアナログの信号整数値で近似したものがデジタルの信号であるので、
アナログよりも情報量が少ない、という主張なのである。

まぁ、そのように言われれば、多少の情報の損失はあるのだが、
10等分を100等分、100等分を1000等分...というように、
細かく区切って行けば、限りなく、精度を上げることが可能なのである。

確かに、20年ほど前は、デジタル情報処理技術が未熟であったので、
アナログ情報と比較すると、かなりの情報が損失していた。

しかしながら、現在では、コンピュータの処理技術は飛躍的に向上し、
かなりの高精度で、あらゆるアナログ情報を近似できるようになっている。

今回は、「1」と「0」の話から始まり、デジタルアナログの違いについて整理した。
コンピュータの中では、あらゆる情報が、究極的には「ON」と「OFF」で制御され、
ディスプレイプリンタといった情報を出力する機械は、
その情報を人が理解できるように整形し、可視化しているに過ぎない。

次回は、もう少し踏み込んで、様々なデータどのようにして、
コンピュータの中で扱われているかを考えてみる。

0 件のコメント:

コメントを投稿