2012/08/10

文系のための「行列」(4)

行列というものがどのようなものであるか、大体は理解できた。
ふむ。では、さっそく、統計の教科書を読んでみる...。

何やら、色々と記号があって、理解できない。
アルファベットの上に何かが書いてあったり、
右下に「i」とか「j」などと書いてあったり、
見たことの無いような記号「λ」といったものある。

っという状況にある人のために、
変数」と「添字」の見方についても整理しておく。
意味が解っている人には不要。

数学が苦手で、逃げ続けてきた(いる)人は多い。
そういった類の人は、「変数」と聞いただけで卒倒する。

あっ...理系の人なんですね〜。私、文系なんで〜。
はっきり言って、関係ない。

多くの場合、この手の人は、そもそも、何もできない。
そういう人になってはいけない。文系を自称して数学の苦手を強調する人で、
自身の文系能力を「きちんと」説明できた人に会ったことが無い。

深くは述べるつもりは無いが、私は古典的な文化科学の流れを引く文系研究者である。
確かに、数学は苦手ではあるが、これは「文系だから」ではなく、
中学校以来、逃げ続けてきた「結果」に過ぎない。別問題である。

何やら、愚痴っぽいな。私の身に何かあったのかもしれない。
まぁ、それで良い。そういったことを書けるのも、個人のブログ。自己満足。

話が逸れたが、「変数」とは何か?を考える。
以前の投稿で、多次元データにおける「次元」が
ある事象を空間に布置するための「」であると説明した。

この「」というのは、ある事象の特性の量的な大小であり、
したがって、「属性」の大小を布置するための基準であり、
ある属性の「」は軸上の「どこかに」布置される。

では、その「どこか」とは、何によって決まるのか?
それは、個々の実際の対象「観測値」に依存する。
実際の対象によって、「」わる「」の値であるから「変数」と呼ぶ。

例えば、「」という事象に関して、「身長」、「体重」、「年齢」、「体脂肪率
という属性が定義されていて、「Aさん」、「Bさん」、「Cさん」、「Dさん」、
の四つの対象があったとすると、四人のそれぞれの属性の値が「変数」である。

この変数というのは、一般的に、どのような数字が入るのか不明なので、
したがって「x」や「y」、あるいは他の文字で置き換えるのである。

さらに、この話を一般化し、多次元データとして考えてみる。

ここでは、p個の属性から成る事象について、n個の対象を集めてきたとする。
すると、以下のように表現できる。これを「np行列」と呼ぶことにする。
古い教科書では、「nm行列」で表している場合がある。



データによって、属性の数も、対象も変化するので、文字に置き換えているだけである。
つまり、対象数と属性数自身が変数として説明してある。

さて、この行列の個々の「成分」は「スカラー」の「変数」である。
状況に応じて変わるので当たり前。「x」という記号で表されている。

この記号をよく見ると、右下に申し訳なさそうに、
数字(と文字)がちょこんと座っている。これを「添字(そえじ)」と呼ぶ。
要するに、この行列内における変数の場所を示しているのである。
ちなみに、英語では、「subscript」と呼ぶ。

添字も、増えていくと訳が解らなくなるが、
要するに、「何番目の変数であるか?」を表しているだけである。

上の多次元データにおいて、左上の「成分」は、 となっている。
これは、1行目の1列目の成分にある変数であることを指している。

では、 となると、どこを示しているのだろうか?
答えは、5行目の3列目の成分を示す変数である。

次に、「不特定」番目の表現について考えてみる。
対象の数が、1〜nまで存在したとして、この区間の不特定の地点を「i」とし、
属性の数が、1〜pまで存在したとして、この区間の不特定の地点を「j」とすると、
任意のある地点の変数は、 で表現できる。

これで、「変数」と「添字」の意味は大体は理解できた。抑えておきたい点は、

行列として表現されたある多次元データの成分は、
スカラーの変数であり、そのスカラーの行列内の位置を添字で特定する、

次に、行列の「ベクトル」を変数として扱う場合と、
行列自身を一つの変数として扱う場合について考える。
とにかく、最初に、どういった状況であるかを見てみる。

まずは、「横ベクトル」の場合を考える。



この例では、「横ベクトル」を取り出し、それぞれを「変数」として表現している。
つまり、以下のようになっている。全部書くのは面倒なので一行目だけ。



次に、「縦ベクトル」の場合。「横ベクトル」の場合と同じ。
ただし、並び方の関係上、直感的に解りにくいかもしれない。



これも、1列目だけを取り出してみる。
すると、以下のようになる。



疑問に思った人も居るかもしれない。つまり、
縦ベクトル」と「横ベクトル」の区別ができない、と。
中々、良いセンスである。結論から言うと区別は無い。
そもそも、ベクトルには、縦と横の区別が無い。

では、どうするか?これが厄介である。文脈から判断する
大抵の場合は、データの一部(あるいは全体)が示されていたり、
計算方式が、どこかに示されているので、それを見て判断する。
実際、混乱の元になるのだが…慣れれば問題ない。

最後に、「行列」自身を変数とする場合。これは、すでに示されてある。
慣例的には、「大文字」の斜体太文字アルファベットで表すのである。
行列の計算では、よくこの大文字の変数で表されていて、
教科書などでこれが出てきたら、とりあえず、行列をイメージすることが重要。


3 件のコメント:

  1. 上の多次元データにおいて、右上の「成分」は、x_{11} となっている。



    上の多次元データにおいて、左上の「成分」は、x_{11} となっている。

    ※右上→左上では?

    返信削除
    返信
    1. コメントありがとうございます。そうですね…「左上」でした。
      間違いを訂正しておきました。

      削除
  2. 横ベクトルの行列の画像のところで、x1 x2・・・xpと縦に並んでいますが、xpではなくxnではないでしょうか?

    返信削除