行列というものがどのようなものであるか、大体は理解できた。
ふむ。では、さっそく、統計の教科書を読んでみる...。
何やら、色々と記号があって、理解できない。
アルファベットの上に何かが書いてあったり、
右下に「i」とか「j」などと書いてあったり、
見たことの無いような記号「λ」といったものある。
っという状況にある人のために、
「変数」と「添字」の見方についても整理しておく。
意味が解っている人には不要。
数学が苦手で、逃げ続けてきた(いる)人は多い。
そういった類の人は、「変数」と聞いただけで卒倒する。
「あっ...理系の人なんですね〜。私、文系なんで〜。」
はっきり言って、関係ない。
多くの場合、この手の人は、そもそも、何もできない。
そういう人になってはいけない。文系を自称して数学の苦手を強調する人で、
自身の文系能力を「きちんと」説明できた人に会ったことが無い。
深くは述べるつもりは無いが、私は古典的な文化科学の流れを引く文系研究者である。
確かに、数学は苦手ではあるが、これは「文系だから」ではなく、
中学校以来、逃げ続けてきた「結果」に過ぎない。別問題である。
何やら、愚痴っぽいな。私の身に何かあったのかもしれない。
まぁ、それで良い。そういったことを書けるのも、個人のブログ。自己満足。
話が逸れたが、「変数」とは何か?を考える。
以前の投稿で、多次元データにおける「次元」が
ある事象を空間に布置するための「軸」であると説明した。
この「軸」というのは、ある事象の特性の量的な大小であり、
したがって、「属性」の大小を布置するための基準であり、
ある属性の「値」は軸上の「どこかに」布置される。
では、その「どこか」とは、何によって決まるのか?
それは、個々の実際の対象「観測値」に依存する。
実際の対象によって、「変」わる「数」の値であるから「変数」と呼ぶ。
例えば、「人」という事象に関して、「身長」、「体重」、「年齢」、「体脂肪率」
という属性が定義されていて、「Aさん」、「Bさん」、「Cさん」、「Dさん」、
の四つの対象があったとすると、四人のそれぞれの属性の値が「変数」である。
この変数というのは、一般的に、どのような数字が入るのか不明なので、
したがって「x」や「y」、あるいは他の文字で置き換えるのである。
さらに、この話を一般化し、多次元データとして考えてみる。
ここでは、p個の属性から成る事象について、n個の対象を集めてきたとする。
すると、以下のように表現できる。これを「np行列」と呼ぶことにする。
古い教科書では、「nm行列」で表している場合がある。
データによって、属性の数も、対象も変化するので、文字に置き換えているだけである。
つまり、対象数と属性数自身が変数として説明してある。
さて、この行列の個々の「成分」は「スカラー」の「変数」である。
状況に応じて変わるので当たり前。「x」という記号で表されている。
この記号をよく見ると、右下に申し訳なさそうに、
数字(と文字)がちょこんと座っている。これを「添字(そえじ)」と呼ぶ。
要するに、この行列内における変数の場所を示しているのである。
ちなみに、英語では、「subscript」と呼ぶ。
添字も、増えていくと訳が解らなくなるが、
要するに、「何番目の変数であるか?」を表しているだけである。
上の多次元データにおいて、左上の「成分」は、 となっている。
これは、1行目の1列目の成分にある変数であることを指している。
では、 となると、どこを示しているのだろうか?
答えは、5行目の3列目の成分を示す変数である。
次に、「不特定」番目の表現について考えてみる。
対象の数が、1〜nまで存在したとして、この区間の不特定の地点を「i」とし、
属性の数が、1〜pまで存在したとして、この区間の不特定の地点を「j」とすると、
任意のある地点の変数は、 で表現できる。
これで、「変数」と「添字」の意味は大体は理解できた。抑えておきたい点は、
行列として表現されたある多次元データの成分は、
スカラーの変数であり、そのスカラーの行列内の位置を添字で特定する、
次に、行列の「ベクトル」を変数として扱う場合と、
行列自身を一つの変数として扱う場合について考える。
とにかく、最初に、どういった状況であるかを見てみる。
まずは、「横ベクトル」の場合を考える。
この例では、「横ベクトル」を取り出し、それぞれを「変数」として表現している。
つまり、以下のようになっている。全部書くのは面倒なので一行目だけ。
次に、「縦ベクトル」の場合。「横ベクトル」の場合と同じ。
ただし、並び方の関係上、直感的に解りにくいかもしれない。
これも、1列目だけを取り出してみる。
すると、以下のようになる。
疑問に思った人も居るかもしれない。つまり、
「縦ベクトル」と「横ベクトル」の区別ができない、と。
中々、良いセンスである。結論から言うと区別は無い。
そもそも、ベクトルには、縦と横の区別が無い。
では、どうするか?これが厄介である。文脈から判断する。
大抵の場合は、データの一部(あるいは全体)が示されていたり、
計算方式が、どこかに示されているので、それを見て判断する。
実際、混乱の元になるのだが…慣れれば問題ない。
最後に、「行列」自身を変数とする場合。これは、すでに示されてある。
慣例的には、「大文字」の斜体太文字アルファベットで表すのである。
行列の計算では、よくこの大文字の変数で表されていて、
教科書などでこれが出てきたら、とりあえず、行列をイメージすることが重要。
ふむ。では、さっそく、統計の教科書を読んでみる...。
何やら、色々と記号があって、理解できない。
アルファベットの上に何かが書いてあったり、
右下に「i」とか「j」などと書いてあったり、
見たことの無いような記号「λ」といったものある。
っという状況にある人のために、
「変数」と「添字」の見方についても整理しておく。
意味が解っている人には不要。
数学が苦手で、逃げ続けてきた(いる)人は多い。
そういった類の人は、「変数」と聞いただけで卒倒する。
「あっ...理系の人なんですね〜。私、文系なんで〜。」
はっきり言って、関係ない。
多くの場合、この手の人は、そもそも、何もできない。
そういう人になってはいけない。文系を自称して数学の苦手を強調する人で、
自身の文系能力を「きちんと」説明できた人に会ったことが無い。
深くは述べるつもりは無いが、私は古典的な文化科学の流れを引く文系研究者である。
確かに、数学は苦手ではあるが、これは「文系だから」ではなく、
中学校以来、逃げ続けてきた「結果」に過ぎない。別問題である。
何やら、愚痴っぽいな。私の身に何かあったのかもしれない。
まぁ、それで良い。そういったことを書けるのも、個人のブログ。自己満足。
話が逸れたが、「変数」とは何か?を考える。
以前の投稿で、多次元データにおける「次元」が
ある事象を空間に布置するための「軸」であると説明した。
この「軸」というのは、ある事象の特性の量的な大小であり、
したがって、「属性」の大小を布置するための基準であり、
ある属性の「値」は軸上の「どこかに」布置される。
では、その「どこか」とは、何によって決まるのか?
それは、個々の実際の対象「観測値」に依存する。
実際の対象によって、「変」わる「数」の値であるから「変数」と呼ぶ。
例えば、「人」という事象に関して、「身長」、「体重」、「年齢」、「体脂肪率」
という属性が定義されていて、「Aさん」、「Bさん」、「Cさん」、「Dさん」、
の四つの対象があったとすると、四人のそれぞれの属性の値が「変数」である。
この変数というのは、一般的に、どのような数字が入るのか不明なので、
したがって「x」や「y」、あるいは他の文字で置き換えるのである。
さらに、この話を一般化し、多次元データとして考えてみる。
ここでは、p個の属性から成る事象について、n個の対象を集めてきたとする。
すると、以下のように表現できる。これを「np行列」と呼ぶことにする。
古い教科書では、「nm行列」で表している場合がある。
データによって、属性の数も、対象も変化するので、文字に置き換えているだけである。
つまり、対象数と属性数自身が変数として説明してある。
さて、この行列の個々の「成分」は「スカラー」の「変数」である。
状況に応じて変わるので当たり前。「x」という記号で表されている。
この記号をよく見ると、右下に申し訳なさそうに、
数字(と文字)がちょこんと座っている。これを「添字(そえじ)」と呼ぶ。
要するに、この行列内における変数の場所を示しているのである。
ちなみに、英語では、「subscript」と呼ぶ。
添字も、増えていくと訳が解らなくなるが、
要するに、「何番目の変数であるか?」を表しているだけである。
上の多次元データにおいて、左上の「成分」は、 となっている。
これは、1行目の1列目の成分にある変数であることを指している。
では、 となると、どこを示しているのだろうか?
答えは、5行目の3列目の成分を示す変数である。
次に、「不特定」番目の表現について考えてみる。
対象の数が、1〜nまで存在したとして、この区間の不特定の地点を「i」とし、
属性の数が、1〜pまで存在したとして、この区間の不特定の地点を「j」とすると、
任意のある地点の変数は、 で表現できる。
これで、「変数」と「添字」の意味は大体は理解できた。抑えておきたい点は、
行列として表現されたある多次元データの成分は、
スカラーの変数であり、そのスカラーの行列内の位置を添字で特定する、
次に、行列の「ベクトル」を変数として扱う場合と、
行列自身を一つの変数として扱う場合について考える。
とにかく、最初に、どういった状況であるかを見てみる。
まずは、「横ベクトル」の場合を考える。
この例では、「横ベクトル」を取り出し、それぞれを「変数」として表現している。
つまり、以下のようになっている。全部書くのは面倒なので一行目だけ。
次に、「縦ベクトル」の場合。「横ベクトル」の場合と同じ。
ただし、並び方の関係上、直感的に解りにくいかもしれない。
これも、1列目だけを取り出してみる。
すると、以下のようになる。
疑問に思った人も居るかもしれない。つまり、
「縦ベクトル」と「横ベクトル」の区別ができない、と。
中々、良いセンスである。結論から言うと区別は無い。
そもそも、ベクトルには、縦と横の区別が無い。
では、どうするか?これが厄介である。文脈から判断する。
大抵の場合は、データの一部(あるいは全体)が示されていたり、
計算方式が、どこかに示されているので、それを見て判断する。
実際、混乱の元になるのだが…慣れれば問題ない。
最後に、「行列」自身を変数とする場合。これは、すでに示されてある。
慣例的には、「大文字」の斜体太文字アルファベットで表すのである。
行列の計算では、よくこの大文字の変数で表されていて、
教科書などでこれが出てきたら、とりあえず、行列をイメージすることが重要。
上の多次元データにおいて、右上の「成分」は、x_{11} となっている。
返信削除↓
上の多次元データにおいて、左上の「成分」は、x_{11} となっている。
※右上→左上では?
コメントありがとうございます。そうですね…「左上」でした。
削除間違いを訂正しておきました。
横ベクトルの行列の画像のところで、x1 x2・・・xpと縦に並んでいますが、xpではなくxnではないでしょうか?
返信削除