tag:blogger.com,1999:blog-5890424090566980639.post224344594459987601..comments2024-03-08T08:31:48.565+09:00Comments on 色々と考えてみる: 文系のための「データのバラツキ」(1)Yu Fujimotohttp://www.blogger.com/profile/00522356224690770821noreply@blogger.comBlogger10125tag:blogger.com,1999:blog-5890424090566980639.post-18444043059366618462013-03-27T11:15:44.874+09:002013-03-27T11:15:44.874+09:00懇切丁寧なご説明をありがとうございます。言われてみれば、おっしゃるとおり。しっかり読ませていただいた...懇切丁寧なご説明をありがとうございます。言われてみれば、おっしゃるとおり。しっかり読ませていただいたつもりでしたが、私の理解がまだ足りなかったようです。少し考えれば分かることでした。もう一度勉強させていただきます。文系Anoreply@blogger.comtag:blogger.com,1999:blog-5890424090566980639.post-81335900319932374532013-03-26T19:51:06.181+09:002013-03-26T19:51:06.181+09:00コメントありがとうございます。実は、これは正しいのです。
というよりも、どちらでも同じことになるので...コメントありがとうございます。実は、これは正しいのです。<br />というよりも、どちらでも同じことになるので、<br />[bar x - x_1] と [x_i - bar x] の何れでも良いことになります。<br /><br />重要な点は、後ろの「2乗」の部分です。<br /><br />例として、以下のようなベクトルを考えてみます。<br /><br />x = {1, 3, 5, 7}<br /><br />まず、これの平均「[bar x]」は以下のようになります。<br /><br />[bar x] = (1 + 3 + 5 + 7) / 4 = 16/4 = 4<br /><br />ここで、いきなり分散を計算したいところですが、<br />その前に基本的な事を一つ整理しておきたいと思います。<br /><br />そもそも、平均というのは、数を「平(たいら)に均(なら)す」ことです。<br />したがって、平均と各値との差の合計というのは、別の見方をすると、<br />それぞれの値の差が「全く無い」という言い方もできます。<br /><br />上記の場合、「4」が「4」つということなので、<br />平均だけで元のデータを表すと、以下のようになります。<br /><br />(4 + 4 + 4 + 4) / 4 = 16 / 4 = 4<br /><br />この時、各値と平均との差(偏差)の合計は以下のようになります。<br /><br />(4-4) + (4-4) + (4-4) + (4-4) = 0<br /><br />当たり前の事ですが、当然、合計は「0」になります。<br />では、元のベクトルの場合はどうなるのでしょうか?<br /><br />平均-元の値:(4-1) + (4-3) + (4-5) + (4-7) = (-3) + (-1) + (+1) + (+3) = 0<br />元の値-平均:(1-4) + (3-4) + (5-4) + (7-4) = (+3) + (+1) + (-1) + (-3) = 0<br /><br />結局、お互いの値のプラスとマイナスが打ち消し合ってしまい、<br />偏差の合計は常に「0」となってしまうのです。<br />実は、偏差の合計が「0」がなる部分が「平均」となっているのです。<br /><br />これでは、バラツキの大きさが解らないないのです。<br />これは困った...ということで、2乗してみると?<br /><br />平均-元の値:(4-1)^2 + (4-3)^2 + (4-5)^2 + (4-7)^2 = 9+ 1 + 1 + 9 = 20<br />元の値-平均:(1-4)^2 + (3-4)^2 + (5-4)^2 + (7-4)^2 = 9 + 1 + 1+ 9 = 20<br /><br />少しだけ、小学校の掛け算のルールを思い出して欲しいのですが、<br />掛け算には以下の様な性質がありました。<br /><br />(+) x (+) = (+)<br />(-) x (-) = (+)<br /><br />2乗するということは、元の値同士を書けることなので、<br />上記の何れかのルールが適用されることになるのですが、<br />結局、マイナスであろうが、プラスであろうが、2乗するとプラスになります。<br /><br />したがって、平均と元の値との差を足しあわせた合計と、<br />元の値から平均との差を足しあわせた合計は同じになります。<br /><br />これを一般的に「偏差」の「2乗(平方)」の「和」ということで<br />「偏差平方和」あるいは単に「平方和」と呼びます。<br /><br />おな、「偏差は基準(データの真ん中)から元の値までの距離」と考えると、<br />[bar x - x_i]と書いた方が、なんとなく、言葉の説明にあってるように思います。<br /><br />もちろん、「元の値から基準までの距離が偏差」と考えることもできるので、<br />[x_i - bar x] と書くと、そのようなニュアンスで理解することもできます。<br />計算結果は同じでも、書き方によって、説明の仕方も何となく変わります。Yu Fujimotohttps://www.blogger.com/profile/00522356224690770821noreply@blogger.comtag:blogger.com,1999:blog-5890424090566980639.post-60476304172563372692013-03-26T16:36:01.459+09:002013-03-26T16:36:01.459+09:00以下の式の中で、"\bar x - x_i"とありますが、"x_i -...以下の式の中で、"\bar x - x_i"とありますが、"x_i - \bar x"ではないでしょうか?<br /><br />\sigma^2=\frac{1}{n}\sum_{i=1}^{n}(\bar x - x_i)^2文系Anoreply@blogger.comtag:blogger.com,1999:blog-5890424090566980639.post-52760032344635688372013-03-22T17:04:06.413+09:002013-03-22T17:04:06.413+09:00目次とページタイトルが異なっていたので修正しました。目次とページタイトルが異なっていたので修正しました。Anonymoushttps://www.blogger.com/profile/05018112601086382356noreply@blogger.comtag:blogger.com,1999:blog-5890424090566980639.post-66988018079335351602013-03-22T16:57:22.143+09:002013-03-22T16:57:22.143+09:00これは変換ミスですね。これも修正しました。
ありがとうございます。これは変換ミスですね。これも修正しました。<br />ありがとうございます。Anonymoushttps://www.blogger.com/profile/05018112601086382356noreply@blogger.comtag:blogger.com,1999:blog-5890424090566980639.post-79151870124807612052013-03-22T16:56:32.947+09:002013-03-22T16:56:32.947+09:00ですね...。ですね...。Anonymoushttps://www.blogger.com/profile/05018112601086382356noreply@blogger.comtag:blogger.com,1999:blog-5890424090566980639.post-74917118212233504422013-03-22T16:56:13.735+09:002013-03-22T16:56:13.735+09:00コメント、ありがとうございます。修正しました。
式を貼り付ける際に、間違ったようです。コメント、ありがとうございます。修正しました。<br />式を貼り付ける際に、間違ったようです。Anonymoushttps://www.blogger.com/profile/05018112601086382356noreply@blogger.comtag:blogger.com,1999:blog-5890424090566980639.post-72163676062513654152013-03-22T15:49:16.594+09:002013-03-22T15:49:16.594+09:00『不偏分散」?それとも「普遍分散」?『不偏分散」?それとも「普遍分散」?Anonymousnoreply@blogger.comtag:blogger.com,1999:blog-5890424090566980639.post-77508496247189245332013-03-22T15:46:21.801+09:002013-03-22T15:46:21.801+09:00ColSums(A)
の最初のcは小文字でないとだめなのでは?ColSums(A)<br />の最初のcは小文字でないとだめなのでは?Anonymousnoreply@blogger.comtag:blogger.com,1999:blog-5890424090566980639.post-35603263395145957562013-03-22T15:45:08.829+09:002013-03-22T15:45:08.829+09:00「この式の見方は、既に、平均の話でしている。省略。」の下の、σ^2の式は、1/(n-1)をかけていま...「この式の見方は、既に、平均の話でしている。省略。」の下の、σ^2の式は、1/(n-1)をかけていますが、文脈から察すると、1/nをかけたかったのではないでしょうか?<br /> Anonymousnoreply@blogger.com