T_NAKAの阿房ブログ

アクセスカウンタ

zoom RSS 統計の基礎_(1) 分布の代表値

<<   作成日時 : 2016/07/11 15:03   >>

ブログ気持玉 0 / トラックバック 0 / コメント 0

物理のネタがないので、かつて社内教育用テキストを企画したときの原稿を書き直してUPしてみたいと思います。
分散分析を理解することが目的なので、大分端折っていますので、ご理解下さい。

分布の位置の代表値

 いま、N 個のデータ
 
の分布を考える。
 この分布全体を他の分布と大小を比較するとき、分布の位置の代表値 m を設定し議論できれば便利である。
 では、どの様にすれば良いか?
  を数直線上に大小の順番に並べ、各点からの距離の総和が最も少ない点を m とすれば良いであろう。

 すなわち を最小にするような m を選べば良い。
 ここで、 であるから、
 
とし、(1) を最小にするような m を求めれば良いことになる。
 (1) を m で微分してゼロとすると、
 
 (2) 式より
 
 よって
 
  これは通常良く使用されている算術平均である。

注)「算術平均」以外に分布の位置の代表値を表すものとして、中央値、最頻値などがあるが、ここでは扱わない。


分布のバラツキの代表値 

 前項の (1) で示した式を書き直して
 
(ただし、m は(4)式で表わしたもの)
 は偏差平方和、あるいは単に平方和または変動と呼ばれている。
 この値は変数のバラツキの程度の大小を反映している。
 しかし、実際のところ、バラツキは小さくともデータの数が多ければ S は大きくなり、逆にバラツキは大きくてもデータの数が少なければ S は小さくなるかも知れないため、このままではバラツキ程度を示す尺度としては不都合である。
 そこで、S がバラツキの尺度となりうるためには、データの大きさ N に関する情報をこの中に入れてやれば良い。
 つまり S を N で割り、尺度とすれば良いことになる。これを分散と呼び、σ2 で表わす。
 
 σ2 は元のデータの単位を2乗してあるので、これの平方根をとって元の単位に戻したものを標準偏差と呼んでいる。
 
 分散および標準偏差は、変数のバラツキの程度を表わす尺度として最も広く用いられている。

注)σ2 は Variance の頭文字 V で表わすこともある。
 
 

テーマ

関連テーマ 一覧


月別リンク

ブログ気持玉

クリックして気持ちを伝えよう!
ログインしてクリックすれば、自分のブログへのリンクが付きます。
→ログインへ

トラックバック(0件)

タイトル (本文) ブログ名/日時

トラックバック用URL help


自分のブログにトラックバック記事作成(会員用) help

タイトル
本 文

コメント(0件)

内 容 ニックネーム/日時

コメントする help

ニックネーム
本 文
統計の基礎_(1) 分布の代表値 T_NAKAの阿房ブログ/BIGLOBEウェブリブログ
文字サイズ:       閉じる