T_NAKAの阿房ブログ

アクセスカウンタ

zoom RSS 主成分分析のおさらい(1)

<<   作成日時 : 2018/05/29 00:01   >>

ブログ気持玉 0 / トラックバック 0 / コメント 0

ちょっと思うところがあって、多変量解析を少しずつおさらいしていきたいと思います。まず手始めに主成分分析を取り上げます。考え方というとwikipediaとかこの記事とかここを読んでいただいた方が的確なので、ここでは数式を追ってみます。

画像


今データ数(点)は 個で、原点 の平均値とします。

ここで座標軸 の決め方を考えます。


 

という量は座標回転変換でも変わりません。ここで、新たな とデータ点との距離の2乗の合計

 

が最小になるように決めたいです。ところで3平方の定理から

 

なので、

 

となり、 での座標データのバラツキが最大になるように選択しても同じことになります。

座標軸 方向の単位ベクトルを とし、 とすると、 はこの軸の方向余弦となります。

そうすると、

 

から、

 

であり、この値が最大になるように方向を決めればよいでしょう。ただし方向余弦には という制限があります。よってラグランジェの未定係数法を考えて

 

これを最大にするようにすればよいことになります。偏微分して

 
 

から

 
  
 
  

となります。ここで

  

とします。原点を の平均値としたことを思い出すと、これは分散/共分散にデータ数を掛けたものであることが分かりますが、これを使うと

 

という  の連立方程式になります。これがゼロベクトルでない解をもつためには

 

ということですが、これは

 

という行列の固有値問題ということになります。そういう意味ではこれをデータ数で割った分散/共分散を小文字で表わした行列

 

で考えても同じことになるでしょう。
ちょっと結論だけを書くと、固有値は2つありますが、大きい方の固有値に関する固有ベクトルを方向余弦とした軸が 第1主成分といって、小さい方の固有値に関する固有ベクトルを方向余弦とした軸が 第2主成分となります。

今日はこの辺で。。

 

テーマ

関連テーマ 一覧


月別リンク

ブログ気持玉

クリックして気持ちを伝えよう!
ログインしてクリックすれば、自分のブログへのリンクが付きます。
→ログインへ

トラックバック(0件)

タイトル (本文) ブログ名/日時

トラックバック用URL help


自分のブログにトラックバック記事作成(会員用) help

タイトル
本 文

コメント(0件)

内 容 ニックネーム/日時

コメントする help

ニックネーム
本 文
主成分分析のおさらい(1) T_NAKAの阿房ブログ/BIGLOBEウェブリブログ
文字サイズ:       閉じる