T_NAKAの阿房ブログ

アクセスカウンタ

zoom RSS フィッシャーのアヤメのデータから散布図行列を描く

<<   作成日時 : 2018/03/12 00:01   >>

面白い ブログ気持玉 1 / トラックバック 1 / コメント 0

有名な「フィッシャーのアヤメのデータ」というものがあります。この wikipedia の Data set で Data[show] をクリックすると具体的なデータを見ることができますし、今回は このページ の「(2)フィッシャーのアイリスデータ」にある「>> データのダウンロード  iris.xls」から頂ました。

この"iris.xls"から直接 R にインポートしようとしましたが、上手くいなくて別のエクセルシートを作って、データをそこにコピペしてから新しいエクセルからインポートしたらうまくいきました。

さて、このデータは3種類のアヤメに対して「がく片」「がく片幅」「花びら」「花びら幅」の4つのデータを測定しています。これがどの部位かは下図を見ていただくのが良いでしょう。

画像


直立しているのが「花びら」で、下に垂れ下がっているのが「がく片」で、この長さと幅を測ったと想像できます。幅というのは最大幅なんでしょうね。 
次に対象となる3種類のアヤメとはどんなものか?これは先に挙げた wikipedia にも写真が載っていますので、コピペさせていただきました。

画像


ちょっと気になるのは今回いただいたデータでは「セトナ」「バーシクル」「バーシニカ」となっているんですが、この wikipedia では "setosa" "versicolor" "virginica" となっているんですね。"setosa"を「セトナ」と読むのはちょっと不自然なんですが、一応データの通りに書いておきました。

では、これらのデータからR(とRコマンダー)を使って散布図行列を描いてみました。

画像


対角線上には各項目の単独のヒストグラムが出てきており、各2項目の散布図が12個出てきました。例えば一番上の段の3つの散布図では、縦軸はすべて「がく片」で、一番左の横軸は「がく片幅」で、真ん中の横軸は「花びら」で、一番右の横軸は「花びら幅」を示しています。

これを見ると、「セトナ」は他の2つのアヤメに比べるとだいぶ傾向が違うのが分かりますね。統計的に判別分析などしなくても図を見ると直感でも分かるので、こういうのは便利なのかも知れません。
まあ、上にあげた3種類のアヤメの写真を見ても、それは何となく分かりますが。。。

(この散布図行列は先にあげた wikipedia にも載っているのですが、ここではRで描く練習です。)

テーマ

関連テーマ 一覧


月別リンク

ブログ気持玉

クリックして気持ちを伝えよう!
ログインしてクリックすれば、自分のブログへのリンクが付きます。
→ログインへ
気持玉数 : 1
面白い

トラックバック(1件)

タイトル (本文) ブログ名/日時
Rで主成分分析
ビッグデータ分析というと有意差検定などではなく、多変量解析をしないと面白くないんじゃないか?と思います。そういう意味でRでどんなことをできるか?を探りながら動かしてみましょう。まずは「主成分分析」から始めてみます。 ...続きを見る
T_NAKAの阿房ブログ
2018/04/15 04:41

トラックバック用URL help


自分のブログにトラックバック記事作成(会員用) help

タイトル
本 文

コメント(0件)

内 容 ニックネーム/日時

コメントする help

ニックネーム
本 文
フィッシャーのアヤメのデータから散布図行列を描く T_NAKAの阿房ブログ/BIGLOBEウェブリブログ
文字サイズ:       閉じる