T_NAKAの阿房ブログ

アクセスカウンタ

zoom RSS ダーウィンのデータ(3)

<<   作成日時 : 2016/09/09 00:01   >>

ブログ気持玉 0 / トラックバック 0 / コメント 0

鉢の影響は本当にないのだろうか?というのが気になります。
この分析は二元配置法が適切であるのですが、Excel の「分散分析:繰り返しのある二元配置」は使えません。

何故使えないかというと、繰り返し数が一定じゃないからです。
具体的には鉢Iには他家受精と自家受精が各々3株ずつ、鉢Uも3株ずつ、鉢Vは5株ずつ、鉢Wも4株ずつになっています。
もし、全てが3株ずつなら Excel の「分散分析:繰り返しのある二元配置」は使えますが、バラバラなので対処の「1標本あたりの行数というのが1つに限定出来なくなるのです。
だったら、鉢Vと鉢Wのデータを間引いて全て3株ずつにすれば良いと思うかも知れませんが、データを選別して捨てる根拠がありません。

よって、繰り返しのある二元配置を、少し面倒ですが、Excel 関数を用いながら計算してみましょう。

まず、データの総計と、全2乗和を計算します。これは SUM と SUMSQ という関数で計算できます。
結果は

 データの総計 = 4540
 全2乗和 = 705014

であり、

 CF = (データの総計)2/データ数 = 45402/30 = 687053.333

と計算されます。ここから全変動 ST

 ST = 全2乗和 - CF = 705014 - 687053.333 = 17960.667

となりました。ここまでの結果を Excel で表示した例です。画面上に関数は示されていないので参考にはなりませんが、いちいち手計算しなくても出来たという証拠です。
画像
  
「分散分析:繰り返しのある二元配置」では組合せ毎の総計が必要になってくるので、SUM 関数を使って別の表を作ります。
このデータから SA (方式での変動)、 SB (鉢での変動)を求めてみましょう。

 SA = (他家受精の合計2/他家受精のデータ数)+ (自家受精の合計2/自家受精のデータ数) - CF
   = (24312/15)+ (20192/15) - 687053.333 = 3456.133

 SB = (Tの合計2/Tデータ数)+ (Uの合計2/Uデータ数)+(Vの合計2/Vデータ数)+(Wの合計2/Wデータ数) - CF
   = (9142/6)+ (9572/6)+(15222/10)+ (11472/8) - 687053.333 = 920.3583

ここまでの結果を Excel で表示した例です。
画像

次に交互作用 SA×B を求めることになるんですが、その前に組合せ変動 SAB を求める必要があります。

 SAB = (各マスの合計2/各マスのデータ数) - CF
  = (4522/3)+(4622/3)+(5012/3)+(4562/3)+(8452/5)+(6772/5)+(6332/4)+(5122/4)- 687053.333 = 5867.05

となりますが、 SA×B = SAB - SA - SB という関係から

 SA×B = 5867.05 - 3456.133 - 920.3583 = 1490.558

であり、誤差変動 Se

 Se = ST- SA - SB-SA×B = 12093.62

となります。ここまでの Excel 表示例です。
画像
  

ここで、自由度考えます。

全体のデータ数:30
方式数:2
鉢の種類 : 4

なので

fT = 30-1 = 29
fA = 2-1 = 1
fB = 4-1 = 3
fA×B = fA×fB= 1×3 = 3
fe = fT- fA- fB- fA×B = 29-1-3-3 = 22

となります。  データが揃ったので、分散分析表に記入して空いた部分を計算していきます。
画像

まず、上の分散分析表を説明します。
これは今までのデータをそのまま入れたもので、誤差分散に対する分散比を見ると、「B(鉢)」と「A×B(交互作用)」で1以下になっています。これは誤差と同程度なので、有意差が無いと判断しても問題ないため、P-値を計算せずに「-」としました。残るのは「A(受精方式)」で分散比は約 6.29 で、P-値「=FDIST(E3,C3,C6) 」で計算出来て、約 2% の確率になりました。これは微妙な値で、有意水準が 5% なら有意差あり、1% なら有意差なしですね。

下の分散分析表は「B(鉢)」と「A×B(交互作用)」の変動が誤差と同程度だったので、その変動と自由度を誤差に足し込んで、新たな誤差として分散分析表を構成したものです。「A(受精方式)」で分散比は約 6.67 で、P-値「=FDIST(E13,C13,C14) 」で計算出来て、約 1.5% の確率になりました。少し確率が減りましたね。

当然ですが、一元配置で分析すると下に示すように同じ結果になります。
画像


結論を考察すると、「B(鉢)」と「A×B(交互作用)」の変動が誤差と同程度だったので、鉢の区別は考えなくても良く、受精方式のみに有意差が有りそうだということになります。ただ P-値からすると、そんなに声高に「有意差有り」と叫んで良いのか?疑問の残るところですね。

最後に推定値を図示しておきましょう。
画像

信頼区間が重なっていることを見ても「有意差有り」とは簡単に言えないような気もします。

テーマ

関連テーマ 一覧


月別リンク

ブログ気持玉

クリックして気持ちを伝えよう!
ログインしてクリックすれば、自分のブログへのリンクが付きます。
→ログインへ

トラックバック(0件)

タイトル (本文) ブログ名/日時

トラックバック用URL help


自分のブログにトラックバック記事作成(会員用) help

タイトル
本 文

コメント(0件)

内 容 ニックネーム/日時

コメントする help

ニックネーム
本 文
ダーウィンのデータ(3) T_NAKAの阿房ブログ/BIGLOBEウェブリブログ
文字サイズ:       閉じる