T_NAKAの阿房ブログ

アクセスカウンタ

zoom RSS 回帰直線を簡単に描く

<<   作成日時 : 2016/03/08 00:01   >>

ブログ気持玉 0 / トラックバック 0 / コメント 0

ちょっと考えることがあって、別に特別なことではないのですが、記事にしてみました。

まず、Excel で簡単なデータを書いて、「挿入」→「グラフ」→「散布図」で線の無い図を選ぶと次のようになります。

画像


(実は軸の書式などを多少いじっていますので、ご了承願います。)

次にグラフ上のデータ点にカーソルを持って行って、右クリックして「近似曲線の追加」をクリックしてください。
そこで、「線形近似」を選び「グラフに数式を表示する」と「グラフに R-2 乗値を表示する」にレ点を入れて下さい。
すると、次のように回帰直線を描くことができます。

画像


まあ、これで終わりなんですが、もう少し統計学的に恰好を付けてみましょう。
まずデータを選んで、「データ」→「データ分析」で「分析ツール」というのが出てきますから、「相関」を選んでください。
結果は次のようになります。

画像


これは 相関係数 が -0.71 程度であることを示しています。
実は、前のグラフに表示した R-2 乗値のルートをとって、右上がりだったら「+」、右下がりだったら「−」を付ければ求められます。単回帰の場合だけですが。。

次に「分析ツール」というのが出てきますから、「回帰分析」を選んでください。
結果は次のようになります。

画像


ここでの注目点は「分散分析表」の「回帰」の「有意 F」の値です。具体的には、約 0.03 です。
この意味ですが、非常に簡単に言うと、相関(回帰関係)が無くてたまたまこのデータと同じになる確率です。
「偶然こんなデータになる確率は約 0.03 で、殆どあり得ないでしょ?つまり、偶然じゃなくて相関(回帰関係)があるんですよ」と言いたい訳です。
こういうのを普通 p値 と呼んでいます。このExcelの表現では近似直線のパラメータの方の p値 を求めてますが。。

ここまで書いてきたように、データがあれば Excelを使って簡単に回帰直線を求めることが出来ることが分かります。

さて、このグラフは http://togetter.com/li/946766 にあったグラフからデータを読み取って描いてみたものです。
「相関係数 r = -0.71、 P値 = 0.03」というのも合っていますね。

私が気になったのは、統計分析ツールは比較的簡単にアクセス出来て、結果も簡単に得られますが、その意味を判断するのに勉強が必要だということです。
togetterまとめに「線引くのかいっ」とありますが、線は自動的に引けるんです。
統計はどういうツールを使って正しい判断をするかということが問題です。

堀田先生のツィートを見ると「あの回帰曲線は、Nスぺ取材時に手元にあった極少数のデータを、既存のソフトに入力して書いて記者の方にみせたデモンストレーション」で、番組側が使ってしまったようですね。

https://twitter.com/hottaqu/status/706753916717760513 〜 https://twitter.com/hottaqu/status/706755944835735553

に福本先生のコメントが連ツイされています。大変真面目な研究者であることが分かりますので、ご一読のほどを。。

テーマ

関連テーマ 一覧


月別リンク

ブログ気持玉

クリックして気持ちを伝えよう!
ログインしてクリックすれば、自分のブログへのリンクが付きます。
→ログインへ

トラックバック(0件)

タイトル (本文) ブログ名/日時

トラックバック用URL help


自分のブログにトラックバック記事作成(会員用) help

タイトル
本 文

コメント(0件)

内 容 ニックネーム/日時

コメントする help

ニックネーム
本 文
回帰直線を簡単に描く T_NAKAの阿房ブログ/BIGLOBEウェブリブログ
文字サイズ:       閉じる