2020年10月24日土曜日

【統計ソフト】[統計の基礎6]相関係数について知る

統計ソフトを使う上で知っておくと役に立つ統計の基礎的な用語を紹介するシリーズです。
以下のリンクから関連のブログ記事を一覧できます。

今回は,相関係数についてです。

相関係数(r)」とは,2変量間の直線的(線形)な関係性の強さ(相関:correlation)を表すものです。
-1から+1の間の値を取ります。値の絶対値が大きいほど2変量の相関が強い状態です。

関係の強さに絶対的な指標はありませんが,
以下の図のように言われることが多いです。


一方の値が増えるともう一方の値も増える,右肩上がりの関係を「正の相関」といいます。
一方の値が増えるともう一方の値が減る,右肩下がりの関係を「負の相関」といいます。

量的尺度のデータ同士の相関を表す場合には,「Pearsonの積率相関係数」が用いられることが多いです。
順位尺度やノンパラメトリックなデータ同士の相関を表す場合には,「Spearmanの順位相関係数」などが用いられます。

その他,名義尺度同士の相関についてはクラメールの連関係数などで表現することがあります。ここでは説明を割愛します。

なお,
2変量の間に線形以外の関係がある場合は,相関係数では正しく計ることはできません。また,相関関係がある,とは因果関係があるということではありません。

[参考]
・中村 好一. 論文を正しく読み書くためのやさしい統計学. 改訂第3版. 診断と治療社; 2019.
・BellCurve. 統計WEB. https://bellcurve.jp/statistics/
など

【統計ソフトヘルプデスク】
HP:https://www.mnc.toho-u.ac.jp/mc/mnc_stat.php
メール:mnc_stat☆ml.toho-u.jp
 ※「☆」記号を「@」に置き換えて下さい。