2020年10月1日木曜日

【統計ソフト】[統計の基礎5]用語解説:「パラメトリック」「ノンパラメトリック」,「対応のある」「対応のない(独立した)」

統計ソフトを使う上で知っておくと役に立つ統計の基礎的な用語を紹介するシリーズです。
以下のリンクから関連のブログ記事を一覧できます。

今回は,統計の検定方法選択の際などに重要となる「パラメトリック」「ノンパラメトリック」「対応のある」「対応のない(独立した)」という用語についてです。

Ⅰ.「パラメトリック」「ノンパラメトリック」


パラメトリック・ノンパラメトリックとは,分析対象のデータの"分布"に関する用語です。その分布がパラメーター(母数)を持っているか否かを表しています。

パラメーター(母数)とは,データがなんらかの確率分布に従っているとき,その分布の特性を表す値のことです。例えば,「正規分布」の場合の代表的なパラメーター(母数)は,「平均」や「分散」です。

1. パラメトリック

「パラメトリック」とは,対象とするデータが,パラメーター(母数)を持ったなんらかの確率分布に従っていることを指します。また,そのようなデータに対して行なう検定を「パラメトリック検定」といいます。

パラメトリックなデータの代表的な分布は「正規分布」です。
正規分布した複数群の比較に用いる代表的なパラメトリック検定の方法に,「t検定(t test)」や「一元配置分散分析(one-way analysis of variance / one-way ANOVA)」があります。平均や分散を用いて,各群の平均値が同じと言えるか否かを検定します。

2. ノンパラメトリック

「ノンパラメトリック」とは,対象とするデータが,パラメーター(母数)を持たない,つまり特定の確率分布に従っているかわからない,もしくはそうとは決められないことを指します。また,そのようなデータに対して行なう検定を「ノンパラメトリック検定」といいます。

代表的なノンパラメトリック検定の方法に,「マン=ホイットニーのU検定(Mann-Whitney U test)」や「クラスカル=ウォリス検定(Kruskal-Wallis test)」があります。データを,各値の実数ではなく,値の大きさの順位に変えて比較し,群間に差がないと言えるか否かを検定します。

Ⅱ.「対応のある」「対応のない(独立した)」


対応のある・対応のない(独立した)とは,比較される各群の”関係性”を表す用語です。


1. 対応のある

「対応のある」とは,同じ個体群を対象にして条件を変えて繰り返し測定(比較)している状態を指します。例えば,同じ患者群における薬の投与前の値と投与後の値とを比較する場合,これは対応のあるデータの比較になります。

2. 対応のない(独立した)

「対応のない(独立した)」とは,異なる個体群をそれぞれの条件で測定(比較)している状態を指します。例えば,A薬を投与した患者群とプラセボを投与した患者群とを比較する場合,これは対応のないデータの比較になります。



【統計ソフトヘルプデスク】
HP:https://www.mnc.toho-u.ac.jp/mc/mnc_stat.php
メール:mnc_stat☆ml.toho-u.jp
 ※「☆」記号を「@」に置き換えて下さい。