こんにちは。
パラメトリック検定を終えて今回はノンパラメトリック検定についてです。僕も初見なので少しワクワクしています。早速いきましょう。
Mann Whitney U Test (Wilcoxon Rank Sum Test)
これは独立な2つのグループのデータについて母集団分布の同一性を検定します。なので
: The two populations are equal
: The two populations are not equal
となります。パラメトリック検定では母平均に対して検定を行なっていましたがマン=ホイットニーのU検定では母集団分布を検定するんですね。また、これは両側検定が一般的です。もし片側検定をするのであれば対立仮説は母集団分布に対してのシフトになります。で、特徴量についてですが、
となります。データを小さい順に並べてrankづけして行った時の各グループのrankの総和がなんですが、下の図で説明します。
この場合だとです。
独立じゃないときは?(i.e. matched or paired)
たとえば The sign test
これは最もシンプルなノンパラテストで中央値の差を検定します。ちなみに、独立じゃない時、と言いましたがこれはたとえば同じグループで実験した際に得られるデータとかになります。なので
: The median difference is zero
: The median difference is not zero α=?
となります。これは各データの増減を比較し減っていれば+、増えていればーという風に符号づけします。以下、例として7人の生徒の5教科の総得点を試験対策前と試験対策後を考えます。
で、どうやるかというとp値を計算します。
どうやって?
を裏表とみていつもの二項分布
を考えます。N個のデータがあって符合づけした時、r個マイナスがあったとします。するとp値は
これを有意水準と比べます。見ての通りこれは片側検定です。両側検定の場合はこのp値を2倍すればいいことが
からわかります。
だけで判断するのはええのか?
なんか雑な感じしますよね。そこで次の方法があります。
Wilcoxon Signed Rank Test
符号検定の改良版で、左の具合、大きさに注目します。先ほどのデータを用いて
帰無仮説と対立仮説は符号検定の時のものと同様です。で、統計量Wは次の小さい方で定義されます。そしてそれぞれを各符号を持ったrankの絶対値総和となります。なので
です。の作り方からもし帰無仮説が正しければこれらはともに小さい値になるはずです。で、critical valueは例えばこの表からわかります。この例だとcritical valueは4となり、
より
は棄却されません。
今までは2種類のデータを対象にしていました。2つ以上を対象としたい時はKruskal Wallis Testを使います。これについてはまた次回書きます。
でわ
READMORE
- https://machinelearningmastery.com/nonparametric-statistical-significance-tests-in-python/
- https://www.youtube.com/watch?v=TqCg2tb4wJ0
- http://sphweb.bumc.bu.edu/otlt/mph-modules/bs/bs704_nonparametric/BS704_Nonparametric4.html
- http://sphweb.bumc.bu.edu/otlt/MPH-Modules/BS/BS704_Nonparametric/BS704_Nonparametric5.html