こんにちは。
パラメトリックですね
っていいたくないですか?、とはいえそもそもパラメトリック・ノンパラメトリックとはなんぞや?
- Parametric test
データの母集団のパラメータ、つまり特性についてなんらかの仮説を立てた検定 (正規分布とか) - NonParametric test
いかなる仮説も立てない検定
よし、ひとまずはこれで違いはわかりましたね。機械学習の本とか論文ではよく正規分布に仮定して話が進められます。(Autoencorderや変分ベイズやほかにもたくさん)なのでパラメトリックが主流なのでしょう。さて、ここではタイトルにあるように検定について話を進めていこうと思います。
どうやって使い分ける?
もちろんこう思いますよね。このタイミングでパラメトリックを仮定して良いのか否か。チェックする必要があります。今回はNormality Testでパラメトリックの妥当性、ガウス分布である妥当性を調べます。Normality Testは大きく分けて2パート。
- Graphical Methods
名前の通り可視化してガウス分布っぽいか見る - Statistical Tests
なんらかの検定によりガウス分布っぽいか調べる
では見ていきましょう、の前にあと少しだけ用語の解説です。
- Hypothesis testing
データの母集団のパラメータに関する仮説を検定すること
— Null hypothesis
で表される。棄却されることを目的とした仮説
— Alternative hypothesis
で表される。
が棄却された時に採択する仮説
- p-value
仮説の妥当性を評価する数値。Null hypothesisが正しいと仮定した際にその結果が得られる確率。0.05より小さければは棄却される。(0.01と比べる時もある)
- The test statistic
データから算出され、Hypothesis testingに使われるランダム変数。p-valueにも使われる。
(Z-statistic, t-statistic, F-statisticとか) - order statistic
観測順序付きのサンプル。例えば、と
は別物、前者はn番目のサンプルであり、後者はn番目に観測されたサンプル
さて、いくつか検定について見ていきましょう。
- Shapiro-Wilk Test
https://en.wikipedia.org/wiki/Shapiro–Wilk_test
ただし
はiid(独立同分布)のorder statisticの期待値で
はその共分散行列。Samuel Shapiro and Martin Wilkによって導かれた。分散の比で計算される。スケールに対して不変である証明が論文にあった。不特定の分布を評価するためにある。(平均、分散未確定)
- Anderson-Darling Test
https://en.wikipedia.org/wiki/Anderson–Darling_test
Anderson and Darlingによって導かれた。データが特定の分布に対してどれだけよく似ているかを評価する。
- Kolmogorov-Smirnov Test
https://en.wikipedia.org/wiki/Kolmogorov–Smirnov_test
経験分布関数と累積分布関数との距離を測る。これはノンパラメトリックな測定。特定の分布を評価するためにある。
- Martinez-Iglewicz Test
Heavy-tailed 対称分布に対して効果が高いよう。
- D’Agostino Skewness Test
https://en.wikipedia.org/wiki/D%27Agostino%27s_K-squared_test
ガウス分布が対称であることを利用して考えられたもの。サンプル数が8以上のときに使えるよう。
- その他のNormality Test
D’Agostino Kurtosis Test
D’Agostino Omnibus
ふう、ガウスかどうかの検定でしたがこれだけでもかなりの量ですね。各検定の違いについても調べてみましたが詳しいことは見つかりませんでした。コメントの方お待ちしています。
実装はScipyを使って行いましょう。
でわ。
READMORE
- https://en.wikipedia.org/wiki/Normality_test
- https://en.wikipedia.org/wiki/Test_statistic
- https://stats.stackexchange.com/questions/362/what-is-the-difference-between-the-shapiro-wilk-test-ofnormality-and-the-kolmog
- https://ncss-wpengine.netdna-ssl.com/wp-content/themes/ncss/pdf/Procedures/NCSS/Normality_Tests.pdf
- http://www.stats.ox.ac.uk/~massa/Lecture%2013.pdf