パラメトリックですね
っていいたくないですか?、とはいえそもそもパラメトリック・ノンパラメトリックとはなんぞや?- Parametric test データの母集団のパラメータ、つまり特性についてなんらかの仮説を立てた検定 (正規分布とか)
- NonParametric test いかなる仮説も立てない検定
どうやって使い分ける?
もちろんこう思いますよね。このタイミングでパラメトリックを仮定して良いのか否か。チェックする必要があります。今回はNormality Testでパラメトリックの妥当性、ガウス分布である妥当性を調べます。Normality Testは大きく分けて2パート。- Graphical Methods 名前の通り可視化してガウス分布っぽいか見る
- Statistical Tests なんらかの検定によりガウス分布っぽいか調べる
- Hypothesis testing データの母集団のパラメータに関する仮説を検定すること — Null hypothesis で表される。棄却されることを目的とした仮説 — Alternative hypothesis で表される。が棄却された時に採択する仮説
- p-value 仮説の妥当性を評価する数値。Null hypothesisが正しいと仮定した際にその結果が得られる確率。0.05より小さければは棄却される。(0.01と比べる時もある)
- The test statistic データから算出され、Hypothesis testingに使われるランダム変数。p-valueにも使われる。 (Z-statistic, t-statistic, F-statisticとか)
- order statistic 観測順序付きのサンプル。例えば、とは別物、前者はn番目のサンプルであり、後者はn番目に観測されたサンプル
- Shapiro-Wilk Test https://en.wikipedia.org/wiki/Shapiro–Wilk_test
ただし
はiid(独立同分布)のorder statisticの期待値ではその共分散行列。Samuel Shapiro and Martin Wilkによって導かれた。分散の比で計算される。スケールに対して不変である証明が論文にあった。不特定の分布を評価するためにある。(平均、分散未確定)
- Anderson-Darling Test https://en.wikipedia.org/wiki/Anderson–Darling_test
- Kolmogorov-Smirnov Test https://en.wikipedia.org/wiki/Kolmogorov–Smirnov_test
- Martinez-Iglewicz Test
- D’Agostino Skewness Test https://en.wikipedia.org/wiki/D%27Agostino%27s_K-squared_test
- その他のNormality Test D’Agostino Kurtosis Test D’Agostino Omnibus
- https://en.wikipedia.org/wiki/Normality_test
- https://en.wikipedia.org/wiki/Test_statistic
- https://stats.stackexchange.com/questions/362/what-is-the-difference-between-the-shapiro-wilk-test-ofnormality-and-the-kolmog
- https://ncss-wpengine.netdna-ssl.com/wp-content/themes/ncss/pdf/Procedures/NCSS/Normality_Tests.pdf
- http://www.stats.ox.ac.uk/~massa/Lecture%2013.pdf