統計量
と呼ばれるもの。以下、例- z-statistic
- t-statistic
p-値?
これは帰無仮説のもとで統計量の実現値、つまり実際にデータから計算された統計量が得られる確率。計算は下の方で紹介する標準正規分布表を使うのですがめんどくさいのでこことかをつかいます。 これは有意水準(足切りのようなもの)と比べられます。なので例えば、「俺の友達の身長の平均は190cmだ」という帰無仮説を立てる。実際に友達の身長を聞いて集めまくる。z-testをするとする。よってz-statisticを用いる。z=2だったとします。p-valueを計算すると0.0455だった。有意水準を5%とすると。よりは棄却され、190cmではないと言える。一方、有意水準を1%とすると。よりは採択され、平均が190cmではないとは言えない。有意水準と比べるという意味を可視化してみると次の通り。 つまり、珍しすぎてもうあり得ないという理由でを棄却するときの珍しさ具合が有意水準です。ちなみに、こうやって両側使う検定を両側検定、片側のみを片側検定をいいます。としたとき前者、後者の対立仮説はそれぞれのようになります。(ここが詳しい) さて、軽く復習ができたので本題に入りましょう。
母集団の平均に対する検定
がテーマです。先に言っちゃうとstudent-T-testをやろうと思います。しかし、まずは馴染みのあるガウス分布を使ったz-testから触れていきましょう。中心極限定理を覚えていますか?
どんな母集団でも平均・分散のとき、十分多く()の標本を取れば中心極限定理と標準化を使ってz-test(z-検定)をするときは統計量(statistic)はz-statistic(z-valueともいう)でつまり、「データが超多かったら正規分布使えるで」ってことです。
を使います。前述通り母集団の平均に対する検定なので例えば、などとして検定します。有意水準を5%とすると標準ガウス分布表を用いて
とわかります。例えばとなれば上を満たすのでは棄却されます。この時の1.96という値をcritical valueといいます。 ちょっと待つんだ
母集団の分散とかわからんやん!
そうです。母集団の分散がわかってなかったらこのz-testはできないんです。というか実世界で母集団の分散が分かっている状況なんてあるんだろうか、、、諦めない!まだ方法はある
スチューデント t 検定
母集団の分散がわからんから代わりに不偏分散(nが多くない時に使うやつ)を使いましょう。これをつかって同様に標準化する!すると自由度の分布に従う (nはサンプルサイズ)
よってとなります。分母をnoise、分子をsignalといいます。ここまでくればt分布表を用いてさきほどと同じことをするだけですね。(例題) 今までは1つのデータセットを扱って検定していました。しかし、2つのデータセット(n個,m個)を使って検定したときありますよね。
あいつと俺の間にモテ具合の差があるのか?
次の図をみてください。 これは「似た分散」をもつ一次元ガウス分布に従う2つのデータです。これらの平均値の間に差があるかどうかを検定したいです。それぞれのときその差の分布も正規分布になるという再生性を使います。つまりここでもしなら(あくまで仮定)その推定量を
としであるもとで標準化すると自由度で
とでき同じように検定できます。
え、なら?
そんなあなたにウェルチ検定
この時はとしますが、?????のところ、つまり自由度が複雑になります。
とします。
なんでこの検定でわかるんだ
という問には答えられません。ガウスさんたちに聞くしかないです。他にもあるお店にお客が来る時間間隔は指数分布に従うなどといいますが理由はわかりません。事故回数で有名なポアソン分布も同じ。 今回の内容は統計検定、もしくはアクチュアリーちっくなものになりました。用語がたくさんあって混乱する範囲のようですがワンステップづつ確認しましょう。重要なのは中心極限定理です。他にも独立性のカイ二乗検定などあるので調べてみてください。 でわ。 READMORE