推計学のすすめ3 2検定
TRANSCRIPT
「推計学のすすめ」3章2節@伊藤
ゴルファーの腕比べの話
腕がいいのはどっち? ゴルフ場 イ ロ ハ ニ ホ ヘ 平均
Aさん 209 205 210 208 207 207 207.7
Bさん 201 197 211 200 208 199 202.7
A-‐B +8 +8 -‐1 +8 -‐1 +8 +5
Aさん Bさん
いやいや検定してみるまでは…
どう見ても俺の勝ちだろ…
符号検定
• 自由度1のχ2値の5%点は3.84なので…
• 二人の腕前に差がなければ「A-‐B」には+と-‐が同じ位出る • 観測値は4と2、期待値は3なのでχ2は…
有意とはいえないよ!やったね!
t検定 • 2人の腕前に差が無ければ「A-‐B」の平均値は0に近い値になる • 「A-‐B」についてt統計量が計算できる
• 自由度5のt値の5%点は2.57なので…
有意な差があるよ!やったね!
検出力 • 符号検定では有意とはいえない(p>0.05)
• t検定では有意(p<0.05)
なぜ?
• t検定は「大きさ」という情報も使っている
• 情報を多く使う検定は「検出力」が高い
適切な方法を使おうね!
いやいやちょっとまて • χ2検定はサンプル数が多くないとあまり適切じゃないです • Rで今回の例をχ2検定にかけると…
> chisq.test(c(4, 2)) Chi-squared test for given probabilities data: c(4, 2) X-squared = 0.6667, df = 1, p-value = 0.4142 警告メッセージ: In chisq.test(c(4, 2)) : カイ自乗近似は不正確かもしれません
正確確率検定 • 勝負の確率が等しいとして、「勝ち2:負け4」が出る確率は二項分布から正確に計算できます • こういうときは分布に頼らず、直接確率を計算
> binom.test(c(4, 2)) Exact binomial test data: c(4, 2) number of successes = 4, number of trials = 6, p-value = 0.6875 alternative hypothesis: true probability of success is not equal to 0.5 95 percent confidence interval: 0.2227781 0.9567281 sample estimates: probability of success 0.6666667
どっちにしろ有意じゃないけど…
t検定あれでいいの? • 値をペアにして差の平均を求め、0に等しいかどうかを調べる手法は「対応のあるt検定」と呼ばれます。
• 対応のあるt検定は各対応(ここでは各コース)の分散の大きさが等しくないと、多分変な結果になります。
• ゴルフのスコアみたいなものは平均値に分散が左右されそうです(平均スコア10のコースと100のコースとで分散が同じだろうか?)
えっダメなの…?
そもそも
• 「対応のあるt検定」を使える場面があるだろうか?(反語)
• 「正規分布」「等分散」を仮定できる場面があるだろうか?(反語)
…
どうすればいいんだ… • サンプルが少ない時(*)はノンパラで行こう!
• ノンパラメトリック=パラメータ(正規分布である、等分散である等々…)を仮定しない手法
• 今回の場合は符号検定がノンパラ
(*サンプルが多いと中心極限定理により平均値が正規分布することを仮定しても問題ない場合が多いです。)
マジで…