統計学 講義 - u-toyama.ac.jp...1 統計学 講義 第19 回 仮説検定part-1 2016 年6 21 (...

31
1 統計学 講義 19 仮説検定 Part-1 2016 6 21 ⽇(⽕)3 担当教員 唐渡 広志(からと・こうじ) 研究室 経済学研究棟4432号室 email [email protected] website http://www3.u-toyama.ac.jp/kkarato/

Upload: others

Post on 12-Oct-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 統計学 講義 - u-toyama.ac.jp...1 統計学 講義 第19 回 仮説検定Part-1 2016 年6 21 ( )3 限 担当教員 唐渡 広志(からと・こうじ) 研究室 経済学研究棟4階432号室

1

統計学 講義第 19 回 仮説検定 Part-1

2016 年 6 ⽉ 21 ⽇(⽕)3 限担当教員 唐渡 広志(からと・こうじ)研究室 経済学研究棟4階432号室email [email protected] http://www3.u-toyama.ac.jp/kkarato/

Page 2: 統計学 講義 - u-toyama.ac.jp...1 統計学 講義 第19 回 仮説検定Part-1 2016 年6 21 ( )3 限 担当教員 唐渡 広志(からと・こうじ) 研究室 経済学研究棟4階432号室

2

講義の目的

仮説検定の基本的な考え⽅について理解します。

keywords: 仮説検定,帰無仮説,対⽴仮説,有意⽔準,検定統計量,棄却域

参考書⽩砂 pp. 161 – 174

⿃居 pp. 191 – 212

⼤屋 pp. 194 – 211

Page 3: 統計学 講義 - u-toyama.ac.jp...1 統計学 講義 第19 回 仮説検定Part-1 2016 年6 21 ( )3 限 担当教員 唐渡 広志(からと・こうじ) 研究室 経済学研究棟4階432号室

仮説検定とは

(帰無)仮説を正しいと考えた上で,標本を利⽤して計算できる統計量の有意性を判断すること。1. 帰無仮説と対⽴仮説を設定する。2. 棄却域を設定する。3. 検定のための統計量を計算する。4. 検定統計量が棄却域に⼊るか否かを判定する。

3

Page 4: 統計学 講義 - u-toyama.ac.jp...1 統計学 講義 第19 回 仮説検定Part-1 2016 年6 21 ( )3 限 担当教員 唐渡 広志(からと・こうじ) 研究室 経済学研究棟4階432号室

【復習】区間推定の基本

4

⺟平均(または⺟⽐率,⺟分散)の95%信頼区間

下側信頼限界 上側信頼限界

有意でない値(普通の値,めずらしくない値)

有意な値(めずらしい値)

有意な値(めずらしい値)

区間推定の⽬的:下側信頼限界と上側信頼限界を求めることが⽬的

【有意な値]:もしも,⺟平均や⺟⽐率などの真の値が 95% 信頼区間に本当に存在したとすると,下側信頼限界より⼩さな値や,上側信頼限界よりも⼤きな値は,(可能性はゼロではないものの)⾮常にめずらしい値であるといえる。「めずらしい値」のことを統計学では「有意」な値とよぶ。

Page 5: 統計学 講義 - u-toyama.ac.jp...1 統計学 講義 第19 回 仮説検定Part-1 2016 年6 21 ( )3 限 担当教員 唐渡 広志(からと・こうじ) 研究室 経済学研究棟4階432号室

5

仮説検定の考え方 (1) ある⼯場の製品A の不良品率 pは(過去のデータから) 1% 程度であると⾔われている.いま,200 個の製品をランダムに選んで検査したところ,12 個の不良品が⾒つかった。

不良品の標本⽐率は 12/200 = 0.06 (6%)である.今まで,不良品率は1%と⾔われていたが,今回の調査ではそれよりも多くの不良品が出ている。

標本⽐率 6% という数字は,今回たまたま⼤きな値が出ただけであって,やはり真の不良品率 pは 1% 程度であり,6% という値も偶然そうなっただけで,⼗分に起こりうる値だと考えるべきか?

それとも,製品A の真の不良品率 p が1%であると⾔われていたのは誤りで,実際には,この⼯場ではもっと多くの不良品が出ていると考えるべきか?

Page 6: 統計学 講義 - u-toyama.ac.jp...1 統計学 講義 第19 回 仮説検定Part-1 2016 年6 21 ( )3 限 担当教員 唐渡 広志(からと・こうじ) 研究室 経済学研究棟4階432号室

6

仮説検定の考え方 (2)

027.0200

06.0106.096.106.0

2.7% 9.3%

標本⽐率 6% に基づいた真の不良品率 pの95%信頼区間

1%

•信頼係数95%のもとでは,真の不良品率が 1% 程度だとは考えにくい。•もちろん,真の不良品率が 1 % である可能性はゼロではないが,それはたいへんめずらしいことだと⾔える。

093.0200

06.0106.096.106.0

標本⽐率を利⽤して,⺟⽐率 pを信頼係数95%で区間推定する

従来考えられていた不良品率 p(信頼区間の外に出てしまった!)

「めずらしいことが起こった」と考えるよりも,そもそも「真の不良品率が1%である」と仮定すること⾃体が誤りである,と考えたほうが⾃然である。

したがって,区間推定の考え⽅からこの⼯場の「不良品率は1%よりも多い」のでは?と判断できる。

有意な値有意な値 有意でない値

06.0,200 Xn

Page 7: 統計学 講義 - u-toyama.ac.jp...1 統計学 講義 第19 回 仮説検定Part-1 2016 年6 21 ( )3 限 担当教員 唐渡 広志(からと・こうじ) 研究室 経済学研究棟4階432号室

7

仮説検定の考え方 (3)例.400 個の製品をランダムに選んで検査して,10 個の不良品が⾒つかった場合

025.040010

400

X

n

0.0403400

025.01025.096.1025.0:

0097.0400

025.01025.096.1025.0:

上側信頼限界

下側信頼限界

0.97% 4.03%

真の不良品率 pの95%信頼区間

1%

信頼係数95%のもとで,1%の不良品率は「めずらしくない(⼗分に起こりうる)値」

「真の不良品率が1%である」と仮定すること⾃体が誤りである,とは⾔えない。

この場合は,「不良品率は1%よりも多い」と判断できない。

(0.97%)

(4.03%)

信頼区間の中に⼊っている“1%”はめずらしくない値

(有意でない値)

有意な値有意な値 有意でない値

Page 8: 統計学 講義 - u-toyama.ac.jp...1 統計学 講義 第19 回 仮説検定Part-1 2016 年6 21 ( )3 限 担当教員 唐渡 広志(からと・こうじ) 研究室 経済学研究棟4階432号室

8

仮説検定の考え方 (4)1. 帰無仮説をたてる:「真の不良品率は 1% である」

2. 対⽴仮説をたてる:「真の不良品率は 1% ではない(例えば,1%よりも⼤きい)」 実は主張したい事柄は対⽴仮説の内容である(1%よりも⼤きいので

は?という疑いを持って分析している)。帰無仮説は「無に帰したい仮説」。

3. 判定 帰無仮説で主張される値が信頼区間に⼊らないのなら,それはめっ

たに起こらないことが起こったと考える,というよりも,「そもそも帰無仮説が誤っていた」のだと考える.したがって帰無仮説が誤りであると主張する。【帰無仮説を棄却すると表現する】

帰無仮説で主張される値が信頼区間に⼊るなら,それは⼗分に起こりうることが起こったと考える。この場合,帰無仮説が誤りであるとは主張できない。【帰無仮説を棄却しない(受容する)と表現】

のケース06.0,200 Xn

のケース025.0,400 Xn

Page 9: 統計学 講義 - u-toyama.ac.jp...1 統計学 講義 第19 回 仮説検定Part-1 2016 年6 21 ( )3 限 担当教員 唐渡 広志(からと・こうじ) 研究室 経済学研究棟4階432号室

仮説検定の考え方 (5)

帰無仮説 H0: p = 0.01 (真の不良品率は1%である) 対⽴仮説 H1: p ≠ 0.01(真の不良品率は1%ではない)

9

判定

仮説を棄却 仮説を受容

帰無仮説の値が信頼区間の「外側」にある

帰無仮説の値が信頼区間の「内側」にある

有意なケース(p = 0.01は,めずらしい)

有意でないケース(p = 0.01は,めずらしくない)

[ p > 0.01 あるいは p < 0.01 ]

記号での示し方仮説 :Hypothesis

帰無仮説 H0 を棄却することによって「真の不良品率は1%ではない」こと主張する。

Page 10: 統計学 講義 - u-toyama.ac.jp...1 統計学 講義 第19 回 仮説検定Part-1 2016 年6 21 ( )3 限 担当教員 唐渡 広志(からと・こうじ) 研究室 経済学研究棟4階432号室

10

例.生産性向上の検証 (1) 昨年の B ⼯場の労働者の技能(労働者⼀⼈が 1 時間あたりに製品を⽣産する個数)は,平均が100個であった(これを⺟平均 μ と考える)。

いま,ランダムに選んだ36⼈の労働者を再訓練した上で作業結果を計測したところ,36⼈の⽣産個数の平均は 110 個になった。

再訓練によって⽣産性は向上したといえるだろうか?1時間あたりに⽣産する個数が正規分布にしたがうと考えて判断しなさい(⽣産個数の分散は 2 = 900 と仮定する)。

⺟分散が既知のときの⺟平均の区間推定

している)(労働者の技能は向上対⽴仮説していない)(労働者の技能は変化帰無仮説

100:100:

1

0

H

H

検定の⽬的は「対⽴仮説」が主張できるかどうか!

Page 11: 統計学 講義 - u-toyama.ac.jp...1 統計学 講義 第19 回 仮説検定Part-1 2016 年6 21 ( )3 限 担当教員 唐渡 広志(からと・こうじ) 研究室 経済学研究棟4階432号室

11

例.生産性向上の検証 (2)

8.1196

3096.111096.1:

2.1006

3096.111096.1:

110:

36:900:

1B2

nX

nX

X

n

上側信頼限界

下側信頼限界

再訓練後の⽣産個数標本平均サンプルサイズ⺟分散

時間あたり⽣産個数⼯場労働者の観察の対象:

8.1192.100:%95 信頼区間真の生産個数の

95%信頼区間

ということはは信頼区間の外にある帰無仮説

100:0H

Page 12: 統計学 講義 - u-toyama.ac.jp...1 統計学 講義 第19 回 仮説検定Part-1 2016 年6 21 ( )3 限 担当教員 唐渡 広志(からと・こうじ) 研究室 経済学研究棟4階432号室

12

例.生産性向上の検証(3)

100.2 119.8100

⺟平均(訓練前の平均)は信頼区間の外側にある

95%信頼区間

在するこの範囲のどこかに存

の確率で)は真の生産個数(母平均

から推定すると,再訓練後のデータ

%95

X

H0: 再訓練前の平均 = 100 を,真の⽣産個数と考えるのは難しい。 なぜなら,区間推定の結果はそのようなことがあまり起こりえないことを⽰している。

「起こりえないことが⽣じた」と考えるよりも, = 100と想定したこと⾃体が誤り。

結論:真の⽣産個数は100より⼤きいといえるので,帰無仮説 H0 を棄却する。

すなわち,再訓練は労働者の技能を⾼めた(対⽴仮説H1の内容)と⾔える。

仮説を棄却する範囲

仮説を棄却する範囲

仮説を受容する範囲

Page 13: 統計学 講義 - u-toyama.ac.jp...1 統計学 講義 第19 回 仮説検定Part-1 2016 年6 21 ( )3 限 担当教員 唐渡 広志(からと・こうじ) 研究室 経済学研究棟4階432号室

13

「検定」における考え方のプロセス

⺟集団観察の対象:再訓練後の⽣産個数

⺟平均:μ=?⺟分散:2=900

標本サイズ:n = 36標本平均:110

標本抽出

8.1192.100%95

信頼区間の母平均

推定 再訓練前の平均 = 100を真の値(⺟平均)とみなすのは誤り(信頼区間の外にある)。

ないは妥当な仮定とはいえ

っていると考える方が理にかな信頼区間を見れば,

100100

仮説の値が妥当なものかどうかを判断するのが仮説検定

Page 14: 統計学 講義 - u-toyama.ac.jp...1 統計学 講義 第19 回 仮説検定Part-1 2016 年6 21 ( )3 限 担当教員 唐渡 広志(からと・こうじ) 研究室 経済学研究棟4階432号室

14

例題 1「家計調査」(総務省)によると,富⼭市の⼀世帯あたり消費⽀出(/⽉)は 36.9 万円であった(サンプル・サイズ n = 95)。全国平均は 29.5 万円である。富⼭市の消費⽀出⾦額はこれよりも⾼いといえるかだろうか?それとも,たまたま⼤きな値が⽣じただけで単なる誤差と考えていいだろうか?消費⽀出⾦額の地域別分布が正規分布にしたがうと考えて,次の問いに答えなさい(全国の標準偏差を = 14万円とする)。

95% 信頼区間を計算し,全国平均の 29.5 万円がこの信頼区間に⼊るかどうか確かめる。

い)全国的な水準よりも高(富山市の消費支出は対立仮説

ある)全国的な水準と同じで(富山市の消費支出は帰無仮説

5.29:5.29:

1

0

HH

Page 15: 統計学 講義 - u-toyama.ac.jp...1 統計学 講義 第19 回 仮説検定Part-1 2016 年6 21 ( )3 限 担当教員 唐渡 広志(からと・こうじ) 研究室 経済学研究棟4階432号室

15

例題 1 の答え

入らない

上側信頼限界

下側信頼限界

.2

7.3995

1496.19.36:

1.3495

1496.19.36:.1

14,95,9.36

nX

1.34

⺟平均(富⼭市の消費⽀出)の95%信頼区間

29.5万円 7.39

標本調査でたまたま⼤きな値が出たのではなく,そもそも富⼭市の⺟平均を全国平均と同じ⽔準と考えること⾃体が誤り。→ 富⼭市の消費⽀出は全国平均⽔準よりも有意に⾼い。

仮説を棄却する範囲

仮説を棄却する範囲

7.391.34

全国平均5.29

Page 16: 統計学 講義 - u-toyama.ac.jp...1 統計学 講義 第19 回 仮説検定Part-1 2016 年6 21 ( )3 限 担当教員 唐渡 広志(からと・こうじ) 研究室 経済学研究棟4階432号室

練習問題 (1)

16

「家計調査」(総務省)によると,甲府市の⼀世帯あたりの納⾖の消費⽀出(/年)は 3,700 円であった(サンプル・サイズ n = 90)。全国平均は 3,500 円である。甲府市の納⾖の消費⽀出⾦額はこれよりも⾼いといえるかだろうか? それとも,たまたま⼤きな値が⽣じただけで単なる誤差と考えていいだろうか?消費⽀出⾦額の地域別分布が正規分布にしたがうと考えて,次の問いに答えなさい(全国の標準偏差を = 2,500円とする)。

問1 95% 信頼区間を計算しなさい。問2 全国平均の 3,500 円はこの信頼区間に⼊るか。

Page 17: 統計学 講義 - u-toyama.ac.jp...1 統計学 講義 第19 回 仮説検定Part-1 2016 年6 21 ( )3 限 担当教員 唐渡 広志(からと・こうじ) 研究室 経済学研究棟4階432号室

17

フォーマルな仮説検定の手順

1. 情報の整理2. 仮説の設定3. 有意⽔準と棄却域の設定4. 検定統計量の計算5. 判定6. 結論

Page 18: 統計学 講義 - u-toyama.ac.jp...1 統計学 講義 第19 回 仮説検定Part-1 2016 年6 21 ( )3 限 担当教員 唐渡 広志(からと・こうじ) 研究室 経済学研究棟4階432号室

18

仮説の設定(例.生産性向上の検証) 帰無仮説 H0: 母平均は = 100 である。

→ 再訓練前の平均が 100 だったので

対立仮説 H1: 母平均は ≠ 100である( > 100 である)。

→ 再訓練によって労働者の技能は向上していると考えられるので.

主張したいことは H1の内容

)(あるいは

記号による表し方

100100:100:

1

0

HH 【重要】H0 と H1 をセットで⽤意する→ 最

後にどちらか⼀⽅が残る

帰無仮説を「棄却」することによって,は 100 ではないこと(たとえば再訓練後に労働者の技能が向上したこと ( > 100)を主張する。

中心極限定理

したがう標本平均は正規分布にの標本から計算できるこのとき

36900,~

36

NX

n

Page 19: 統計学 講義 - u-toyama.ac.jp...1 統計学 講義 第19 回 仮説検定Part-1 2016 年6 21 ( )3 限 担当教員 唐渡 広志(からと・こうじ) 研究室 経済学研究棟4階432号室

100

N 100900

36

113

N 113900

36

X 110

H 0 H 1

標本平均の分布:H0 : を仮に正しいと考えた場合の正規分布 (1)

19

帰無仮説を「仮に」正しいと考えたときの標本平均の分布

対⽴仮説を「仮に」正しいと考えたときの標本平均の分布

となる任意の水準

正規分布の平均は 100

の分布つの異なる X2

データから計算された標本平均

うるの分布なら十分にありを棄却誤りを仮定すること自体がというより

い値。ではめったに起こらなを真とする正規分布は

10

0

100100110

HHHX

Page 20: 統計学 講義 - u-toyama.ac.jp...1 統計学 講義 第19 回 仮説検定Part-1 2016 年6 21 ( )3 限 担当教員 唐渡 広志(からと・こうじ) 研究室 経済学研究棟4階432号室

20

100

N 100900

36

113

N 113900

36

X 104

H 0 H 1

帰無仮説を「仮に」正しいと考えたときの標本平均の分布

対⽴仮説を「仮に」正しいと考えたときの標本平均の分布

となる任意の水準

正規分布の平均は 100

の分布つの異なる X2

データから計算された標本平均

だったらもしも 104X

ない)が誤りであるとは言えを受容(

普通の)値。は十分に起こりうる(を真とする正規分布では

00

0104HH

HX

Page 21: 統計学 講義 - u-toyama.ac.jp...1 統計学 講義 第19 回 仮説検定Part-1 2016 年6 21 ( )3 限 担当教員 唐渡 広志(からと・こうじ) 研究室 経済学研究棟4階432号室

21

検定統計量と棄却域 (1)

95.096.196.1Pr

%95

n

Xn

X

信頼区間

025.010096.1Pr025.096.1100Pr

100

nX

nX または

できる。は次の式で示すことがきい値)である可能性上側信頼限界よりも大

さい値,下側信頼限界よりも小それが信頼区間の外(を仮定したときに

95%信頼区間

nX 96.1

nX 96.1

2.5% 2.5%

⽚側有意確率 = (1 − 信頼係数) / 2 がめずらしい値かどうかの基準になっている。 有意⽔準 = 区間推定で利⽤する⽚側有意確率×2

10096.1Pr

nX

帰無仮説を棄却する範囲

帰無仮説を棄却する範囲

n

X 96.1100Pr

Page 22: 統計学 講義 - u-toyama.ac.jp...1 統計学 講義 第19 回 仮説検定Part-1 2016 年6 21 ( )3 限 担当教員 唐渡 広志(からと・こうじ) 研究室 経済学研究棟4階432号室

検定統計量と棄却域 (2)

22

について解く

可能性が信頼区間の外にある

Xn

X

nX

025.096.1100Pr

025.096.1100Pr

100

の値は?を満たす AAX 025.0Pr

025.096.1100Pr

nX

を標準化するX

1.96

N(0,1)

80 90 100 110 120

0.02

0.04

0.06

n

96.1100

0.025

36900,100~ NX

1,0~36900

100 NX

標準化して考える

96.1n

X

100

0.025

X

等しいよりも⼤きい」確率はが「」確率とが信頼区間の外にある「

nX

96.1100

100

」確率とも等しい.よりも⼤きいが「 96.1100n

X

さらに

正規分布の分布考えたときのを「あえて」正しいと

X

H 100:0

Page 23: 統計学 講義 - u-toyama.ac.jp...1 統計学 講義 第19 回 仮説検定Part-1 2016 年6 21 ( )3 限 担当教員 唐渡 広志(からと・こうじ) 研究室 経済学研究棟4階432号室

-4 -2 0 2 4

N(0,1)

2.5% 2.5%

23

を「棄却域」とよぶ

およびn

Xn

X

10096.110096.1

検定統計量と棄却域 (3)

ぶを「検定統計量」とよn

X100

仮定するときを(あえて)正しいと100:0 H

臨界値である。

のもとでの片側有意水準両側は %5.2%596.1

棄却域1.96

96.1

棄却域

96.1

Page 24: 統計学 講義 - u-toyama.ac.jp...1 統計学 講義 第19 回 仮説検定Part-1 2016 年6 21 ( )3 限 担当教員 唐渡 広志(からと・こうじ) 研究室 経済学研究棟4階432号室

24

例題 2.「生産性向上の検証」のケース 昨年のA⼯場の労働者の技能(1時間あたり⽣産個数)は,平均が100個であった(これを⺟平均μと考える)。

いまランダムに選んだ36⼈の労働者を再訓練した上で作業結果を計測したところ,36⼈の⽣産個数の平均は110個になった。

再訓練によって⽣産性は向上したといえるだろうか?(⽣産個数の分散は 2=900 と仮定する,両側有意⽔準を 5% とする。)

100:100:

:1

0

HH

仮説の設定

2630100110100

nX

検定統計量:

した)と主張できる。である(生産性が向上たとえば

であると主張できる。有意に

を棄却する。に入るのでよりも大きく,棄却域は臨界値判定:検定統計量

100100

96.12 0

H

nX

nX

10096.110096.1: または棄却域

96.1%5.2%5 )の臨界値(片側両側

Page 25: 統計学 講義 - u-toyama.ac.jp...1 統計学 講義 第19 回 仮説検定Part-1 2016 年6 21 ( )3 限 担当教員 唐渡 広志(からと・こうじ) 研究室 経済学研究棟4階432号室

25

判定【H0を棄却する】検定統計量が「棄却域」に⼊れば,「帰無仮説を正しいと仮定」したことは誤りと考える。

「帰無仮説 H0 を棄却する」と表現する

判定:棄却されたので,代わりに,対⽴仮説 H1 を「採択」する

【H0を棄却しない】検定統計量が「棄却域」に⼊らなければ,「帰無仮説を正しいと仮定」したことは誤りとは⾔えないと考える。

「帰無仮説 H0 を棄却しない」と表現する

判定:棄却されないので,そのまま帰無仮説 H0 を「採択」する

1.96

N(0,1)

1.96

N(0,1)

棄却域

検定統計量

検定統計量

棄却域

【重要】判定の基準: 検定統計量が棄却域に⼊るかどうか(検定統計量の絶対値が両側有意⽔準 5% [⽚側2.5%]の臨界値 = 1.96 よりも⼤きいかどうか).

Page 26: 統計学 講義 - u-toyama.ac.jp...1 統計学 講義 第19 回 仮説検定Part-1 2016 年6 21 ( )3 限 担当教員 唐渡 広志(からと・こうじ) 研究室 経済学研究棟4階432号室

26

有意水準

有意⽔準 めったに起こらないことを⽰す確率(5%, 2.5%,1%,0.5% などを設定) 帰無仮説を棄却するか否か(珍しい値かどうか)の判定の基準 分析者が設定する

標準正規分布において両側有意⽔準に対応する臨界値

%99576.2%5.0%1

%90645.1%5%10%9596.1%5.2%5

信頼係数)の臨界値片側(両側

信頼係数)の臨界値片側(両側

信頼係数)の臨界値片側(両側

有意⽔準を⼩さくすると,帰無仮説を棄却しづらくなる(棄却域が狭くなるので,より厳密な検定になる)

Page 27: 統計学 講義 - u-toyama.ac.jp...1 統計学 講義 第19 回 仮説検定Part-1 2016 年6 21 ( )3 限 担当教員 唐渡 広志(からと・こうじ) 研究室 経済学研究棟4階432号室

27

検定手順のまとめ(生産性向上の検証の例)

96.1%5.2,110,36,9002 臨界値は有意水準【情報の整理】 Xn

を採択する。を棄却し,入るので,検定統計量は棄却域に

より大きいは検定統計量【判定】

【検定統計量】

または【棄却域】

【仮説の設定】

検定統計量

臨界値

検定統計量

臨界値

10

1

0

96.12

23630100110

10096.110096.1

100:100:

HH

nX

nX

nX

HH

と考えて計算を「仮に」正しいもの100:0 H

【結論】真の⽣産個数は有意に 100 ではない(例えば,100より⼤きい)。(再訓練は労働者の技能を⾼めた可能性がある)

結論は対⽴仮説 H1 の内容について⾔及する

臨界値とこれから計算する検定統計量を利⽤してH0を棄却する領域を記述する

Page 28: 統計学 講義 - u-toyama.ac.jp...1 統計学 講義 第19 回 仮説検定Part-1 2016 年6 21 ( )3 限 担当教員 唐渡 広志(からと・こうじ) 研究室 経済学研究棟4階432号室

例題 3

28

「家計調査」(総務省)によると,⾼知市の⼀世帯あたりの⽜乳の消費量は 65 リットルである(サンプル・サイズ n = 86)。全国平均は 87リットルである。⾼知市の⽜乳の消費量は全国平均と異なっているといえるだろうか?消費量の分布が正規分布にしたがうと考えて,両側有意⽔準 5% で仮説検定しなさい(⺟標準偏差を = 60 リットルとする)。

96.1%5,65,86,6022 臨界値は両側有意水準【情報の整理】 Xn

を採択する。を棄却し,入るので,検定統計量は棄却域に

より小さいは検定統計量【判定】

【検定統計量】

または【棄却域】

【仮説の設定】

検定統計量

臨界値

検定統計量

臨界値

10

1

0

96.140.3

40.386608765

8796.18796.1

87:87:

HH

nX

nX

nX

HH

【結論】高知市の牛乳消費量は全国平均と有意に異なる(全国平均よりも有意に小さい)といえる。

Page 29: 統計学 講義 - u-toyama.ac.jp...1 統計学 講義 第19 回 仮説検定Part-1 2016 年6 21 ( )3 限 担当教員 唐渡 広志(からと・こうじ) 研究室 経済学研究棟4階432号室

例題 4

29

あるサイコロを100回投げて6の⽬が出た回数を数えたところ 11 回出た。正確なサイコロであれば 1/6 の確率 (およそ0.1667) で6の⽬が出るので,11回は少ないような気がする。このサイコロは6の⽬が出にくいと⾔えるだろうか。両側有意⽔準 5% で仮説検定しなさい。

96.1100,11.010011,

61

,臨界値は標本比率母比率【情報の整理】 nXp

npppNX 1,~

標本比率の分布

を採択しない。を棄却しない。入らないので検定統計量は棄却域に

よりも小さいより大きく,は検定統計量【判定】

【検定統計量】

または【棄却域】

【仮説の設定】

検定統計量

臨界値

検定統計量

臨界値

10

65

61

61

65

61

61

65

61

61

1

0

96.196.152.1

52.10373.0

1667.011.0

96.196.1

61:61:

HH

n

X

n

X

n

X

pHpH

【結論】6の目が有意に出にくいとは言えない。

Page 30: 統計学 講義 - u-toyama.ac.jp...1 統計学 講義 第19 回 仮説検定Part-1 2016 年6 21 ( )3 限 担当教員 唐渡 広志(からと・こうじ) 研究室 経済学研究棟4階432号室

練習問題 (2)

30

【情報の整理】

【結論】

【判定】

【検定統計量】

【棄却域】

【仮説の設定】

「家計調査」(総務省)によると,⾦沢市の⼀世帯あたりの豚⾁の年間消費量は 16.6 kgである(サンプル・サイズ n = 96)。全国平均は 17.1 kgである。⾦沢市の豚⾁の消費量は全国平均と異なっているといえるかだろうか?消費量の分布が正規分布にしたがうと考えて,両側有意⽔準 5% で仮説検定しなさい(⺟標準偏差を = 7.0 kg とする)。

Page 31: 統計学 講義 - u-toyama.ac.jp...1 統計学 講義 第19 回 仮説検定Part-1 2016 年6 21 ( )3 限 担当教員 唐渡 広志(からと・こうじ) 研究室 経済学研究棟4階432号室

練習問題 (3)

31

就職活動を終えたある地域の⼤学4年⽣(576⼈)を対象に⾯接を受けた会社の数を調査したところ,平均は 11.5 社であった。全国的な調査によると平均は 10.7 社であるという。この地域の⼤学4年⽣が⾯接を受けた会社の数は全国的な値と異なっているといえるだろうか。両側有意⽔準 1 % で仮説検定しなさい(⺟集団を正規分布,標準偏差を = 4.0 社とする)。

【情報の整理】

【結論】

【判定】

【検定統計量】

【棄却域】

【仮説の設定】

576.2%1,5.11,576,422 臨界値は両側有意水準 Xn