sample...

23
Sample Distributions 關於〝變異數〞的抽樣分配

Upload: others

Post on 29-Jul-2020

16 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Sample Distributionssi.secda.info/kevinho_stat/wp-content/uploads/2014/...投資風險的大小,一般由短期投資的可能結果而定。最 常用的衡量短期投資方法就是計算可能結果的變異數值。

Sample Distributions

關於〝變異數〞的抽樣分配

Page 2: Sample Distributionssi.secda.info/kevinho_stat/wp-content/uploads/2014/...投資風險的大小,一般由短期投資的可能結果而定。最 常用的衡量短期投資方法就是計算可能結果的變異數值。

抽樣分配

統計對象 型態 分配類型

母體分配樣本分配

離散型機率分配

均勻分配 二項分配多項分配 負二項分配超幾何分配 幾何分配伯努利分配 波松分配

連續型機率分配

連續均勻分配 常態分配標準常態分配 指數分配Gamma分配 卡方分配

抽樣分配 機率分配

樣本比例差( Ƹ𝑝 − 𝑝 )平均數~

Z分配 t分配變異數~

單母體變異數 卡方分配兩母體變異數比 F分配

Page 3: Sample Distributionssi.secda.info/kevinho_stat/wp-content/uploads/2014/...投資風險的大小,一般由短期投資的可能結果而定。最 常用的衡量短期投資方法就是計算可能結果的變異數值。

我們除了對於母體「平均數」或「比例」感到興趣外,在某些議題上,更關注的是母體「變異數」或「標準差」的資訊,因為變異數是衡量分配的集中程度。所以像是機器生產,可藉由變異數來估計機器的穩定度;在教育上,可估計學生成績的差異情形。(卡方分配)

實務上,也可能需要比較來自兩個母體變異數的差異,例如兩個不同品牌機器穩定度的比較;或是兩個國家學生對於數學成績的差異狀況;或是比較兩地區經濟水準,年所得變異越大,代表貧富越懸殊,社會問題會更嚴重。(F分配)

Page 4: Sample Distributionssi.secda.info/kevinho_stat/wp-content/uploads/2014/...投資風險的大小,一般由短期投資的可能結果而定。最 常用的衡量短期投資方法就是計算可能結果的變異數值。

𝝌𝟐 distribution

卡方分配

(chi-square distribution)

Page 5: Sample Distributionssi.secda.info/kevinho_stat/wp-content/uploads/2014/...投資風險的大小,一般由短期投資的可能結果而定。最 常用的衡量短期投資方法就是計算可能結果的變異數值。

卡方分配抽樣形成示意圖

樣本1

x

𝝌𝟐

樣本2 樣本3 樣本n

μ

σ母體分配~N(μ, σ2)

𝜒12 𝜒2

2𝜒32

𝜒n2

(𝜇1, 𝜎1) (𝜇2, 𝜎2) (𝜇3, 𝜎3)(𝜇n, 𝜎n)

Page 6: Sample Distributionssi.secda.info/kevinho_stat/wp-content/uploads/2014/...投資風險的大小,一般由短期投資的可能結果而定。最 常用的衡量短期投資方法就是計算可能結果的變異數值。

函數定義(分配形式)~原型

有 n 個獨立之常態隨機變數 x1, x2, x3, ……, xn ,其平均數

分別為 μ1, μ2, μ3, ….., μn ,標準差為 σ1, σ2, σ3, ….., σn :

𝑧 =𝑥 − 𝜇

𝜎

𝜒n2 =

i=1

n𝑥𝑖 − 𝜇𝑖𝜎𝑖

2

𝜒2 = (x − 𝜇

𝜎)2

𝜒n2 =

i=1

n𝑥𝑖 − 𝜇

𝜎

2來在同一個常態母體

χ2 變數也是隨機變數,與樣本大小有關,上述式子,

稱為具有「自由度 n 」的卡方分配。

Page 7: Sample Distributionssi.secda.info/kevinho_stat/wp-content/uploads/2014/...投資風險的大小,一般由短期投資的可能結果而定。最 常用的衡量短期投資方法就是計算可能結果的變異數值。

函數定義(分配形式)~實務

實務上,母體平均數 μ 通常未知,故以 ҧ𝑥 來取代母體平均

數,此時「自由度」會少1,所以卡方分配可改寫為:

𝜒n−12 =

i=1

n𝑥𝑖 − തx

𝜎

2

上述式子稱為具有「自由度 n-1 」的卡方分配。

又可得樣本變異數 𝑆2 =σ(𝑥𝑖 − ҧ𝑥)2

𝑛 − 1,帶入上式可得

𝜒𝑛−12 =

(𝑛 − 1)𝑠2

𝜎2

Page 8: Sample Distributionssi.secda.info/kevinho_stat/wp-content/uploads/2014/...投資風險的大小,一般由短期投資的可能結果而定。最 常用的衡量短期投資方法就是計算可能結果的變異數值。

卡方分配圖的性質

圖片來源: http://2012books.lardbucket.org/books/beginning-statistics/s15-chi-square-tests-and-f-tests.html

隨著自由度的增加,變異數會逐漸增大,且會逐漸趨近於常態分配

期望值等於「自由度」: E(χ2)= n-1

變異數等於2倍「自由度」: V(χ2)= 2( n-1)

卡方分配為右偏分配

Page 9: Sample Distributionssi.secda.info/kevinho_stat/wp-content/uploads/2014/...投資風險的大小,一般由短期投資的可能結果而定。最 常用的衡量短期投資方法就是計算可能結果的變異數值。

卡方分配的用途

進行單一常態分配母體的變異數統計推論。

可用來做適合度檢定(goodness-of-fit test)。

可用來做獨立性檢定(test of independence)。

可用來做變異數齊一性檢定(test of homogeneity)。

Page 10: Sample Distributionssi.secda.info/kevinho_stat/wp-content/uploads/2014/...投資風險的大小,一般由短期投資的可能結果而定。最 常用的衡量短期投資方法就是計算可能結果的變異數值。

卡方分配的查表

1

2

𝜒α, n−12

α機率值 自由度

①先找自由度②再找符合區域的

機率值α

𝜒0.1, 52 = 9.2364

Page 11: Sample Distributionssi.secda.info/kevinho_stat/wp-content/uploads/2014/...投資風險的大小,一般由短期投資的可能結果而定。最 常用的衡量短期投資方法就是計算可能結果的變異數值。

案例

「現代統計學」p129,吳柏林 著,五南圖書

機械公司新出產機車專用引擎,品管部門以引擎

轅軸長的變異數來判定生產過程是否有一致性。

假定每個引擎轅軸長的變異數為 0.8 ,整批產品

變異數超過 1.3 表示此批產品不佳?需要重新調

整生產過程。現在從產品中隨機挑選 10 個引擎,

試求重新調整生產過程之機率?

Page 12: Sample Distributionssi.secda.info/kevinho_stat/wp-content/uploads/2014/...投資風險的大小,一般由短期投資的可能結果而定。最 常用的衡量短期投資方法就是計算可能結果的變異數值。

案例解說

用變異數判定一致性 → 考慮卡方分配;

每個引擎轅軸長變異數 0.8 → σ2=0.8 ;

超過 1.3 表示產品不佳 → 臨界值

抽取 10 個引擎 → n=10

P( s2>1.3 ) = pn−1 s2

𝜎2>

10−1 1.3

0.8

= P( χ2>14.6) [卡方分配查表]

= 0.1

重新調整生產過程之機率為 0.1 。

𝜒𝑛−12 =

(𝑛 − 1)𝑠2

𝜎2

Page 13: Sample Distributionssi.secda.info/kevinho_stat/wp-content/uploads/2014/...投資風險的大小,一般由短期投資的可能結果而定。最 常用的衡量短期投資方法就是計算可能結果的變異數值。

F distribution

F分配

Page 14: Sample Distributionssi.secda.info/kevinho_stat/wp-content/uploads/2014/...投資風險的大小,一般由短期投資的可能結果而定。最 常用的衡量短期投資方法就是計算可能結果的變異數值。

F分配抽樣形成示意圖

x1μ1

σ1

母體分配~N(μ, σ2)

𝜒12

𝐹

x2μ2

σ2

𝜒22

𝐹 =൘𝜒12

𝑛1 − 1

൘𝜒22

𝑛2 − 1

自由度 (n1-1) 自由度 (n2-1)

Page 15: Sample Distributionssi.secda.info/kevinho_stat/wp-content/uploads/2014/...投資風險的大小,一般由短期投資的可能結果而定。最 常用的衡量短期投資方法就是計算可能結果的變異數值。

函數定義(分配形式)~原型

F分配亦稱為Fisher分配,是由兩個卡方統計量的比值所形

成的抽樣分配,可用來估計兩個母體變異數比的問題。

假設有 2 個不同的常態母體x1, x2 ,隨機抽取樣本,樣本

數個別為 n1, n2 ,則F分配為:

上述式子,稱為具有「分子自由度 n1-1、分母自由度n2-1 」

的 F 分配。

𝐹( n1−1 , n2−1 ) =൘𝜒12

𝑛1 − 1

൘𝜒22

𝑛2 − 1x1自由度 x2自由度

Page 16: Sample Distributionssi.secda.info/kevinho_stat/wp-content/uploads/2014/...投資風險的大小,一般由短期投資的可能結果而定。最 常用的衡量短期投資方法就是計算可能結果的變異數值。

函數定義(分配形式)~實務

從卡方分配可知,實務上會以樣本變異數 s2 來應用:

從式中可知,F分配可以推論兩個母體變異數的估計。

𝜒1,(𝑛1−1)2 =

(𝑛1 − 1)𝑠12

𝜎12 𝜒2,(n2−1)

2 =(𝑛2 − 1)𝑠2

2

𝜎22

⟹ 𝐹α( n1−1 , n2−1 ) =

൘s12

𝜎12

൘s22

𝜎22df1 df2

γ1 γ2

Page 17: Sample Distributionssi.secda.info/kevinho_stat/wp-content/uploads/2014/...投資風險的大小,一般由短期投資的可能結果而定。最 常用的衡量短期投資方法就是計算可能結果的變異數值。

F分配圖的性質

Page 18: Sample Distributionssi.secda.info/kevinho_stat/wp-content/uploads/2014/...投資風險的大小,一般由短期投資的可能結果而定。最 常用的衡量短期投資方法就是計算可能結果的變異數值。

F分配的性質

期望值: E(x)=𝜈1

𝜈2−1

變異數: V(x)=2𝜈2

2(𝜈1+𝜈2−2)

𝜈1(𝜈2−2)2 𝜈2−4

, 𝜈2 > 4

假設隨機變數 X 為具有自由度 γ1 (=n1-1) 與 γ2 (=n2-1) 的

F分配,則:

重要查表性質: 𝐹𝛼 𝜈1, 𝜈2 =1

𝐹1−𝛼 𝜈2, 𝜈1

F分配為右偏分配

Page 19: Sample Distributionssi.secda.info/kevinho_stat/wp-content/uploads/2014/...投資風險的大小,一般由短期投資的可能結果而定。最 常用的衡量短期投資方法就是計算可能結果的變異數值。

F分配的用途

變異數分析。

迴歸分析中的整體檢定。

檢定兩個常態母體變異數是否相等。

代替二項分配做母體比例的推論。

Page 20: Sample Distributionssi.secda.info/kevinho_stat/wp-content/uploads/2014/...投資風險的大小,一般由短期投資的可能結果而定。最 常用的衡量短期投資方法就是計算可能結果的變異數值。

F分配的查表Fα(n1-1 , n2-1)

機率值自由度 自由度

①先找2個自由度②再找符合區域的機率值α

F0.05(8 , 6)=4.15

1

3 2

Page 21: Sample Distributionssi.secda.info/kevinho_stat/wp-content/uploads/2014/...投資風險的大小,一般由短期投資的可能結果而定。最 常用的衡量短期投資方法就是計算可能結果的變異數值。

案例

「現代統計學」p130,吳柏林 著,五南圖書

投資風險的大小, 一般由短期投資的可能結果而定。最

常用的衡量短期投資方法就是計算可能結果的變異數值。

現在假設有A、B兩種投資組合,兩種投資組合的投資報

酬率均為20%。但是A投資組合十年來的獲利變異數為

8.4;B投資組合八年來的獲利變異數為3.1。如果兩種投

資組合的母體平均報酬率變異數均等,即 σ1/σ2 = 1,

試問𝑠12

𝑆22 大於2.7的機率是多少?

Page 22: Sample Distributionssi.secda.info/kevinho_stat/wp-content/uploads/2014/...投資風險的大小,一般由短期投資的可能結果而定。最 常用的衡量短期投資方法就是計算可能結果的變異數值。

案例解說

2個用變異數判定一致性 → 考慮 F 分配;

σ1/σ2 = 1 → 計算上不變

A:十年來… → n1=10 ; B:八年來… → n2=8

P( s12

s22 >2.7 ) = p

൘s12

𝜎12

൘s22

𝜎22

>2.7

= P( Fα( (10-1), (8-1) ) >2.7 ) [F分配查表]

= 0.1 ( = α )

機率為 0.1 。

Page 23: Sample Distributionssi.secda.info/kevinho_stat/wp-content/uploads/2014/...投資風險的大小,一般由短期投資的可能結果而定。最 常用的衡量短期投資方法就是計算可能結果的變異數值。

The End