hypothesis testing
TRANSCRIPT
Hypothesis Testing
การตั้งสมมติฐานn ความหมายของสมมติฐาน (Hypothesis)
n ขอความหรือคำอธิบายเฉพาะที่ผูวิจัยคาดคะเนคำตอบตอคำถามในการวิจัย โดยอาศัยแนวคิด หลักการ ทฤษฎีที่เกี่ยวของ หรือประสบการณ
n ขอความหรือขอสมมติซึ่งผูวิจัยคาดไวเกี่ยวกับคุณลักษณะของตัวแปร หรือความสัมพันธของ 2 ตัวแปรขึ้นไป
n เปนขอสมมติชั่วคราวเพื่อเปนแนวทางในการคนควาหาขอเท็จจริง
n ขอสมมติฐานการวิจัยนั้น อาจจะถูกตอง หรืออาจจะผิดก็ได
n ถาไดรับการพิสูจนวาเปนความจริง หรือตรงกับขอเท็จจริง สมมติฐานนั้นก็จะกลายเปนคำอธิบายที่ถูกตอง
ประเภทของสมมติฐานn สมมติฐานการวิจัย
n ขอความที่แสดงถึงความสัมพันธของตัวแปรที่ศึกษา
nสมมติฐานทางสถิติ
n ขอความที่เขียนเพื่อใชในการทดสอบสมมติฐานการวิจัย
n เขียนในรูปสัญลักษณทางคณิตศาสตรเกี่ยวกับคาพารามิเตอรของประชากร
แหลงที่มาของสมมติฐานn จากประสบการณของผูวิจัย
n จากความรูของผูวิจัย
n จากเหตุและผล
n จากการเปรียบเทียบ
n จากความเชื่อหรือหลักปรัชญา
n จากขอคนพบของผูอื่น
n จากทฤษฎีและหลักการ
การเขียนสมมติฐานn เขียนใหอยูในรูปของความสัมพันธระหวางตัวแปร 2 ตัว
n คาดคะเนเกี่ยวกับความสัมพันธ หรือการเปรียบเทียบ เชน
n ปริมาณผูใชบริการรถไฟฟาขนสงมวลชนของสถานีผกผันกับระยะหางของสถานีจากศูนยกลางเมือง
n ปริมาณผูใชสวนสาธารณะขึ้นอยูกับปริมาณของตนไมใหญที่ใหรมเงา
n สัญลักษณแสดงคาพารามิเตอร
µ (มิว) : คาเฉลี่ย
p (โรว) : สัมประสิทธิ์สหสัมพันธ
σ (ซิกมา) : สวนเบี่ยงเบนมาตรฐานσ2 (ซิกมา สแควร) : ความแปรปรวน
สมมติฐานทางสถิติn สมมติฐานไรนัยสำคัญ
n สมมติฐานที่กำหนดวาเทากัน ไมแตกตางกัน หรือเทากับศูนย
n สมมติฐานศูนย
n สัญลักษณ H0
n สมมติฐานทางเลือก
n สมมติฐานที่ตรงขามกับสมมติฐานไรนัยสำคัญ
n สมมติฐานที่มีไวใหเลือก
n สัญลักษณ H1 , Ha
n เขียนได 2 ลักษณะ คือ
n แบบระบุทิศทาง
n แบบไมระบุทิศทาง
ตัวอยางการตั้งสมมติฐานn เรื่อง ผลตอบแทนจากการปลูกแตงโมในภาคเหนือ
n วัตถุประสงค เพื่อศึกษาเปรียบเทียบตนทุนผลผลิตและผลตอบแทนจากการปลูกแตงโมในระหวางฤดูฝนและฤดูหนาว ในภาคเหนือ
n ตัวแปรอิสระ ฤดูกาล
n ตัวแปรตาม ตนทุน ผลผลิต
n สมมติฐานการวิจัย 1แตงโมที่ปลูกในฤดูที่แตกตางกัน จะใชตนทุนสำหรับการลงทุนปลูกแตงโมที่แตกตางกันสมมติฐานทางสถิติ Z H0 : Z µ1Z= µ2Z H1Z :Z µ1Z≠ µ2เมื่อ µ1 คือ ตนทุนในการปลูกแตงโมในฤดูฝนZ µ2 คือ ตนทุนในการปลูกแตงโมในฤดูหนาว
n สมมติฐานการวิจัย 2แตงโมที่ปลูกในฤดูที่แตกตางกันจะใหผลผลิตแตงโมที่แตกตางกัน
สมมติฐานทางสถิติ Z H0 : Z µ1Z= µ2Z H1Z :Z µ1Z≠ µ2เมื่อ Z µ1 คือ ผลผลิตในการปลูกแตงโมในฤดูฝนZ µ2 คือ ผลผลิตในการปลูกแตงโมในฤดูหนาว
n
ขั้นตอนการทดสอบสมมติฐาน1. กำหนดสมมติฐานทางสถิติเพื่อทดสอบ
2. เลือกสถิติที่จะนำมาใชในการทดสอบ
3. กำหนดระดับความมีนัยสำคัญ หรือระดับความเชื่อมั่น
4. กำหนดขอบเขตวิกฤติ
5. คำนวณคาสถิติที่ใชในการทดสอบ
6. สรุปผลการทดสอบ
คาสถิติในการพิสูจนสมมติฐานn ระดับนัยสำคัญ (Level of Significance): ความนาจะเปนในการ
ปฏิเสธสมมติฐานศูนยที่เปนจริง ใชสัญลักษณ .......... โดยทั่วไปจะกำหนดที่ระดับ 0.01 ,0.05, 0.10
n ระดับความเชื่อมั่น (Level of Confidence): ความนาจะเปนในการยอมรับสมมติฐานศูนย เทากับ 1- ระดับนัยสำคัญ
n ระดับนัยสำคัญ 0.01 จะมีระดับความเชื่อมั่น 99 %
n ขอบเขตวิกฤติ (Critical Region): ขอบเขตการปฏิเสธสมมติฐานศูนย จะกำหนดตามระดับนัยสำคัญ
n คาวิกฤติ (Critical Value): คาที่แสดงขอบเขตวิกฤติ ซึ่งเปนจุดแบงระหวางขอบเขตยอมรับกับขอบเขตวิกฤติ
ความผิดพลาดในการทดสอบสมมติฐานn ในการทดสอบสมมติฐาน ตองอาศัยขอมูลที่ไดจากตัวอยาง (Sample)
มาสรุปผลการทดสอบ เพื่ออางอิงถึงประชากร (Population) ถาตัวอยางที่สุมมามีคุณสมบัติใกลเคียงกับประชากร ก็ทำใหการตัดสินใจมีโอกาสถูกตองมาก ถาตัวอยางที่สุมมามีคุณสมบัติตางไปจากประชากรมาก ก็ทำใหการตัดสินใจผิดพลาดไดมาก
n ดังนั้น ขั้นตอนตัดสินใจยอมรับหรือปฏิเสธสมมติฐาน จึงอาจเกิดความผิดพลาดไดเสมอ และบางครั้งรายแรง
n ความผิดพลาดมีอยู 2 แบบคือ
1. Type I Error
2. Type II Error
ความผิดพลาดในการทดสอบสมมติฐาน
สถานการณที่แทจริงการตัดสินใจจากการพิสูจนสมมติฐานการตัดสินใจจากการพิสูจนสมมติฐาน
สถานการณที่แทจริงยอมรับ H0 ปฏิเสธ H0
H0 เปนจริง ไมเกิดความผิดพลาดเกิดความผิดพลาดType I Error
H0 เปนเท็จเกิดความผิดพลาดType II Error
ไมเกิดความผิดพลาด
ตัวอยาง 1 (หางเดียว ดานขวา)
n บริษัทประกันภัยไดศึกษาอัตราเบี้ยประกัน ไดคาเฉลี่ยอยูที่ $1,800 แตบริษัทคิดวาคาเฉลี่ยที่แทจริงควรสูงกวานี้ จึงทำการสุมขอมูลจากการเคลมที่เกิดขึ้นมา 40 กรณี และคำนวณคาเฉลี่ยของกลุมตัวอยางไดเปน $1,950 และคา Standard Deviation $500 ถากำหนดคา ∝=0.05 ใหหาวาบริษัทควรพิจารณาอัตราเบี้ยประกันที่แตกตางจาก $1,800 หรือไม
1. กำหนดสมมติฐานทางสถิติเพื่อทดสอบ
n H0 : µ≤1800
n H1 : µ>1800
2. เลือกสถิติที่จะนำมาใชในการทดสอบ
Z =
= 1950
= 1800
σ = 500n = 40
3. กำหนดระดับความมีนัยสำคัญ หรือระดับความเชื่อมั่น ∝=0.05
4. กำหนดขอบเขตวิกฤติที่จะปฏิเสธ H0
Z > 1.65
5. คำนวณคาสถิติที่ใชในการทดสอบ
6. สรุปผลการทดสอบ คา Z (1.897) > 1.65 จึงปฏิเสธ H0 หมายถึงคาเฉลี่ยเบี้ยประกันจริงอยูที่ >1800
€
x
€
µ
€
Z =x −µσ / n
=1950 −1840500 / 40
=1.8971.65
0.05
1.897
ตัวอยาง 2 (หางเดียว ดานซาย)
n มหาวิทยาลัยมีนโยบายสนับสนุนใหคนหยุดการนำรถสวนตัวมาที่วิทยาเขต โดยแจงขอมูลวาผูคนใชเวลาโดยเฉลี่ย 30 นาทีในการวนหาที่จอดรถ แตมีคนที่ไมเชื่อจะใชเวลานานอยางที่แสดงในขอมูลดังกลาวและทำการศึกษาจากการที่ตนนำรถเขามาจอดในวิทยาเขตจำนวน 5 ครั้ง และพบวาคาเฉลี่ยในการวนหาที่จอดรถของเขาคือ
20 นาที σ= 6 นาที ตองการจะพิสูจนวาขอโตแยงนี้ถูกตองหรือไม โดยกำหนดให ∝=0.10
1. สมมติฐานทางสถิติเพื่อทดสอบ
n H0 : µ≥30
n H1 : µ<30
2. เลือกสถิติที่จะนำมาใชในการทดสอบ
Z =
= 20
= 30
σ = 6n = 5
3. กำหนดระดับความมีนัยสำคัญ หรือระดับความเชื่อมั่น ∝=0.10
4. กำหนดขอบเขตวิกฤติที่จะปฏิเสธ H0
Z < -1.28
5. คำนวณคาสถิติที่ใชในการทดสอบ
6. สรุปผลการทดสอบ คา Z (-3.727) < -1.28 จึงปฏิเสธ H0 หมายถึงขอโตแยงถูกตองที่วาคาเฉลี่ยของเวลาที่วนหาที่จอดรถไมถึง 30 นาที
€
x
€
µ
€
Z =x −µσ / n
=20 − 306 / 5
= −3.727-1.28
0.10
-3.727
ตัวอยาง 3 (สองหาง)
n จากการสำรวจใบเสร็จรับเงินจากรานคา 40 ใบ มีคาเฉลี่ย =
137.00 บาท และ σ= 30.20 บาท ตองการจะพิสูจนวาคาเฉลี่ยของการจับจายซื้อของแตละครั้งโดยเฉลี่ยแตกตางกับคาเฉลี่ยที่เคยประมาณไวที่ 150.00 บาท (∝=0.01)
1. สมมติฐานทางสถิติเพื่อทดสอบ
n H0 : µ=150
n H1 : µ≠150
€
x
2. เลือกสถิติที่จะนำมาใชในการทดสอบ
Z =
= 137
= 150
σ = 30.2n = 40
3. กำหนดระดับความมีนัยสำคัญ หรือระดับความเชื่อมั่น ∝=0.01
4. กำหนดขอบเขตวิกฤติที่จะปฏิเสธ H0
|Z| > 2.58
5. คำนวณคาสถิติที่ใชในการทดสอบ
6. สรุปผลการทดสอบ คา |Z| (|-2.722|) > 2.58 จึงปฏิเสธ H0 หมายถึงคาเฉลี่ยตอใบเสร็จไมใช 150 บาท
€
x
€
µ
-2.58
0.005
-2.722
€
Z =x −µσ / n
=137 −15030.2 / 40
= −2.7222.58
0.005