למדנו לבצע בדיקת השערות לממוצע מדגם
DESCRIPTION
למדנו לבצע בדיקת השערות לממוצע מדגם. על מנת לבצע בדיקת השערות עלינו לדעת: את ממוצע האוכלוסייה "הרגילה". סטיית התקן של האוכלוסייה (הרגילה או עם הטיפול מאחר והנחנו שוויון שונויות). הבעיה היא שלרב אנו לא יודעים את הפרמטרים של האוכלוסייה. ומה כאשר סטיית התקן של האוכלוסייה לא ידועה?. - PowerPoint PPT PresentationTRANSCRIPT
n
xz
למדנו לבצע בדיקת השערות לממוצע מדגם.
על מנת לבצע בדיקת השערות עלינו לדעת:את ממוצע האוכלוסייה "הרגילה".1.סטיית התקן של האוכלוסייה )הרגילה או עם הטיפול מאחר 2.
והנחנו שוויון שונויות(
הבעיה היא שלרב אנו לא יודעים את הפרמטרים של האוכלוסייה
, Sn) )סטיות תקןאם בונים התפלגות דגימה של התוחלת של סטיות התקן תהיה שונה מסטיית התקן
(.) של האוכלוסייה ממנה נדגמו המדגמים
. הוא אומדן מוטה ל-Snמכאן ש-
.הוא אומד חסר הטיה ל- Sn-1ניתן להוכיח ש-
)(1snE
)(snE
appletמה תהיה צורתה של התפלגות הדגימה של סטיות תקן?
לא האוכלוסייה של התקן סטיית כאשר ומהידועה?
1
1
2
1
nS
n
in
xxi
2
1
)1(~2
1
2
n
nns
2
sn2
1sn2
1 sn2
1
)1( n 2
2
1)1( snn
2
2
1)1( snn
2
2
1)1( snn
dfn
dfn
222
1
22
2
התפלגויות שונותמשפחה של
tהתפלגות
n ידועים, התפלגות הדגימה של ממוצעים עבור ו-כאשר מספיק גדול תתפלג נורמלית
nNx
,~
אבל לרב הפרמטרים של האוכלוסייה אינם ידועים. לא, ניתן לאמוד אותה. ידוע אך אם
הוא2אומד חסר ההטיה ל-
אומד חסר הטיה הוא אומד שממוצע התפלגות הדגימה שלו שווה לפרמטר האוכלוסייה. במקרה הפרטי, אם נדגום
ונחשב בכל מדגם את האומדן nאינסוף מדגמים בגודל .2הממוצע של כל האומדנים יהיה שווה ל-
S n
2
)1(
S n
2
)1(
לכן: אם סטיית התקן של האוכלוסייה אינה ידועה
ניתן להשתמש באומדן שלה:
11
2
1
n
xxn
ii
nss
1
n
nnss אזי:Snאם כבר חישבנו את
כי: 1
1
2
1
2
111
n
n
ii
n
ii
n ssn
xx
n
n
n
xx
n
n
ובחזרה להתפלגות הדגימה של ממוצעים. מאחר ואנו משתמשים באומדן לסטיית התקן במקום בפרמטר, יש
גורם נוסף לטעות.
מכאן שסטיית התקן של התפלגות הדגימה תהיה גדולה יותר.
הפתרון הוא שימוש בהתפלגות אחרת, התפלגות "רחבה" יותר מההתפלגות הנורמלית. התפלגות זאת קרויה
.tהתפלגות יהיה:תצפית בודדתעכשיו הסטטיסטי שלנו עבור
sxt
n
xi
1
t אינו מתפלג נורמלית אלא מתפלג t שהיא התפלגות רחבה יותר.
היא בעצם משפחה של התפלגויות tיתרה מכך התפלגות ככל שמספר (d.f.=n-1כפונקציה של דרגות החופש )ד"ח=
( מדויק יותר )קרוב sהתצפיות גדול יותר, כך האומדן שלנו ) צרה יותר ושואפת לנורמלית.t( והתפלגות יותר ל-
?df=n-1למה William Gosset: Student’s t
Guinness's brewery
ובהתפלגות דגימה של ממוצעים:
x
x
n
x
Sn
xsx
t
1
2,0
1,0
~~
df
df
N
ttz
מתי
x
x
S
x יתפלגt?
מתפלג נורמליתxכאשר 1.
n>30 כאשר או2.
nss n
x1
1
nss n
x
מכאן, תהליך בדיקת ההשערות זהה לחלוטין לבדיקת השערות על .zממוצע כפי שלמדנו עם
aH
aH
:
:
1
0
aH
aH
:
:
1
0או
1)
.n>30 מתפלג נורמלית, או x( הנחות: 2
( חישוב הסטטיסטי3
p לערך הקריטי בטבלה, או חישוב t( השוואת הסטטיסטי 4 EXCELבאמצעות
nsx
tn
x
1
=TDIST)t,df,tails(
מבחן דו-צדדי2 מבחן חד-צדדי1
מקבל ערכים חיוביים בלבד!
NORMSDIST TDIST 1-
nsxt
דוגמא
₪ .6500ידוע שההכנסה הממוצעת של משפחה ישראלית היא )לפני איסוף הנתונים( שתושבי הצפון מרוויחים טועןכלכלן ממשרד האוצר
מעל לממוצע האוכלוסייה. מתושבי הצפון ומצא שממוצע ההכנסה שלהם עמד של40הוא דגם מקרית
. s=700 ₪ ו-0007?0.05האם טענת הכלכלן מוצדקת ברמת מובהקות של
6500:
6500:
1
0
H
H
52.4
40700
65007000
t
05.0
ולומר שהכלכלן צדק.H0לכן ניתן לדחות את
.t, התפלגות הדגימה היא n>30מכוון ש
1)
2)
3)
)לכל היותר(1.697 הוא df=39 חד-צדדי עם =0.05הערך הקריטי עבור (4
=TDIST)4.52,39,1(=2.8E-05 0001.05.,52.4)39( ppt
697.1)1,05.0,30(
684.1)1,05.0,40(
t
tטבלה
( מהי עוצמת המבחן שביצע הכלכלן אם מתברר שכלל תושבי הצפון 5 ₪?6900מרוויחים בממוצע
TINV)0.1,39(=1.68
לשים לב! הפקודה היא דו-צדדית, לכן בהשערה חד-צדדית יש להכפיל את .2ב-
=TINV),df(דו צדדי
94.668540
70068.16500
)(
n
stx cc
93.1
40
700690094.6685
t
0.03=TDIST)1.93,39,1( 97.01
6500 6900
H0 H1
1
n
nnss :, הראנו שSnאם כבר חישבנו את
לכן:
1
nx sS
n
1
11
nn
n
n
n
ssss nn
nx
כי
x
x
S
xt 1
1
nnsss nn
x
1
)1,2()1,2( xnxnstxstxp
אם סטיית התקן של האוכלוסייה אינה ידועה, אזי נוכל לבנות .tרווח בר סמך בהתבסס על התפלגות
דוגמה: 4000 נמצא שההכנסה הממוצעת היתה n=30במדגם בגודל
95%. ברמת בטחון של 0s=300עם אומדן לסטיית התקן ((=0.05?מהו ממוצע ההכנסה של כלל האוכלוסייה ,
72.54730
3000
n
ssx
72.547*045.2400072.547*045.24000
09.512091.2879
=TINV),df(
רווח בר סמך לממוצע האוכלוסייה
2.045(=TINV)0.05,29
דוגמא:שרת החינוך רוצה לדעת מהו הממוצע בחשבון של כלל 10התלמידי י"ב בישראל. לשם כך היא דגמה באופן מקרי
תלמידי י"ב. בהנחה שציוני חשבון מתפלגים נורמלית, מהו ?95%ממוצע באוכלוסייה ברמת בטחון של
.70,60,80,90,60,73,76,81,90,65להלן הנתונים:
1
)1,2()1,2( xnxnstxstxp
%9537.8263.66 p
2
2
(()
1
(()
)
)
i
i
EXCEL
stdevn
stdevpn
xx
xx
מאחר ומדובר בתהליך איטרטיבי.t מינימלי בהתפלגות nלא נעסוק ב-
הוא הבסיס למשפחת הסטטיסטיקה tמבחן הפרמטרית:
ניתוח שונות•רגרסיה•
זו הסטטיסטיקה הרווחת בשוק.דרישות:
משתנים בסולם רווח/יחס )מבוססת על ממוצעים(התפלגות דגימה נורמלית
למרות שרב המשתנים במדעי החברה לא עונים לדרישות אלו, הסטטיסטיקה הרווחת היא פרמטרית.
דגימה מקרית:כל המבחנים הסטטיסטיים מבוססים על דגימה מקרית. דגימה שבה לכל פרט באוכלוסייה יש סיכוי זהה להיכלל
במדגם.זו הנחה שכמובן לרב לא מתקיימת. אי קיומה פוגעת גם
ביכולת ההכללה של הממצאים )תוקף חיצוני(.
לכל מחקר ארבעה סוגי תוקף עיקריים: - עד כמה ההגדרה האופרציונלית של תוקף מבנה•
המשתנים תואמת את ההגדרה התיאורטית. - האם המשתנה הבלתי תלוי הוא הסיבה תוקף פנימי•
למשתנה התלוי או שמא ישנם משתנים חיצוניים המתערבים במחקר.
- עוצמת המבחן, טעות מסוג תוקף המסקנה הסטטיסטית •I.בחירת המבחן הסטטיסטי , - יכולת הכללה של הממצאים )דגימה מייצגת(תוקף חיצוני•