fisher exact test
DESCRIPTION
התפלגות הדגימה בכל תא נורמאלית. Chi2. Chi2. אין יותר מ-20% מהתאים בהם השכיחות הצפויה קטנה מ-5. Fisher exact test. Chi2. Yates’ continuity correction : ביקורת. תלוי ב-2 התוצאות הקודמות. במקרה של df=1 עבור חי בריבוע לטיב התאמה. השערה חד צדדית. ולגבי התפלגות שונויות. - PowerPoint PPT PresentationTRANSCRIPT
0
0.1
0.2
0.3
0.4
0.5
0.6
10 11 12 13 14 15 16 17 18 19 20
Fisher exact test
obs133126
exp153025
.התפלגות הדגימה בכל תא נורמאלית
-5 מהתאים בהם השכיחות הצפויה קטנה מ-20%אין יותר מ.
Yates’ continuity correction.ביקורת :
expexp87.315
15
0
0.1
0.2
0.3
0.4
0.5
0.6
18 20 21 22 24 25 26 28 29 30 32
0
0.1
0.2
0.3
0.4
0.5
0.6
22 24 25 26 29 30 31 34 35 36 38
0
0.1
0.2
0.3
0.4
0.5
0.6
10 11 12 13 14 15 16 17 18 19 20
obs133126
exp153025
Z~15
)1513( Z~
30
)3031(
22
~15
)1513(Z
22
~30
)3031(Z
התוצאות 2תלוי ב-הקודמות
2Z
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0 0.1 0.5 1.1 3.5 6.6
2
1322
222
~25
)2526(
30
)3031(
15
)1513(
ZZ
עבור חי בריבוע לטיב התאמהdf=1במקרה של
2
222
1
211
*
)*(
*
)*(
pn
pnO
pn
pnO
)1(*
))1(*)((
*
)*(
1
211
1
211
pn
pnOn
pn
pnO
2
2
1
11
211
**
)*(
)1(**
)*(... z
qpn
pnO
ppn
pnO
2
2
השערה חד צדדית
2
2
1
)1(~2
1
2
n
nns
ולגבי התפלגות שונויות
11
22
1
2
n
xx
n
xxii
ns
2
1
)1(~2
1
2
n
nns
2
1
22
2
2
2
~1
1
n
ii zxxn
n
xx
מבחן האומניבוס
כאשר אנו במצעים מבחן חי בריבוע עבור יותר מדרגת חופש אחת אנו נוכל להגיע למסקנה ש:
במקרה של2 לטיב התאמה - המדגם אינו לקוחמאוכלוסייה בעלת התפלגות )פרופורציות( נתונה. לדוגמא: סטודנטים לפסיכולוגיה הם בעלי סוג התקשרות שונה מזה
של כלל האוכלוסייה.
במקרה של2 לאי תלות - המדגם לקוח מאוכלוסייה שבה משתני המחקר. לדוגמא: בקרב סטודנטים 2קיים קשר בין
לפסיכולוגיה, קיים הבדל בין סוג ההתקשרות של בנים לזה של בנות.
השאלה המתבקשת היא מהו מקור ההבדל: איזה קבוצות הן החורגות מאוכלוסייתH0??בין איזה קבוצות קיימים הבדלים בין בנים לבנות
היא שהמדגם לקוח מאוכלוסייה השונה H0משמעות דחיית .H0בלפחות תא אחד מהאוכלוסייה עליה מבוססת
בחינת מקור ההבדל
ע"מ לחקור את מקור ההבדל במבחן אומניבוס )אשר נמצא מובהק(, קיימות מספר גישות, לדוגמה:
(.a-posteriori/post-hoc comparisons( לאחר מעשה )contrastsהשוואות )
במבחנים על מנת שלא לנפח את ההסתברות לטעות מסוג ראשון, של כל השוואה ע"מ לשמור נהוג להקטין את ערך ה-שלאחר מעשה
הכללית. על רמת ה-
הכללית ומחלקים אותה : קובעים את ה-Bonferroniלדוגמה, תיקון בהתאם למספר ההשוואות.
=pc .לכל השוואה =pe .לניסוי כולו
c.מספר ההשוואות לביצוע =
cpe
pc
4 ומבצעים =0.05: אם לדוגמאהשוואות, עבור כל השוואה
=0.0125
בוחנת מהם התאים . דרך זו Haberman (1973)השיטה פותחה ע"י .2התורמים למובהקותו של
( עבור כל תא שווה ל:Riהשארית המתוקננת )
standardized residualsניתוח שאריות מתוקננות )analysis)
i
iii
obsR
exp
)exp(
|מתפלג נורמלית סטנדרטית, לכן תאים בעלי Riניתן להוכיח ש-
Ri|>Z/2 יחשבו לתאים שתרומתם למובהקותו של2אינה מקרית )הם מקור ההבדל(.
עודף/חוסר מקרים )נצפה מול צפוי( בתא מסוים יתבטא בתא/ים אחר/ים, אך ייתכן תא בודד בעל פער מובהק.
ייתכן מצב בו אף תא לא ימצא בעל פער מובהק.
דוגמא
חוקרת רצתה לדעת האם קיימת "העדפה" לנשים ללדת ביום/ימים מסוים/ים בשבוע.
אמהות ורשמה את היום בשבוע בו 200היא דגמה מקרית ?95%ילדו. מה תהיה מסקנתה ברמת בטחון של
i
iiobs
exp
)exp( 2i
iii
obsR
exp
)exp(
001.,32.222)6( p
iiffH obs exp0 : עבור כל
iאחרתH :1
.H0לכן ניתן לדחות את
ניתן לראות כי מקור ההבדל הוא בכך שביום שבת יש Riע"פ ערכי ה-(Ri|>1.96|יותר לידות מאשר בשאר ימי השבוע )זהו היום היחיד שבו
McNemarמבחן
נניח שחוקר רוצה לדעת כיצד תעמולת בחירות משפיעה על דעותיהם של הבוחרים. הוא דוגם מקרית קבוצה של אנשים, בודק את עמדותיהם, חושף אותם לתעמולה ובודק שנית את
עמדותיהם ע"ם לראות האם השתנו.
במצב כזה אסור לנו לבצע מבחן חי בריבוע לאי תלות )האם קיים הבדל בין הדעות לפני לבין הדעות שאחרי התעמולה(,
, דבר המפר הנחה של המבחן.תלויותזאת מאחר והתצפיות
קיימת גרסה של חי בריבוע למדגמים תלויים המתאימה אך . מבחן זה בוחן האם McNemar. זהו מבחן x 2 2ורק לטבלה
מספר האנשים ששינו את דעותיהם )לטובה( שונה ממספר האנשים ששינו את דעותיהם לרעה.
XY
Xab
YcdIמדידה
IIמדידה
bc
bcsMcNemar
2
2'
.1 עם ד"ח 2 כמו זו של McNemarמובהקותו של
, ובוחן האם הם מתחלקים חצי חצי.השינוייםהמבחן בעצם בודק רק את
Obscb:פיתוח
Exp(c+b/)2(c+b/)2
2
2
2
2
2
2
2
2
2222
2
bc
cb
bc
bc
bc
bcb
bc
bcc
bc
bcbc
bc
bc
cbbc
2
222
2
4
*2
2
44כמובן שניתן גם לבצע את הבדיקה באמצעות מבחן
הבינום
דוגמא
במפעל מסוים החליטו לבחון האם טיול ישפר את תחושת העובדים נשאלו לפני 150המחויבות של העובדים לעבודה.
ואחרי הטיול האם הם מרגישים או לא מחויבים לעבודתם. מה ?95%תהיה מסקנת ההנהלה ברמת בטחון של
2(1)=8, p=.005<0.025 לכן ניתן לדחות את H0 לאחר הטיול ,ישנם יותר עובדים החשים מחויבים לעבודתם.
H0אין יותר שינויים לכוון המחויבות : H1יש יותר שינויים לכוון המחויבות :
השערה חד צדדית
גם במקרה זה ניתן לבצע תיקון לרציפות.
בדיקת נורמליות
ניתן להשתמש במבחן חי בריבוע לטיב התאמה ע"מ לבחון האם מדגם לקוח מאוכלוסייה בעלת התפלגות נתונה. בפרט נוכל לבדוק האם מדגם לקוח או לא מאוכלוסייה בעלת התפלגות
נורמלית.מבחן זה משמש בין השאר לצורך בחינת הנחת הנורמליות תרם
ביצוע מבחנים פרמטרים. או Kolmogorov-Smirnovקיימים מבחנים משוכללים יותר כמו:
Anderson-Darling. טוענת שהמדגם לקוח מאוכלוסייה נורמלית, לכן 0השערת ה-
.H0מטרת החוקר היא לא לדחות את על מנת לחשב את הסטטיסטי עלינו לחלק את הנתונים
. fe ואת foלקטגוריות, זאת כדי שבכל קטגוריה נוכל לחשב את גודל הקטגוריות
(bins עלול להשפיע על תוצאות המבחן. חיסרון של המבחן הוא )שדרוש גודל מדגם מינימלי על מנת שהקירוב של חי בריבוע
יהיה תקף.
EXP
OBS
בהתבסס על ממוצע וסטיית התקן של המדגם, ניתן לחשב כמה ערכים אמורים ליפול בכל קטגוריה בהנחת נורמליות.
נבדוק עד כמה הערכים הנצפים סוטים מהערכים הצפויים.
2)1(
1
2
~exp
)exp(
k
k
i i
iiobs
שלבים:מחלקים את הנתונים לקטגוריות )רצוי שוות רוחב(.
חישוב הערכים הצפויים לכל קטגוריה:
))()((exp llhhi xFxFn
הוא xhh היא פונקצית ההתפלגות הנורמלית המצטברת, Fכאשר
הוא הגבול התחתון xllהגבול העליון האמיתי של הקטגוריה ו-
האמיתי.
או להיעזר בטבלת EXCELאת ערכי הפונקציה ניתן לחשב ב-(.zההתפלגות הנורמלית )לאחר המרת גבולות הקטגוריות לציוני
=NORMDIST(x,mean,stdevp,TRUE)
קטגוריות )לצורך הדוגמא בלבד - 6דוגמא: להלן נתוני המחקר לאחר שקובצו ל- 95% קטגוריות ומעלה(. האם ניתן לומר ברמת בטחון של 10בחיים רצוי
xl-xhשלקוחים מאוכלוסייה המתפלגת נורמלית? f21-25 626-30 1031-35 1336-40 2041-45 1846-50 10
77
27.7
16.37
n
s
x
n
NORMDIST)xll,mean,sn,TRUE( NORMDIST)xhh,mean,sn,TRUE(
xll xhh d-c20.5 25.5 0 0.054 0.05425.5 30.5 0.054 0.180 0.12630.5 35.5 0.180 0.410 0.23035.5 40.5 0.410 0.677 0.26740.5 45.5 0.677 0.874 0.19745.5 50.5 0.874 1 0.126
p)x( EXP=p)x(*n OBS ))OBS-EXP( 2̂(/EXP0.054 4.192 6 0.7790.126 9.665 10 0.0120.230 17.706 13 1.2510.267 20.583 20 0.0170.197 15.186 18 0.5210.126 9.667 10 0.011
chi= 2.591p 0.763
H0.המדגם לקוח מהתפלגות נורמלית :H1 המדגם אינו לקוח מהתפלגות :
נורמלית.
. לא ניתן לומר שהמדגם אינו לקוח H0לכן לא ניתן לדחות את מאוכלוסייה בעלת הת' נורמלית.
האם מדגם לקוח מהתפלגות נתונה?
סולם מדידה?
שמי
מספר ערכים?
: מבחן הבינום ערכים2
np>5
קירוב נורמלי של חישוב ידני של הבינוםהבינום
לטיב התאמה 2: ערכים2יותר מ-
רווח/יחס
שונות האוכלוסייה
ידועה?
tמבחן zמבחן לאכן
לא כן
סיכום ביניים
מדגמים 2האם קיים הבדל בין תלויים/מזווגים?
סולם מדידה?
למדגמים Wilcoxonמבחן תלויים
האם מתקיימת ההנחה שהתפלגות הדגימה של ממוצעי
?t( מתפלגת dההפרשים )
למדגמים תלוייםtמבחן
רווח/יחס סדר
לא
כן
מדגמים בלתי 2האם קיים הבדל בין תלויים?
סולם מדידה?
למדגמים בלתי Wilcoxonמבחן תלויים
האם מתקיימת ההנחה שהתפלגות הדגימה של ההפרש הממוצעים מתפלגת
t?
האם מתקיימת ההנחה בדבר שוויון שונויות?
למדגמים בלתי תלויים עם tמבחן הנחת שוויון שונויות
רווח/יחס סדר
לא
כן
W סכום הדירוגים של הקבוצה הקטנה
לאכן
למדגמים בלתי תלויים tמבחן ללא הנחת שוויון שונויות