בדיקת השערות על השוואת שני סטטיסטים
DESCRIPTION
בדיקת השערות על השוואת שני סטטיסטים. השוואה בין סטטיסטים שנלקחו מאוכלוסיות שונות, למשל ממוצע הכנסה של נשים לעומת ממוצע הכנסה של גברים. השוואה בין סטטיסטים שנלקחו מאותה אוכלוסיה, למשל ממוצע ציונים של תלמידים לפני קורס ואחריו. השוואת ממוצעים מאוכלוסיות שונות. - PowerPoint PPT PresentationTRANSCRIPT
בדיקת השערות על השוואת שני סטטיסטים
השוואה בין סטטיסטים שנלקחו מאוכלוסיות •שונות, למשל ממוצע הכנסה של נשים לעומת
ממוצע הכנסה של גברים.
השוואה בין סטטיסטים שנלקחו מאותה •אוכלוסיה, למשל ממוצע ציונים של תלמידים
לפני קורס ואחריו.
השוואת ממוצעים מאוכלוסיות שונות
נניח כי יש שני מדגמים בלתי-תלויים )לא •בהכרח בגדלים שווים(:
נרצה לבדוק את השערת האפס שהממוצעים • (.0שווים )שהפרש הממוצעים הוא
),(~,...,),(~,..., 221
211 YmXn NYYNXX
השוואת ממוצעים מאוכלוסיות שונות
כאשר המדגמים גדולים ,או ששתי האוכלוסיות •מתפלגות בהתפלגות נורמלית, שני הממוצעים יתפלגו
בהתפלגות נורמלית, ואז גם הפרשם מתפלג בהתפלגות נורמלית.
mn
NYX YX22
21 ,~
השוואת ממוצעים מאוכלוסיות שונות
: השונויות של שתי האוכלוסיות, מקרה ראשון•ידועות והן מתפלגות נורמלית.
במקרה הראשון משתמשים בהתפלגות נורמלית לבדיקת השערות על הפרש
הממוצעים.
דוגמת הנורות
בבית חרושת לנורות נלקחו נורות משני פסי • 100יצור. מפס היצור הראשון נלקח מדגם של
נורות. 75נורות ומפס היצור השני מדגם של אורך החיים הממוצע של נורות מפס היצור •
שעות, ומפס היצור השני 1190הראשון היה שעות.1230
90ידוע כי, סטית התקן בפס היצור הראשון היא • שעות.120שעות ובפס היצור השני
באורך החיים 5%האם יש הבדל במובהקות של •הממוצע של נורות בשני פסי היצור?
דוגמת הנורות
השערות:•
ההשערה היא דו-צדדית ולכן, אם רמת • לכל 2.5%, נבדוק עבור 5%המובהקות היא
צד.
0:0 yxH
1 : 0x yH
דוגמת הנורות
40-הפרש הממוצעים הוא •
16.52271סטית התקן של ההפרש הוא •
•normdist)-40,0,16.52271,true( = 0.0077
דוחים את השערת 0.025>0.0077מאחר ו-•האפס שהממוצעים שווים.
היינו 1%אם היינו בודקים ברמת מובהקות של •0.005<0.0077מקבלים את השערת האפס כי
דוגמת הנורות
באופן הבא:norminvיכולנו לפתור בעזרת •
• 32.384 = -NORMINV)0.025,0,16.52271(
- דוחים את השערת 32.3839- > 40מאחר ו •האפס שהממוצעים שווים.
:1%אם רמת המובהקות הייתה •
• 42.6( = -NORMINV)0.005,0, 16.52271
- מקבלים את השערת 42.5997- < 40מאחר ו •האפס שהממוצעים שווים.
השוואת ממוצעים מאוכלוסיות שונות
: כאשר נלקחים מדגמים גדולים מקרה שני•מהתפלגויות נורמליות שהשונויות שלהן אינן
ידועות, ניתן להשתמש בשונויות שחושבו במדגמים כהערכה לשונויות של האוכלוסיות,
ושוב להשתמש בהתפלגות הנורמלית לבדיקת השערות על הפרשי הממוצעים.
החישובים זהים למקרה הקודם, אלא • במקום sשמשתמשים ב-
המדגמיםשניעבורב-
השוואת ממוצעים מאוכלוסיות שונות
: כאשר המדגמים אינם גדולים, מקרה שלישי•וידוע שהמדגמים נלקחו מהתפלגויות
-nx+ny עם tנורמליות, משתמשים בהתפלגות ( 2 דרגות חופש )סכום גדלי המדגמים פחות 2
השוואת ממוצעים מאוכלוסיות שונות
אם נניח שהשונויות, משני המדגמים, שוות, •נוכל לתאר את ההתפלגות באופן הבא:
mnNYX
11,~ 221
השוואת ממוצעים מאוכלוסיות שונות
סטיות התקן המדגמיות אומדות את סטיית •התקן. כאשר יש שני אומדים לשונות, ניתן ליצור אומד שהוא ממוצע משוקלל של שני
האומדים )השקלול הוא לפי גודל המדגם, כך שהאומד מהמדגם הגדול יותר יקבל משקל
גדול יותר(. הממוצע המשוקלל נקרא האומד (:pooled varianceהמשותף לשונות )
2
)1()1( 222
mn
smsns YXp
השוואת ממוצעים מאוכלוסיות שונות
, נסמן לבדיקת ההשערה ברמת מובהקות •את הערך המתוקנן שהתקבל במדגם:
mns
yx
mns
yxt
pp
11
)(
11
)()( 21
דוגמת הציונים
ציונים של תלמידים לתואר שני 4נתונים • , וחמישה ציונים 100,80,78,90בקורס מסוים:
באותו קורס לתלמידי תואר ראשון 95,70,60,99,96.
מניחים כי השונויות של הציונים עבור תלמידי •תואר ראשון ושני שוות, וכי התפלגות הציונים
היא התפלגות נורמלית לכל קבוצה.
רוצים לבדוק אם הממוצעים של תלמידי תואר •.95%ראשון ושני, שווים ברמת מובהקות של
דוגמת הציונים
הפתרון מופיע בגיליון.•
0:0 yxH
1 : 0x yH
excel של ttestהפונקציה
משמשת להשוואת שני ממוצעים של מדגמים ע"י • פרמטרים. 4. לפונקציה tהתפלגות
שני הפרמטרים הראשונים הם המערכים המכילים את •ערכי המדגמים, שאת הממוצעים שלהם רוצים להשוות.
.2 או 1הפרמטר השלישי הוא מספר הזנבות בהשערה, • אם המדגמים מזווגים ) הסבר 1הפרמטר הרביעי הוא •
בהמשך(. מדגמים ומניחים שונויות שוות2 אם יש 2ערכו • להניח שהשונויות אי אפשר מדגמים ו2 אם יש 3ערכו •
שוות.
spss
הנתונים של שני המדגמים שאת ממוצעיהם •רוצים להשוות, חייבים להופיע בעמודה אחת.
בעמודה נוספת יופיע קוד המציין לכל שורה, •לאיזה משני המדגמים שייכת השורה. זהו
משתנה החלוקה.
spss
ובתת ההוראה analyzeמשתמשים בתפריט •compare means בוחרים את
indepedent-samples T-test.
מעבירים את המשתנה המכיל את המדידות •ימינה. את משתנה החלוקה מעבירים ל
grouping variable ע"י לחיצה על . define groups קובעים מהם שני הערכים המציינים ,
השתייכות לשני המדגמים.
spss
בודקים אם ניתן להניח שהשונויות output ה בחלון •בשתי האוכלוסיות שמהן נלקחו המדגמים, שוות.
.Fבדיקה זו מתבצעת ע"י התפלגות והמובהקות Fמתקבלת טבלה בה מופיע ערכו של •
. אינן שוותשלו. מובהקות קטנה, אומרת שהשונויות , מסתכלים ב אינה קטנה F המופיע אחרי sigאם sig מובהקות( t המופיע אחרי )t בשורה הראשונה
(equal variances )assumed. sig, מסתכלים ב קטנה F המופיע אחרי sigאם •
equal) בשורה השניה t( המופיע אחרי t)מובהקות )variances not assumed.
השוואת ממוצעים ממדגמים מזווגים
כאשר שני מדגמים בנויים כזוגות של תצפיות •שיש ביניהם תלות הם נקראים מדגמים
מזווגים.דוגמאות: שכר של אנשים לפני שנה והשכר של •
אותם האנשים היום, משקל של אנשים לפני דיאטה ומשקלם אחרי הדיאטה, תוצאות
בדיקת דם לפני לקיחת תרופה ואחריה. אם המדידות נעשו על אותם נדגמים, יש •
ביניהן תלות ולכן נשתמש בשיטה שונה מאשר עבור מדגמים בלתי-תלויים.
השוואת ממוצעים ממדגמים מזווגים
.nמספר הערכים בשני המדגמים שווה ושווה ל-•נניח שנתוני המדגם "לפני" ונתוני המדגם "אחרי" •
מגיעים מהתפלגות נורמלית בעלת תוחלת וסטיית תקן לא ידועים.
נחשב את ממוצע המדגם "לפני" ואת ממוצע •המדגם "אחרי"
נוכל ליצור מ"מ שהוא ההפרש בין זוג של מדידות, •מדידת "לפני" פחות מדידת "אחרי".
ההפרש מתפלג נורמלית עם ממוצע וסטיית תקן • לא ידועים.
X
Y
iii YXD
השוואת ממוצעים ממדגמים מזווגים
יצרנו בעיה מסוג שאנו כבר מכירים: בדיקת • תצפיות, כאשר השונות nעם השערות ל
אינה ידועה.
נפתור את הבעיה באופן בו פתרנו בעיות •דומות
דוגמת התרופה
נבדקה השפעת תרופה להורדת לחץ-דם על • חולים. לכל חולה, לחץ הדם 10מדגם של
נמדד לפני לקיחת התרופה ולאחר חודש של שימוש. נניח כי לחץ הדם מתפלג נורמלית.
נבדוק את ההשערה שהתרופה הורידה את •. 5%תוחלת לחץ הדם ברמת מובהקות של
spss
רושמים את הנתונים בשתי עמודות spssב •שונות
בכל שורה צריכים להופיע שני הנתונים •המתייחסים לאותה נקודת מדגם.
ובתת ההוראה analyze משתמשים בתפריט •compare means בוחרים את paired-
samples T test. מעבירים ימינה את זוג המשתנים המזווגים •
שאת ממוצעיהם רוצים לבדוק.
spss + ttest
של sig מסתכלים במובהקות outputבחלון • המתקבל. tערך
ערך זה צריך להיות קטן מהמובהקות שהוגדרה •מראש, כדי לדחות את ההנחה ששני
הממוצעים שווים.
עם ttest משתמשים בפונקציה excelב •.1פרמטר רביעי
השוואת שתי שונויות
כאשר רוצים לבדוק השערה ששתי שונויות •שוות זו לזו משתמשים בהתפלגות חדשה
.Fהנקראת התפלגות
היא שם F, גם התפלגות tבדומה להתפלגות •קיבוצי לאינסוף התפלגויות, אלא שלהתפלגות
F.יש שני פרמטרים של דרגות חופש
השוואת שתי שונויות
הבדיקה היא, האם השונויות של שני מדגמים •שנלקחו משתי אוכלוסיות המתפלגות כל
אחת בהתפלגות נורמלית, הן שוות. בודקים , כלומר 1במקום זאת, האם היחס ביניהן הוא
:1השערת האפס תהיה2
2
0 y
xH
השוואת שתי שונויות
כאשר שני המדגמים נלקחו מהתפלגויות •נורמליות, היחס בין שתי השונויות מתפלג
עם שני פרמטרים – הראשון Fבהתפלגות ( 1מספר דרגות החופש )גודל המדגם פחות
, והשני- מספר דרגות במונהשל המשתנה ( של המשתנה 1החופש )גודל המדגם פחות
.במכנה
נסמן זאת •21 ,F
finvהפונקציה
•Finv)probability,degF1,degF2(
הם מספר דרגות degF2 ו- degF1הפרמטרים •החופש של המדגם שהשונות שלו במונה
ובמכנה בהתאמה.
הפונקציה תיתן את הערך, שההסתברות לקבל •ערך גדול או שווה לו, היא המשתנה הראשון.
אינה סימטרית Fפונקצית ההתפלגות •
דוגמת חוזק החומר
חוקר בודק חוזק של חומר משני פסי יצור. מפס • ושונות 13היצור הראשון נלקח מדגם בגודל
. מפס היצור השני נלקח 1.3החוזק התקבלה כ , והשונות של החוזק התגלתה כ- 9מדגם בגודל
. השאלה היא האם ניתן להניח כי 0.45השונויות בשני פסי היצור זהות?
פתרון בגיליון.•