statisztika - unideb.huhuzsvai/okt/stat_2/2_eloadas.pdf · a próba valószínűségi változója...
TRANSCRIPT
1
STATISZTIKA2. Előadás
Középérték-összehasonlító tesztek
Egymintás u-próba
Tesztelhetjük, hogy a valószínűségi változónk értéke megegyezik-e egy konkrét értékkel. Megválaszthatjuk a konfidencia intervallum nagyságát is.
H0: 1 = 0
Feltétel: Skála típusú adat Normális eloszlású populáció szigma ismeret n>30?
Egymintás u-próba vagy z-próba
Próbastatisztika: standard normáleloszlás, DF = n-1
H0: Kefir zsírtartalma 3%szignifikancia szint=5%n=30átlag= 3,2%szigma=0,5%Ha: nem egyenlő
Próbafüggvény, alfa=0,052,1978
0,014
H0: Őszi búza hektolitertömege 80 kg
n=30átlag=75 kgszigma= 15 kgHa: nem egyenlő
2
Próbafüggvény, alfa=0,05-1,8248
0,034
Egymintás t-próba
Tesztelhetjük, hogy a valószínűségi változónk értéke megegyezik-e egy konkrét értékkel. Megválaszthatjuk a konfidencia intervallum nagyságát is.
H0: 1 = 1
Feltétel: Skála típusú adat Normális eloszlású populáció A szórást a mintából becsüljük
Egymintás t-próbaPróbastatisztika: t-eloszlás, DF = n-1
H0: Kefir zsírtartalma 3%szignifikancia szint=5%n=30átlag= 3,2%s=0,5%Ha: nem egyenlő
Próbafüggvény, alfa=0,05; DF=29
3
H0: Őszi búza hektolitertömege 80 kg
n=30átlag=75 kgs = 15 kgHa: nem egyenlő
Próbafüggvény, alfa=0,05; DF=29 Próbafüggvény, alfa=0,05; DF=29
Két középérték különbségének tesztelése
Feltételek:
Független minták
Normális eloszlásúak
Azonos szórás
4
Két normál eloszlású, független minta különbség várható
értékének szórása
Két középérték különbségének tesztelése
Kétmintás z-próba vagy u-próba Kétmintás t-próba egyenlő
szórásnégyezeteknél Kétmintás t-próba nem egyenlő
szórásnégyzeteknél Kétmintás párosított t-próba
Kétmintás z-próba vagy u-próba
H0: A Milli és Danone kefir fogyasztói ára megegyezik
n1=n2=120σ1=5 Ftσ2=5 Ft
z-próba statisztikájaSzármazhat-e a két független megfigyelés, minta
azonos középértékű populációból?H0: 1 = 2
Próbastatisztika: z-eloszlás, DF = n1 + n2 – 2
Nincs különbség Nincs különbség
5
Excel kétmintás z-próba
Eszközök, Adatelemzés…
Excel kétmintás z-próba
Excel kétmintás z-próba eredménye
Kétmintás t-teszt (szórás azonos)
Származhat-e a két független megfigyelés, minta azonos középértékű populációból?
H0: 1 = 2
Próbastatisztika: t-eloszlás, DF = n1 + n2 – 2
Kétmintás t-teszt (szórás azonos)
6
Kétmintás t-teszt (szórás azonos)
n1=n2 = 4X1 várható értéke = 6 000 kg/haX2 várható értéke = 7 500 kg/haa szórás mindkét esetben 780 kg/ha
a különbség várható értékének szórása:552 kg/ha
Nincs különbség
Nincs különbségValódi különbség
A várható érték 1 500kg/ha, a szórás 552kg/ha
Kétmintás F-próba a szórásnégyzetre
F=var1/var2
vagy
F=var2/var1
7
F-érték nagyobb, mint 1,00
Valószínűség 1-alfaSzabadságfokok:DF1=6DF2=6
F=143,67/89,29=1,61
Kétmintás F-próba a szórásnégyzetre F-érték kisebb, mint 1,00
Valószínűség alfaSzabadságfokok:DF1=6DF2=6
F=89,29/143,67=0,62
Kétmintás F-próba a szórásnégyzetre
8
Kétmintás t-teszt (nem azonos szórás)
Ha a két csoport szórása szignifikánsan különbözik, ilyenkor a két összehasonlítandó csoport varianciáját súlyozni kell a variancia becsléséhez (separate variancia). A próbastatisztika:
A próba valószínűségi változója ebben az esetben nem t-eloszlású, ezért nem a t-táblázatot, hanem a Bonferroni-módosított szignifikancia értékeket kell használni a középértékek különbözőségének elbírálásakor
Kétmintás t-teszt szabadságfoka(nem azonos szórás)
Excel kétmintás t-próba nem egyenlő szórásnégyzeteknél
Excel kétmintás t-próba nem egyenlő szórásnégyzeteknél
Párosított t-próbaKét összefüggő minta középértékének
összehasonlítására szolgál H0: dátlag = 0Próbastatisztika: (DF = n1 – 1)
sd a párosított minták különbségének szórása, becslése a minta alapján
FogyókúraEgy fogyókúra kísérletben 100 hölgy vett részt.
9
Excel kétmintás párosított t-próba a várható értékre
Excel kétmintás párosított t-próba a várható értékre
Párosított t-próba eredmény táblázata Helytelen módszer alkalmazása
Párosított t-próba helyett független kétmintás t-próba használata
Eredmény
Helytelen eredmény A t-próba ereje
A valódi különbség kimutatásának valószínűsége.
Mi befolyásolja? Minta elemszáma A különbség nagysága Szignifikancia-szint, alfa A t-próba típusa (egy, két, páros) Alternatív hipotézis (egy vagy kétoldali)
10
Minimális mintaelemszámközépérték-különbséghez
Példa
Alfa=0,05 zα=1,96Béta=0,2 zβ=0,84S= 2Delta=1
ÖsszefoglalásFeladatok
H0: A banán átlagos eladási ára 300 Ft/kg
szignifikancia szint=5%n=77átlag= 298,49 Ft/kgs=46,26 Ft/kgHa: nem egyenlő
Próbafüggvény, alfa=0,05; DF=76 Excel INVERZ.T függvény
INVERZ.T(alfa; szabadságfok)
alfa = elsőfajú hiba szignifikancia szintSzabadságfok = n-1
INVERZ.T(0,05; 76)=1,99
Kétoldali szimmetrikus feltétel esetén
11
Excel T.ELOSZLÁS függvény
T.ELOSZLÁS(x; szabadságfok; szél)
x = érték, ahol a t-eloszlás valószínűségét keressük szint
szabadságfok = n-1szél = 1 egyoldali, 2 kétoldali
T.ELOSZLÁS(1,99; 76; 2)=0,05
Kétoldali szimmetrikus feltétel esetén
H0: A szendvics sonka átlagos eladási ára 900 Ft/kg
n=77átlag=865,82 Ft/kgszórás=84,47 Ft/kgHa: nem egyenlő
Próbafüggvény, alfa=0,05; DF=76 Próbafüggvény, alfa=0,05; DF=76
12
Kétmintás z-próba vagy u-próba
H0: A banán átlagos fogyasztói ára megegyezik az Észak-Alföldi és Közép-Magyarországi régióban
n1=n2=11σ1=50 Ftσ2=50 Ft
Nincs különbség
Excel kétmintás z-próba
Eszközök, Adatelemzés…
Excel kétmintás z-próba Excel kétmintás z-próba eredménye
13
Kétmintás t-teszt (szórás azonos)
Származhat-e a két független megfigyelés, minta azonos középértékű populációból?
H0: 1 = 2
Próbastatisztika: t-eloszlás, DF = n1 + n2 – 2
Kétmintás t-teszt (szórás azonos)
H0: A banán átlagos eladási ára megegyezik 2005. és 2010. évben
szignifikancia szint=5%n1=n2=7átlag2005= 291 Ft/kgátlag2010= 374,43 Ft/kgs2005=11,99 Ft/kgs2010= 9,45 Ft/kg
Ha: nem egyenlő
Kétmintás t-teszt (szórás azonos)
Összevont szórás:
14
Nincs különbség
Excel kétmintás t-próba egyenlő szórásnégyzeteknél
Eszközök, Adatelemzés…
Excel kétmintás t-próba egyenlő szórásnégyzeteknél
Excel kétmintás t-próba egyenlő szórásnégyzeteknél eredmény