statisztika - unideb.huhuzsvai/okt/stat_2/2_eloadas.pdf · a próba valószínűségi változója...

14
1 STATISZTIKA 2. Előadás Középérték-összehasonlító tesztek Egymintás u-próba Tesztelhetjük, hogy a valószínűségi változónk értéke megegyezik-e egy konkrét értékkel. Megválaszthatjuk a konfidencia intervallum nagyságát is. H 0 : 1 = 0 Feltétel: Skála típusú adat Normális eloszlású populáció szigma ismeret n>30? Egymintás u-próba vagy z-próba Próbastatisztika: standard normáleloszlás, DF = n-1 H 0 : Kefir zsírtartalma 3% szignifikancia szint=5% n=30 átlag= 3,2% szigma=0,5% H a : nem egyenlő Próbafüggvény, alfa=0,05 2,1978 0,014 H 0 : Őszi búza hektolitertömege 80 kg n=30 átlag=75 kg szigma= 15 kg H a : nem egyenlő

Upload: others

Post on 23-Jun-2020

6 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: STATISZTIKA - unideb.huhuzsvai/okt/stat_2/2_eloadas.pdf · A próba valószínűségi változója ebben az esetben nem t-eloszlású, ezért nem a t-táblázatot, hanem a Bonferroni-módosított

1

STATISZTIKA2. Előadás

Középérték-összehasonlító tesztek

Egymintás u-próba

Tesztelhetjük, hogy a valószínűségi változónk értéke megegyezik-e egy konkrét értékkel. Megválaszthatjuk a konfidencia intervallum nagyságát is.

H0: 1 = 0

Feltétel: Skála típusú adat Normális eloszlású populáció szigma ismeret n>30?

Egymintás u-próba vagy z-próba

Próbastatisztika: standard normáleloszlás, DF = n-1

H0: Kefir zsírtartalma 3%szignifikancia szint=5%n=30átlag= 3,2%szigma=0,5%Ha: nem egyenlő

Próbafüggvény, alfa=0,052,1978

0,014

H0: Őszi búza hektolitertömege 80 kg

n=30átlag=75 kgszigma= 15 kgHa: nem egyenlő

Page 2: STATISZTIKA - unideb.huhuzsvai/okt/stat_2/2_eloadas.pdf · A próba valószínűségi változója ebben az esetben nem t-eloszlású, ezért nem a t-táblázatot, hanem a Bonferroni-módosított

2

Próbafüggvény, alfa=0,05-1,8248

0,034

Egymintás t-próba

Tesztelhetjük, hogy a valószínűségi változónk értéke megegyezik-e egy konkrét értékkel. Megválaszthatjuk a konfidencia intervallum nagyságát is.

H0: 1 = 1

Feltétel: Skála típusú adat Normális eloszlású populáció A szórást a mintából becsüljük

Egymintás t-próbaPróbastatisztika: t-eloszlás, DF = n-1

H0: Kefir zsírtartalma 3%szignifikancia szint=5%n=30átlag= 3,2%s=0,5%Ha: nem egyenlő

Próbafüggvény, alfa=0,05; DF=29

Page 3: STATISZTIKA - unideb.huhuzsvai/okt/stat_2/2_eloadas.pdf · A próba valószínűségi változója ebben az esetben nem t-eloszlású, ezért nem a t-táblázatot, hanem a Bonferroni-módosított

3

H0: Őszi búza hektolitertömege 80 kg

n=30átlag=75 kgs = 15 kgHa: nem egyenlő

Próbafüggvény, alfa=0,05; DF=29 Próbafüggvény, alfa=0,05; DF=29

Két középérték különbségének tesztelése

Feltételek:

Független minták

Normális eloszlásúak

Azonos szórás

Page 4: STATISZTIKA - unideb.huhuzsvai/okt/stat_2/2_eloadas.pdf · A próba valószínűségi változója ebben az esetben nem t-eloszlású, ezért nem a t-táblázatot, hanem a Bonferroni-módosított

4

Két normál eloszlású, független minta különbség várható

értékének szórása

Két középérték különbségének tesztelése

Kétmintás z-próba vagy u-próba Kétmintás t-próba egyenlő

szórásnégyezeteknél Kétmintás t-próba nem egyenlő

szórásnégyzeteknél Kétmintás párosított t-próba

Kétmintás z-próba vagy u-próba

H0: A Milli és Danone kefir fogyasztói ára megegyezik

n1=n2=120σ1=5 Ftσ2=5 Ft

z-próba statisztikájaSzármazhat-e a két független megfigyelés, minta

azonos középértékű populációból?H0: 1 = 2

Próbastatisztika: z-eloszlás, DF = n1 + n2 – 2

Nincs különbség Nincs különbség

Page 5: STATISZTIKA - unideb.huhuzsvai/okt/stat_2/2_eloadas.pdf · A próba valószínűségi változója ebben az esetben nem t-eloszlású, ezért nem a t-táblázatot, hanem a Bonferroni-módosított

5

Excel kétmintás z-próba

Eszközök, Adatelemzés…

Excel kétmintás z-próba

Excel kétmintás z-próba eredménye

Kétmintás t-teszt (szórás azonos)

Származhat-e a két független megfigyelés, minta azonos középértékű populációból?

H0: 1 = 2

Próbastatisztika: t-eloszlás, DF = n1 + n2 – 2

Kétmintás t-teszt (szórás azonos)

Page 6: STATISZTIKA - unideb.huhuzsvai/okt/stat_2/2_eloadas.pdf · A próba valószínűségi változója ebben az esetben nem t-eloszlású, ezért nem a t-táblázatot, hanem a Bonferroni-módosított

6

Kétmintás t-teszt (szórás azonos)

n1=n2 = 4X1 várható értéke = 6 000 kg/haX2 várható értéke = 7 500 kg/haa szórás mindkét esetben 780 kg/ha

a különbség várható értékének szórása:552 kg/ha

Nincs különbség

Nincs különbségValódi különbség

A várható érték 1 500kg/ha, a szórás 552kg/ha

Kétmintás F-próba a szórásnégyzetre

F=var1/var2

vagy

F=var2/var1

Page 7: STATISZTIKA - unideb.huhuzsvai/okt/stat_2/2_eloadas.pdf · A próba valószínűségi változója ebben az esetben nem t-eloszlású, ezért nem a t-táblázatot, hanem a Bonferroni-módosított

7

F-érték nagyobb, mint 1,00

Valószínűség 1-alfaSzabadságfokok:DF1=6DF2=6

F=143,67/89,29=1,61

Kétmintás F-próba a szórásnégyzetre F-érték kisebb, mint 1,00

Valószínűség alfaSzabadságfokok:DF1=6DF2=6

F=89,29/143,67=0,62

Kétmintás F-próba a szórásnégyzetre

Page 8: STATISZTIKA - unideb.huhuzsvai/okt/stat_2/2_eloadas.pdf · A próba valószínűségi változója ebben az esetben nem t-eloszlású, ezért nem a t-táblázatot, hanem a Bonferroni-módosított

8

Kétmintás t-teszt (nem azonos szórás)

Ha a két csoport szórása szignifikánsan különbözik, ilyenkor a két összehasonlítandó csoport varianciáját súlyozni kell a variancia becsléséhez (separate variancia). A próbastatisztika:

A próba valószínűségi változója ebben az esetben nem t-eloszlású, ezért nem a t-táblázatot, hanem a Bonferroni-módosított szignifikancia értékeket kell használni a középértékek különbözőségének elbírálásakor

Kétmintás t-teszt szabadságfoka(nem azonos szórás)

Excel kétmintás t-próba nem egyenlő szórásnégyzeteknél

Excel kétmintás t-próba nem egyenlő szórásnégyzeteknél

Párosított t-próbaKét összefüggő minta középértékének

összehasonlítására szolgál H0: dátlag = 0Próbastatisztika: (DF = n1 – 1)

sd a párosított minták különbségének szórása, becslése a minta alapján

FogyókúraEgy fogyókúra kísérletben 100 hölgy vett részt.

Page 9: STATISZTIKA - unideb.huhuzsvai/okt/stat_2/2_eloadas.pdf · A próba valószínűségi változója ebben az esetben nem t-eloszlású, ezért nem a t-táblázatot, hanem a Bonferroni-módosított

9

Excel kétmintás párosított t-próba a várható értékre

Excel kétmintás párosított t-próba a várható értékre

Párosított t-próba eredmény táblázata Helytelen módszer alkalmazása

Párosított t-próba helyett független kétmintás t-próba használata

Eredmény

Helytelen eredmény A t-próba ereje

A valódi különbség kimutatásának valószínűsége.

Mi befolyásolja? Minta elemszáma A különbség nagysága Szignifikancia-szint, alfa A t-próba típusa (egy, két, páros) Alternatív hipotézis (egy vagy kétoldali)

Page 10: STATISZTIKA - unideb.huhuzsvai/okt/stat_2/2_eloadas.pdf · A próba valószínűségi változója ebben az esetben nem t-eloszlású, ezért nem a t-táblázatot, hanem a Bonferroni-módosított

10

Minimális mintaelemszámközépérték-különbséghez

Példa

Alfa=0,05 zα=1,96Béta=0,2 zβ=0,84S= 2Delta=1

ÖsszefoglalásFeladatok

H0: A banán átlagos eladási ára 300 Ft/kg

szignifikancia szint=5%n=77átlag= 298,49 Ft/kgs=46,26 Ft/kgHa: nem egyenlő

Próbafüggvény, alfa=0,05; DF=76 Excel INVERZ.T függvény

INVERZ.T(alfa; szabadságfok)

alfa = elsőfajú hiba szignifikancia szintSzabadságfok = n-1

INVERZ.T(0,05; 76)=1,99

Kétoldali szimmetrikus feltétel esetén

Page 11: STATISZTIKA - unideb.huhuzsvai/okt/stat_2/2_eloadas.pdf · A próba valószínűségi változója ebben az esetben nem t-eloszlású, ezért nem a t-táblázatot, hanem a Bonferroni-módosított

11

Excel T.ELOSZLÁS függvény

T.ELOSZLÁS(x; szabadságfok; szél)

x = érték, ahol a t-eloszlás valószínűségét keressük szint

szabadságfok = n-1szél = 1 egyoldali, 2 kétoldali

T.ELOSZLÁS(1,99; 76; 2)=0,05

Kétoldali szimmetrikus feltétel esetén

H0: A szendvics sonka átlagos eladási ára 900 Ft/kg

n=77átlag=865,82 Ft/kgszórás=84,47 Ft/kgHa: nem egyenlő

Próbafüggvény, alfa=0,05; DF=76 Próbafüggvény, alfa=0,05; DF=76

Page 12: STATISZTIKA - unideb.huhuzsvai/okt/stat_2/2_eloadas.pdf · A próba valószínűségi változója ebben az esetben nem t-eloszlású, ezért nem a t-táblázatot, hanem a Bonferroni-módosított

12

Kétmintás z-próba vagy u-próba

H0: A banán átlagos fogyasztói ára megegyezik az Észak-Alföldi és Közép-Magyarországi régióban

n1=n2=11σ1=50 Ftσ2=50 Ft

Nincs különbség

Excel kétmintás z-próba

Eszközök, Adatelemzés…

Excel kétmintás z-próba Excel kétmintás z-próba eredménye

Page 13: STATISZTIKA - unideb.huhuzsvai/okt/stat_2/2_eloadas.pdf · A próba valószínűségi változója ebben az esetben nem t-eloszlású, ezért nem a t-táblázatot, hanem a Bonferroni-módosított

13

Kétmintás t-teszt (szórás azonos)

Származhat-e a két független megfigyelés, minta azonos középértékű populációból?

H0: 1 = 2

Próbastatisztika: t-eloszlás, DF = n1 + n2 – 2

Kétmintás t-teszt (szórás azonos)

H0: A banán átlagos eladási ára megegyezik 2005. és 2010. évben

szignifikancia szint=5%n1=n2=7átlag2005= 291 Ft/kgátlag2010= 374,43 Ft/kgs2005=11,99 Ft/kgs2010= 9,45 Ft/kg

Ha: nem egyenlő

Kétmintás t-teszt (szórás azonos)

Összevont szórás:

Page 14: STATISZTIKA - unideb.huhuzsvai/okt/stat_2/2_eloadas.pdf · A próba valószínűségi változója ebben az esetben nem t-eloszlású, ezért nem a t-táblázatot, hanem a Bonferroni-módosított

14

Nincs különbség

Excel kétmintás t-próba egyenlő szórásnégyzeteknél

Eszközök, Adatelemzés…

Excel kétmintás t-próba egyenlő szórásnégyzeteknél

Excel kétmintás t-próba egyenlő szórásnégyzeteknél eredmény