analiza varijansi

37
ANALIZA VARIJANSI ANALIZA VARIJANSI Da bi smo istovremeno, jednim postupkom, Da bi smo istovremeno, jednim postupkom, ispitali jednakost aritmetičkih sredina više ispitali jednakost aritmetičkih sredina više skupova skupova koristimo statiskički metod koji se naziva koristimo statiskički metod koji se naziva analizom varijanse analizom varijanse (često se koristi skraćenica (često se koristi skraćenica ANOVA). Osnovne ideje i doprinose analizi ANOVA). Osnovne ideje i doprinose analizi varijanse dao je britanski statističar Ronald varijanse dao je britanski statističar Ronald Fisher u prvoj polovini XX veka. Na prvi pogled Fisher u prvoj polovini XX veka. Na prvi pogled izgleda da sam naziv analiza varijanse nije izgleda da sam naziv analiza varijanse nije odgovarajući jer se testiraju aritmetičke sredine, odgovarajući jer se testiraju aritmetičke sredine, ali kao što ćemo videti postupak analize varijanse ali kao što ćemo videti postupak analize varijanse se sprovodi upoređivanjem odgovarajućih varijansi. se sprovodi upoređivanjem odgovarajućih varijansi. Analiza varijanse je veliku primenu našla u Analiza varijanse je veliku primenu našla u različitim eksperimentalnim situacijama u kojima je različitim eksperimentalnim situacijama u kojima je cilj istraživanja uticaja jednog ili više faktora cilj istraživanja uticaja jednog ili više faktora na varijabilitet određene pojave. na varijabilitet određene pojave. Faktore čiji Faktore čiji uticaj ispitujem u jednom eksperimentu nazvaćemo uticaj ispitujem u jednom eksperimentu nazvaćemo kontrolisanim kontrolisanim faktorima. U tzv. faktorima. U tzv. Klasičnim Klasičnim eksperimentu eksperimentu moguće je podešavati uslove pod kojim se vrši moguće je podešavati uslove pod kojim se vrši eksperiment; svi faktori osim proučenog se eksperiment; svi faktori osim proučenog se zadržavaju konstantnim, tako da se dobijeni zadržavaju konstantnim, tako da se dobijeni rezultati mogu jasno pripisati kontrolisanom rezultati mogu jasno pripisati kontrolisanom faktoru. faktoru. Takvi faktori moraju se označiti kao Takvi faktori moraju se označiti kao nekontrolisani faktori nekontrolisani faktori i njihov uticaj ispitivati i i njihov uticaj ispitivati i izdvajati jedino izdvajati jedino statističkim eksperimentom. Statistički statističkim eksperimentom. Statistički eksperiment ne zahteva konstantnost ni jednog faktora koji deluje na eksperiment ne zahteva konstantnost ni jednog faktora koji deluje na posmatranu pojavu, posmatranu pojavu, a kako se elementi iz populacije a kako se elementi iz populacije biraju po principu slučajnosti, doneseni zaključci biraju po principu slučajnosti, doneseni zaključci se uz odgovarajući verovatnoću mogu uopštavati. se uz odgovarajući verovatnoću mogu uopštavati. Suština analize varijanse je u razlaganju Suština analize varijanse je u razlaganju ukupnog varijabiliteta posmatrane pojave na ukupnog varijabiliteta posmatrane pojave na sastavne komponente: varijabilitet koji nastaje pod sastavne komponente: varijabilitet koji nastaje pod 1

Upload: trgoviste

Post on 09-Dec-2015

218 views

Category:

Documents


2 download

DESCRIPTION

Analiza varijanse

TRANSCRIPT

Page 1: ANALIZA VARIJANSI

ANALIZA VARIJANSIANALIZA VARIJANSI

Da bi smo istovremeno, jednim postupkom, Da bi smo istovremeno, jednim postupkom, ispitali jednakost ispitali jednakost aritmetičkih sredina više skupovaaritmetičkih sredina više skupova koristimo statiskički metod koji se koristimo statiskički metod koji se naziva naziva analizom varijanse analizom varijanse (često se koristi skraćenica ANOVA). Osnovne (često se koristi skraćenica ANOVA). Osnovne ideje i doprinose analizi varijanse dao je britanski statističar Ronald Fisher uideje i doprinose analizi varijanse dao je britanski statističar Ronald Fisher u prvoj polovini XX veka. Na prvi pogled izgleda da sam naziv analiza prvoj polovini XX veka. Na prvi pogled izgleda da sam naziv analiza varijanse nije odgovarajući jer se testiraju aritmetičke sredine, ali kao što varijanse nije odgovarajući jer se testiraju aritmetičke sredine, ali kao što ćemo videti postupak analize varijanse se sprovodi upoređivanjem ćemo videti postupak analize varijanse se sprovodi upoređivanjem odgovarajućih varijansi.odgovarajućih varijansi.

Analiza varijanse je veliku primenu našla u različitim Analiza varijanse je veliku primenu našla u različitim eksperimentalnim situacijama u kojima je eksperimentalnim situacijama u kojima je cilj istraživanja uticaja jednog cilj istraživanja uticaja jednog ili više faktora na varijabilitet određene pojave. ili više faktora na varijabilitet određene pojave. Faktore čiji uticaj Faktore čiji uticaj ispitujem u jednom eksperimentu nazvaćemo ispitujem u jednom eksperimentu nazvaćemo kontrolisanim kontrolisanim faktorima. U faktorima. U tzv. tzv. Klasičnim Klasičnim eksperimentu moguće je podešavati uslove pod kojim se vrši eksperimentu moguće je podešavati uslove pod kojim se vrši eksperiment; svi faktori osim proučenog se zadržavaju konstantnim, tako da eksperiment; svi faktori osim proučenog se zadržavaju konstantnim, tako da se dobijeni rezultati mogu jasno pripisati kontrolisanom faktoru.se dobijeni rezultati mogu jasno pripisati kontrolisanom faktoru.

Takvi faktori moraju se označiti kao Takvi faktori moraju se označiti kao nekontrolisani faktorinekontrolisani faktori i njihov i njihov uticaj ispitivati i izdvajati jedino uticaj ispitivati i izdvajati jedino statističkim eksperimentom. Statistički statističkim eksperimentom. Statistički eksperiment ne zahteva konstantnost ni jednog faktora koji deluje na eksperiment ne zahteva konstantnost ni jednog faktora koji deluje na posmatranu pojavu,posmatranu pojavu, a kako se elementi iz populacije biraju po principu a kako se elementi iz populacije biraju po principu slučajnosti, doneseni zaključci se uz odgovarajući verovatnoću mogu slučajnosti, doneseni zaključci se uz odgovarajući verovatnoću mogu uopštavati.uopštavati.

Suština analize varijanse je u razlaganju ukupnog varijabiliteta Suština analize varijanse je u razlaganju ukupnog varijabiliteta posmatrane pojave na sastavne komponente: varijabilitet koji nastaje pod posmatrane pojave na sastavne komponente: varijabilitet koji nastaje pod uticajem kontrolisanih faktora i tzv. Rezidualni varijabilitet, nastao pod uticajem kontrolisanih faktora i tzv. Rezidualni varijabilitet, nastao pod uticajem ostalih tj. nekontrolisanih foktora. Faktore čije delovanje uticajem ostalih tj. nekontrolisanih foktora. Faktore čije delovanje ispitujemo označavaćemo velikim slovima: A, B itd. modaliteti određenog ispitujemo označavaćemo velikim slovima: A, B itd. modaliteti određenog faktora u analizi varijanse nazivaju se faktora u analizi varijanse nazivaju se nivoima nivoima tog faktora, ili tog faktora, ili tretmanima.tretmanima.

Analiza varijanse sa jednim faktoromAnaliza varijanse sa jednim faktorom

Osnovni elementi Osnovni elementi eksperimentalnog planaeksperimentalnog plana su: izbor kontrllisanih su: izbor kontrllisanih faktora i tretmana, način izbora eksperimentalnih jedinica i metod faktora i tretmana, način izbora eksperimentalnih jedinica i metod dodeljivanja tretmana eksperimentalnim jedinicama.dodeljivanja tretmana eksperimentalnim jedinicama.

Najjednostavnija vrsta eksperimentalnog plana zasniva se na Najjednostavnija vrsta eksperimentalnog plana zasniva se na ispitivanju uticaja jednog faktora na varijabilitet posmatrane pojave, pri ispitivanju uticaja jednog faktora na varijabilitet posmatrane pojave, pri čemu se tretmani primenjuju na slučajno odabrane, što je moguće sličnije, čemu se tretmani primenjuju na slučajno odabrane, što je moguće sličnije, eksperimentalne jedinice. Takav plan naziva se eksperimentalne jedinice. Takav plan naziva se potpuno slučajnim planom, potpuno slučajnim planom, aa postupak kojim se dobijeni podaci ispituju postupak kojim se dobijeni podaci ispituju analizom varijanse sa jednom analizom varijanse sa jednom

11

Page 2: ANALIZA VARIJANSI

faktorom.faktorom. Ukoliko bi kontrolisani faktor značajno uticao na varijabilitet Ukoliko bi kontrolisani faktor značajno uticao na varijabilitet broja poena, on bi prouzrokovao varijacije u uspehubroja poena, on bi prouzrokovao varijacije u uspehu između grupa između grupa uzorka. uzorka. Ostali, nekontrolisani faktori koji deluju na pojavi mogu prouzokovati Ostali, nekontrolisani faktori koji deluju na pojavi mogu prouzokovati varijacije varijacije unutar pojedinih grupa, unutar pojedinih grupa, ili manja odstupanja između grupa. ili manja odstupanja između grupa. Postupak analize varijanse se zato zasniva na sledećoj ideji: Postupak analize varijanse se zato zasniva na sledećoj ideji: što su veće što su veće varijacije između grupa prema varijacijama unutar njih, veći je i uticaj varijacije između grupa prema varijacijama unutar njih, veći je i uticaj kontrolisanog faktora u odnosu na nekontrolisane, i obrnuto.kontrolisanog faktora u odnosu na nekontrolisane, i obrnuto.

Prosečan broj poena u uzorcima međusobno se razlikuju. Do ove Prosečan broj poena u uzorcima međusobno se razlikuju. Do ove razlike može doći iz dva razloga:razlike može doći iz dva razloga:

Zbog razlika između aritmetičkih sredina osnovnih skupova, Zbog razlika između aritmetičkih sredina osnovnih skupova, što bi značilo da kontrolisani faktor sistematski utiče na što bi značilo da kontrolisani faktor sistematski utiče na varijabilitet posmatrane pojave,varijabilitet posmatrane pojave,

Usled slučajnih odstupanja uzoraka, bez obzira na jednakost ili Usled slučajnih odstupanja uzoraka, bez obzira na jednakost ili nejednakost aritmetičkih sredina skupova.nejednakost aritmetičkih sredina skupova.

Model analize varijanse sa jednim faktoromModel analize varijanse sa jednim faktorom

Model analize varijanse sa jednim faktorom formulisaćemo tako što Model analize varijanse sa jednim faktorom formulisaćemo tako što ćemo postaviti jednačinu za proizvoljnu opservaciju Xćemo postaviti jednačinu za proizvoljnu opservaciju X : :

Model analize varijanseModel analize varijanse Sa jednim faktorom X Sa jednim faktorom X ==µ + αµ + α + ε + ε

Gde je: Gde je:

XX jj-ta opservacija izabrana iz -ta opservacija izabrana iz ii-te populacije-te populacije µ Zajednička aritmetička sredina posmatranih populacija µ Zajednička aritmetička sredina posmatranih populacija α α Efekat i-tog tretmana Efekat i-tog tretmana ε ε Slučajna greška Slučajna greška

Ovaj model je Ovaj model je linearanlinearan, i prema njemu se svaka opservacija sastoji iz , i prema njemu se svaka opservacija sastoji iz tri tri aditivne aditivne komponente: dve neslučajne veličine µ i αkomponente: dve neslučajne veličine µ i α , i slučajne , i slučajne promenljive εpromenljive ε , preko koje se izražava uticaj nekontrolisanih faktora. , preko koje se izražava uticaj nekontrolisanih faktora.

Razlaganje ukupnog varijabilitetaRazlaganje ukupnog varijabiliteta

22

Page 3: ANALIZA VARIJANSI

Ukupan (totalan) varijabilitet posmatrane pojave (promenljive X)Ukupan (totalan) varijabilitet posmatrane pojave (promenljive X) jednak je zbiru varijabiliteta nastalih pod dejstvom kontrolisanog jednak je zbiru varijabiliteta nastalih pod dejstvom kontrolisanog fakotra i varijabiliteta pod dejstavom rezidualnih (nekontrolisanih) fakotra i varijabiliteta pod dejstavom rezidualnih (nekontrolisanih) faktora.faktora.

Ukupno odstupanje (XUkupno odstupanje (X - - ).).

Ukupan varijabilitet SUkupan varijabilitet S = = ( X( X - - ))

Kvadriranjem i sređivanje izraza može se doći do matematičke Kvadriranjem i sređivanje izraza može se doći do matematičke formulacije ranije navedene relacije:formulacije ranije navedene relacije:

( X( X - - )) = = n n ( ( - - )) + + ( X( X - - ))

S S S S S S

Ukupan Faktorski Rezidualni Ukupan Faktorski Rezidualni Varijabilitet varijabilitet varijabilitetVarijabilitet varijabilitet varijabilitet

(ukupna (faktorska (rezidualna(ukupna (faktorska (rezidualnasuma kvadrata) suma kvadrata) suma kvadrata)suma kvadrata) suma kvadrata) suma kvadrata)

Pretpostavke analize varijansePretpostavke analize varijanse

Pretpostavke analize varijanse se razlikuju u zavisnosti od načina na Pretpostavke analize varijanse se razlikuju u zavisnosti od načina na koji su izabrani tretmani. U slučaju kada se nivoi faktorakoji su izabrani tretmani. U slučaju kada se nivoi faktora fiksiraju unapred fiksiraju unapred govori se o modelima sa govori se o modelima sa fiksiranim efektima.fiksiranim efektima. Ukoliko se nivoi faktora biraju Ukoliko se nivoi faktora biraju na slučajan način iz skupa mogućih nivoa, radi se o modelu sa na slučajan način iz skupa mogućih nivoa, radi se o modelu sa slučajnim slučajnim efektimaefektima i zaključci se mogu uopštiti sa sve nivoe. i zaključci se mogu uopštiti sa sve nivoe.

Korektno izvođenje zaključka na osnovu analize varijanse zahteva Korektno izvođenje zaključka na osnovu analize varijanse zahteva ispunjenost sledećih pretpostavki.ispunjenost sledećih pretpostavki.

1.1. NormalnostNormalnost. Slučajne greške ε. Slučajne greške ε imaju normalan raspored imaju normalan raspored

33

Page 4: ANALIZA VARIJANSI

2.2. Homogenost varijansi (homoskedastičnost)Homogenost varijansi (homoskedastičnost). Sve slučajne . Sve slučajne imaju jednake varijanse:imaju jednake varijanse:

Var (εVar (ε ) = σ) = σ

3.3. E(εE(ε ) = 0) = 0 za svako za svako ii i i jj . Slučajne greške u proseku su jednake . Slučajne greške u proseku su jednake nuli.nuli.

4.4. Slučajne greške su međusobno nezavisne.Slučajne greške su međusobno nezavisne.

5.5. Aditivnost. Aditivnost. Svaka opservacija XSvaka opservacija X se može smatrati kao se može smatrati kao zbir zbir

tri komponente: µ, αtri komponente: µ, α i ε i ε

Prve tri pretpostavke možemo na jednostavniji način prikazati u Prve tri pretpostavke možemo na jednostavniji način prikazati u obliku:obliku:

εε : N (0, σ: N (0, σ ),),

Svi posmatrani osnovni skupovi imaju normalan raspored sa jednakimSvi posmatrani osnovni skupovi imaju normalan raspored sa jednakim varijansama σvarijansama σ . U skladu sa tim, homogenost varijansi znači:. U skladu sa tim, homogenost varijansi znači:

σσ = σ = σ = . . . = σ = . . . = σ = . . . . . = σ = . . . . . = σ = σ = σ ..

Postupak analize varijansePostupak analize varijanse

U opštem slučaju u jednofaktorskoj analiz varijanse nultu hipotezu U opštem slučaju u jednofaktorskoj analiz varijanse nultu hipotezu postavljamo u obliku:postavljamo u obliku:

HH : µ : µ = µ = µ = . . . = µ = . . . = µ = . . . = µ = . . . = µ = µ, = µ,

U odnosu na alternativnu:U odnosu na alternativnu:

H : aritmetičke sredine bar d va skupa se među sobom razlikuju.H : aritmetičke sredine bar d va skupa se među sobom razlikuju.

Ukoliko je nulta hipoteza istinita i ranije navedena pretpostavke Ukoliko je nulta hipoteza istinita i ranije navedena pretpostavke ispunjene, svi osnovni skupovi će se potupuno izjednačiti, pa će ispitivati ispunjene, svi osnovni skupovi će se potupuno izjednačiti, pa će ispitivati uzorci pripadati samo jendom osnovnom skupu, uzorci pripadati samo jendom osnovnom skupu, čija će aritmetička sredina čija će aritmetička sredina biti jednaka , a varijansa . Ukoliko je biti jednaka , a varijansa . Ukoliko je nulta hipoteza tačna, opservacije nulta hipoteza tačna, opservacije

44

Page 5: ANALIZA VARIJANSI

varijaju samo pod uticajem nekontrolisanih faktora.varijaju samo pod uticajem nekontrolisanih faktora. Stoga nulta hipotezu Stoga nulta hipotezu možemo ekvivalentno formulisati u vidu:možemo ekvivalentno formulisati u vidu:

HH : α : α = α = α = . . . = α = . . . = α = . . . = α = . . . = α = 0. = 0.

Što znači da se nijedan metod nastave po svom efektu na uspeh ne Što znači da se nijedan metod nastave po svom efektu na uspeh ne razlikuje od drugih primenjenih metoda. Alternativna hipoteza u ovom razlikuje od drugih primenjenih metoda. Alternativna hipoteza u ovom slučaju glasi:slučaju glasi:

H : Efekat barem jednog tretmana se razlijuje od nule.H : Efekat barem jednog tretmana se razlijuje od nule.

Dakle, Dakle, ako je alternativna hipoteza tačna, tada opsrvacije variraju i ako je alternativna hipoteza tačna, tada opsrvacije variraju i pod uticajem kontrolisanog faktora.pod uticajem kontrolisanog faktora.

55

Page 6: ANALIZA VARIJANSI

Faktorska i rezidualna varijansaFaktorska i rezidualna varijansa

Polazeći od opservacija uzoraka, formulisati dve takve ocene, Polazeći od opservacija uzoraka, formulisati dve takve ocene, odnosno mere varijabiliteta. Prva od njih je odnosno mere varijabiliteta. Prva od njih je ocena varijanse pojedinačnih ocena varijanse pojedinačnih skupova skupova i ukazuje na i ukazuje na varijacije nastale pod dejstvom nekontrolisanih varijacije nastale pod dejstvom nekontrolisanih faktora.faktora. Naziva se Naziva se rezidualnom varijansomrezidualnom varijansom (ili prosečnim kvadratom (ili prosečnim kvadratom greške). Oznaka je Vgreške). Oznaka je V . vidi se da je: . vidi se da je:

VV = ocena σ = ocena σ

Druga ocena, pored uticaja nekontrolisanih faktora, odražava i Druga ocena, pored uticaja nekontrolisanih faktora, odražava i eventualne eventualne varijacije nastale pod dejstvomkontrolisanog faktora.varijacije nastale pod dejstvomkontrolisanog faktora. Naziva se Naziva se faktorskom varijansomfaktorskom varijansom (ili prosečnim kvadratom tretmana). Obeležava se (ili prosečnim kvadratom tretmana). Obeležava se sa Vsa V . faktorskom varijansom merimo disperziju zajednikog skupa, pa je . faktorskom varijansom merimo disperziju zajednikog skupa, pa je ona jednaka:ona jednaka:

VV = ocena σ = ocena σ = ocena σ = ocena σ + ocena varijabiliteta između + ocena varijabiliteta između aritmetičkih sredina skupova. aritmetičkih sredina skupova.

Faktorska suma kvadrata, SFaktorska suma kvadrata, S , se dobija na osnovu odstupanja , se dobija na osnovu odstupanja pojedinih aritmetičkih sredina uzoraka, pojedinih aritmetičkih sredina uzoraka, , od njihove zajedničke , od njihove zajedničke aritmetičke sredine, aritmetičke sredine, . Kada se jednom izračuna . Kada se jednom izračuna , samo (, samo (r – 1r – 1) ) aritmetičkih sredina mogu slobodno da variraju, pa broj stepeni slobode aritmetičkih sredina mogu slobodno da variraju, pa broj stepeni slobode iznosi iznosi r – 1r – 1. stoga formula za faktorsku varijansu glasi:. stoga formula za faktorsku varijansu glasi:

Faktorska VFaktorska V = = = = , , ii = 1,2,..., = 1,2,...,rr

VarijansaVarijansa

66

Page 7: ANALIZA VARIJANSI

Gde su: Gde su: n n veličina uzorka, veličina uzorka, r r broj uzoraka, broj uzoraka, r - 1r - 1 broj stepeni slobode, broj stepeni slobode, aritmetička sredina aritmetička sredina i-i-tog uzorka, a tog uzorka, a zajednička aritmetička sredina zajednička aritmetička sredina

svih uzoraka.svih uzoraka.

Kako je ukupan broj opservacija u uzorcima jednak Kako je ukupan broj opservacija u uzorcima jednak rnrn , broj stepeni , broj stepeni slobode iznosi slobode iznosi rn - rrn - r . Formula za rezidualnu varijansu stoga glasi: . Formula za rezidualnu varijansu stoga glasi:

Rezidualna Rezidualna

Varijansa VVarijansa V = = = = i i =1,2,...,=1,2,...,rr

J J = 1,2,...,= 1,2,...,rr

Statistika F testa i Snedecorov F rasporedStatistika F testa i Snedecorov F raspored

Prethodno izlaganje nam sugeriše da kao statistiku testa odaberemo Prethodno izlaganje nam sugeriše da kao statistiku testa odaberemo količnik varijansi Vkoličnik varijansi V /V/V ’ . takav kreterijum obeležava se sa F i naziva ’ . takav kreterijum obeležava se sa F i naziva statiskikom F testa: statiskikom F testa:

Statistika F =Statistika F =

F testaF testa

77

Page 8: ANALIZA VARIJANSI

Kriva F sarpodela (6,6), (20,6) i (30,30) stepeni slobodeKriva F sarpodela (6,6), (20,6) i (30,30) stepeni slobode

F raspored spada u grupu neprekidnih teorijskih rasporeda. Definisan F raspored spada u grupu neprekidnih teorijskih rasporeda. Definisan je za realne brojeve od 0 do + ∞ , i asimetričan je udesno. Slično je za realne brojeve od 0 do + ∞ , i asimetričan je udesno. Slično tt rasporedu zavisi od broja stepeni slobode.rasporedu zavisi od broja stepeni slobode.

Sa slike se može uočiti da se asimetrija Sa slike se može uočiti da se asimetrija f f krive smanjuje sa krive smanjuje sa povećanjem broja stepeni slobode.povećanjem broja stepeni slobode.

Pošto vrednosti Pošto vrednosti f statistikef statistike koje su veće od 1 sugerišu neistinitost nulte koje su veće od 1 sugerišu neistinitost nulte hipoteze, kritična oblast nalazi se na desnoj strani rasporeda, dakle, u analizi hipoteze, kritična oblast nalazi se na desnoj strani rasporeda, dakle, u analizi varijanse se primenjuje varijanse se primenjuje jednosmeranjednosmeran test. test.

Odbacivanje nulte hipotezeOdbacivanje nulte hipoteze

Korišćenjem osobine aditivnosti, potrebne sume kvadrata Korišćenjem osobine aditivnosti, potrebne sume kvadrata izračunavamo na jednostavniji način:izračunavamo na jednostavniji način:

88

Page 9: ANALIZA VARIJANSI

SS = =

SS = =

SS = S = S - S - S

gde su: Sgde su: S zbir podataka u zbir podataka u ii-tom uzorku, a -tom uzorku, a SS zbir podataka u svim zbir podataka u svim uzorcima.uzorcima.

Višestruka komparacijaVišestruka komparacija

Formulišemo takav metod poređenja parova uzoraka kod kojeg bi Formulišemo takav metod poređenja parova uzoraka kod kojeg bi stvarni nivo značajnosti bio jednak unapred postavljenom. stvarni nivo značajnosti bio jednak unapred postavljenom. To nam pružaju To nam pružaju tzv. Metoditzv. Metodi višestruke komparacije. višestruke komparacije. Njihova osnovna karakteristika je da Njihova osnovna karakteristika je da fiksiraju nivo značajnosti: ako unapred postavimo rizik greške α =0,05, bez fiksiraju nivo značajnosti: ako unapred postavimo rizik greške α =0,05, bez obzira na broj parova uzoraka koji se porede, stvarni nivo značajnosti ostaće obzira na broj parova uzoraka koji se porede, stvarni nivo značajnosti ostaće jednak 0,05.jednak 0,05.

U statističkoj literaturi je predloženo više različitih metoda za U statističkoj literaturi je predloženo više različitih metoda za višestuku komparaciju. Jedan od metoda koji se najčešće koristi jestevišestuku komparaciju. Jedan od metoda koji se najčešće koristi jeste Tukey- Tukey-ev testev test, zasnovan na , zasnovan na kriterijumukriterijumu T. U slučaju kada uzorci imaju jednak broj T. U slučaju kada uzorci imaju jednak broj elemenata, kriterijum T se određuje po formuli:elemenata, kriterijum T se određuje po formuli:

Tukey-evTukey-ev

Kriterijum T =QKriterijum T =Q

Gde su: QGde su: Q kritična vrednost i za nivo značajnosti α, V kritična vrednost i za nivo značajnosti α, V rezidualna rezidualna varijansa, a varijansa, a nn veličina pojedinačnog uzorka. veličina pojedinačnog uzorka.

Tukey-ev metod koristi se samo u slučaju kada smo prethodno na Tukey-ev metod koristi se samo u slučaju kada smo prethodno na osnovu statistike F odbacili nultu hipotezuosnovu statistike F odbacili nultu hipotezu. U tom slučaju ovaj metod . U tom slučaju ovaj metod garantuje da će otkriti statistički značajnu razliku bar između jednog para garantuje da će otkriti statistički značajnu razliku bar između jednog para aritmetičkih sredina.aritmetičkih sredina.

99

Page 10: ANALIZA VARIJANSI

Analiza varijanse sa dva faktoraAnaliza varijanse sa dva faktora

Kada postoje indicije da na posmatranu pojavu bitno utiče više Kada postoje indicije da na posmatranu pojavu bitno utiče više faktora, primenjuje faktora, primenjuje modeli analize varijase sa dva i više faktora.modeli analize varijase sa dva i više faktora. Ja ću se Ja ću se zadržati samo na modelu sa dva kontrolisana faktora. Kontrolisane faktore zadržati samo na modelu sa dva kontrolisana faktora. Kontrolisane faktore označićemo sa A i B; pri tome faktor A ima označićemo sa A i B; pri tome faktor A ima rr različitih nivoa: A različitih nivoa: A , A, A , . . . ,A , . . . ,A , . . .,A, . . .,A , a faktor B, , a faktor B, ss različitih nivoa: B različitih nivoa: B , B, B , . . . , B, . . . , B , . . . , B, . . . , B

Teorijski model analize varijanse sa dva faktora (postavljen slučajan Teorijski model analize varijanse sa dva faktora (postavljen slučajan plan, uz jednu opservaciju za svaku kombinaciju nivoa faktora) postaviću naplan, uz jednu opservaciju za svaku kombinaciju nivoa faktora) postaviću na sledeći način:sledeći način:

Model analize varijanse Model analize varijanse ii = 1,2,...., = 1,2,...., rr Sa dva faktora X Sa dva faktora X =µ + α=µ + α + β + β + ε + ε j j = 1,2,....,= 1,2,....,ss

gde su:gde su:

X X Opservacija koja odgovara Opservacija koja odgovara ii-tom nivou faktora A i -tom nivou faktora A i jj-tom -tom nivou faktora B nivou faktora B µ zajednička artmetička sredina µ zajednička artmetička sredina α α efekat efekat ii-tog nivoa faktora A-tog nivoa faktora A β β efekat efekat jj-tog nivoa faktora B-tog nivoa faktora B ε ε slučajna greška. slučajna greška.

Pored pretpostavki koje su uvedene kod jednofaktorskog modela Pored pretpostavki koje su uvedene kod jednofaktorskog modela analize varijanse, ovde je potrebno uvesti dodatnu pretpostavku:analize varijanse, ovde je potrebno uvesti dodatnu pretpostavku:

Faktori A i B su aditivni (tj. nema interakcije faktora).Faktori A i B su aditivni (tj. nema interakcije faktora).U dvofaktorskoj analizi varijanse postavljam U dvofaktorskoj analizi varijanse postavljam dve dve nulte hipoteze. Prva nulte hipoteze. Prva

nulta hipoteza se odnosi na faktor A i glasi da se nivoi faktora A ne razlikujunulta hipoteza se odnosi na faktor A i glasi da se nivoi faktora A ne razlikuju po efektima na posmatranu pojavu, odnosno u našem primeru:po efektima na posmatranu pojavu, odnosno u našem primeru:

HH : α: α = α = α = α = α = α = α = 0, = 0,

Dok bi odgovarajuća alternativna hipoteza glasila:Dok bi odgovarajuća alternativna hipoteza glasila:

1010

Page 11: ANALIZA VARIJANSI

HH : Efekat barem jednog nivoa fakotra A se razlikuje od nule.: Efekat barem jednog nivoa fakotra A se razlikuje od nule.

Druga nulta hipoteza se tiče faktora B i tvrdi da se nivoi faktora B ne Druga nulta hipoteza se tiče faktora B i tvrdi da se nivoi faktora B ne razlikuju po efektima na posmatranu pojavu, tj. u našem primeru:razlikuju po efektima na posmatranu pojavu, tj. u našem primeru:

HH : β: β = β = β = β = β = 0, = 0,

A odgovarajuća alaternativna, hipoteza glasi:A odgovarajuća alaternativna, hipoteza glasi:HH : Efekat barem jednog nivoa faktora B se razlikuje od nule: Efekat barem jednog nivoa faktora B se razlikuje od nule

Efekti narušavanja pretpostavki analize varijanseEfekti narušavanja pretpostavki analize varijanse

Na osnovu pretpostavki analize varijanse zaključujemo da ona spada uNa osnovu pretpostavki analize varijanse zaključujemo da ona spada u parametarske statističke metode.parametarske statističke metode. U najvećem broju radova se zaključuje U najvećem broju radova se zaključuje da će odstupanje od normalnosti skupova i homogenosti varijansi imati malida će odstupanje od normalnosti skupova i homogenosti varijansi imati mali efekat, pod uslovom da se primenjuju uzorci sa jednakim brojem elemenata.efekat, pod uslovom da se primenjuju uzorci sa jednakim brojem elemenata. Zbog toga se preporučuje da se pri izvođenju eksperimenta uzimaju uzorci Zbog toga se preporučuje da se pri izvođenju eksperimenta uzimaju uzorci iste veličine.iste veličine.

ZadaciZadaci

1111

Page 12: ANALIZA VARIJANSI

Zadatak 1.Zadatak 1.

Osam stabala bresaka dalo je prinos u kilogramima: 20, 23, 31, 37, 40, 46, Osam stabala bresaka dalo je prinos u kilogramima: 20, 23, 31, 37, 40, 46, 49 i 53. Izračunaj varijansu49 i 53. Izračunaj varijansu

Prinos Prinos xx ((xx - - )) ((xx - - ))11 22 3320202323313137374040464649495353

-17-17-14-14-6-600339912121616

289289196196363600998181144144256256

299299 -- 10111011

= = = =

= 37.3 = 37.3

≈ 37 ≈ 37 [kg][kg]

ProseProsečan prinos bresaka po jednom stablu je 37 kilogramačan prinos bresaka po jednom stablu je 37 kilograma

µ = δµ = δ = =

σσ = = = 126,3 = 126,3

σσ = 126,3 = 126,3

Prosek kvadrata odstupanja pojedinačnih prinosa po stablu od Prosek kvadrata odstupanja pojedinačnih prinosa po stablu od prosečno prinosa bresaka iznosi 126,3prosečno prinosa bresaka iznosi 126,3

1212

Page 13: ANALIZA VARIJANSI

Zadatak 2.Zadatak 2.

Na 185 parcela zasejanih pšenicom bačena je sledeća količina Na 185 parcela zasejanih pšenicom bačena je sledeća količina đubriva:đubriva:

Količina đubrivaKoličina đubriva (x (x ): ): 350-400 400-450 450-500 500-550 550-600350-400 400-450 450-500 500-550 550-600

Broj parcelaBroj parcela (f (f ) ) 10 30 40 45 60 10 30 40 45 60

Izračunaj varijansu:Izračunaj varijansu:

KoličinaKoličina đubrivađubriva

xx

Broj Broj parcelaparcela

f f

RazrednaRazredna sredinasredina

xx

xx - f- f (x(x -- )) (x(x -- )) ff (x (x -- ))

11 22 33 44 55 66 77350-400350-400400-450400-450450-500450-500500-550500-550550-600550-600

10103030404045456060

375375425425475475525525575575

375037501275012750190001900023625236253450034500

-131-131-81-81-31-3119196969

17161171616561656196196136136147614761

17161017161019683019683038440384401624516245285660285660

UkupnoUkupno 185185 -- 9362593625 -- -- 708785708785

= = = =

= 506; = 506; [kg/ha][kg/ha]

1313

Page 14: ANALIZA VARIJANSI

σσ = = = = = 3831,27 = 3831,27

σσ = 3831,27 [kg/ha] = 3831,27 [kg/ha]

Zadatak 3.Zadatak 3.

Metod nastaveMetod nastave A A A A A A 35 35 38 4238 42 25 40 25 40 3939 38 36 45 38 36 45 26 35 26 35 38 38 36 36 31 4631 46 ∑ 160 180 210 ∑ 160 180 210Aritmetička Aritmetička =32 =32 =36 =36 =42=42Sredina Sredina UzorakaUzoraka

Zajednička aritmetička Zajednička aritmetička == =36,67=36,67

SredinaSredina

Na osnovu tabele gde je broj uzoraka 3 (Na osnovu tabele gde je broj uzoraka 3 (rr=3), a veličina svakog uzorka je 5 =3), a veličina svakog uzorka je 5 ((nn=5) izračunati vrednost faktorske varijanse iznosi:=5) izračunati vrednost faktorske varijanse iznosi:

VV = = == =126,67=126,67

A izračunata vrednost rezidualne varijanse:A izračunata vrednost rezidualne varijanse:

VV == == =20,17=20,17

1414

Page 15: ANALIZA VARIJANSI

Zadatak Zadatak 4. 4.

Tip pakovanja ATip pakovanja AVrsta prodavnice BVrsta prodavnice B

AA A A A A A A SS SS

BB

BB

BB

80 86 89 6980 86 89 69

75 79 92 7275 79 92 72

70 78 86 6670 78 86 66

324324

318318

300300

104976104976

101124101124

9000090000

SSSS

225 243 267 207225 243 267 207

50625 59049 71289 4284950625 59049 71289 42849

S=942S=942

∑ S∑ S =223812=223812

∑ S∑ S =296100=296100

Kada je dvofaktorska analiza varijanse potrebno je odrediti tri nezavisne Kada je dvofaktorska analiza varijanse potrebno je odrediti tri nezavisne ocene nepoznate varijanse σocene nepoznate varijanse σ : dve fakotrkse varijanse i rezidualnu.: dve fakotrkse varijanse i rezidualnu.

SS = = ==

SS = = = =

SS = = xx - -

SS = S= S - (S - (S + S + S ) = 781-(657+78)=46) = 781-(657+78)=46

Izračunate vrednosti faktorskih i rezidualne varijanse iznosiće:Izračunate vrednosti faktorskih i rezidualne varijanse iznosiće:

VV = = = =

1515

Page 16: ANALIZA VARIJANSI

VV = =

VV = =

Na nivou značajnosti od 0,05, uticaj faktora A na posmatranu pojavu iznosi:Na nivou značajnosti od 0,05, uticaj faktora A na posmatranu pojavu iznosi:

F=F=

Uticaj faktora B uz isti nivo značajnosti iznosi:Uticaj faktora B uz isti nivo značajnosti iznosi:

F =F =

Zadatak 5.Zadatak 5.

Tokom sedam dana posmatrana je prodaja jedne vrste prehrambenog Tokom sedam dana posmatrana je prodaja jedne vrste prehrambenog proizvoda u slučajnim uzorcima od 5 prodavnica i dobijeni su sledeći proizvoda u slučajnim uzorcima od 5 prodavnica i dobijeni su sledeći rezultati prdaje (u 000 din.)rezultati prdaje (u 000 din.)

‘’Srbijanka’’‘’Srbijanka’’ ‘’Soko Štark’’‘’Soko Štark’’ ‘’Josip Kraš’’‘’Josip Kraš’’20202525272730303030

34343737323234343535

20202828343420202525

Ispitati uz rizik greške o 0,05 da li kupci vode računa o poreklu proizvoda Ispitati uz rizik greške o 0,05 da li kupci vode računa o poreklu proizvoda prilikom kupovine.prilikom kupovine.

AA A A AA

1616

Page 17: ANALIZA VARIJANSI

20 34 2020 34 20 25 37 28 25 37 28 27 32 34 27 32 34 30 34 20 30 34 20 30 35 25 30 35 25

SS 132 172 127 132 172 127SS 431 431

SS 17424 29584 16129 17424 29584 16129 ∑ S∑ S 6313763137

xx

400 1156 400 400 1156 400 625 1369 784625 1369 784729 1024 1156729 1024 1156900 1156 400900 1156 400900 1225 625900 1225 6253554 5930 33653554 5930 3365 x x = 12849 = 12849

SS = =

SS = =

SS = S = S - S - S = 465 – 243,33 = 221,6 = 465 – 243,33 = 221,6

VV = =

VV = =

F = F =

1717

Page 18: ANALIZA VARIJANSI

FF =3,89 Odbacujemo H=3,89 Odbacujemo H , odnosno kupci vode računa o poreklu , odnosno kupci vode računa o poreklu proizvodaproizvoda

Zadatak 6. Zadatak 6.

Mesečna potrošnja jednog proizvoda u kg. Na osnovu uzoraka od po 6 Mesečna potrošnja jednog proizvoda u kg. Na osnovu uzoraka od po 6 domaćinstva, s obzirom na visinu dohotka, data je sledećom tabelom.domaćinstva, s obzirom na visinu dohotka, data je sledećom tabelom.

AA A A AA 2 3 52 3 5 6 8 11 6 8 11 7 9 12 7 9 12 8 11 14 8 11 14 9 13 15 9 13 15 11 14 12 11 14 12

SS 43 58 69 43 58 69SS=170=170

SS 1849 3364 4761 1849 3364 4761 ∑ S∑ S =9974=9974

xx

4 9 25 4 9 25 36 64 121 36 64 121 49 81 144 49 81 144 64 121 196 64 121 196 81 169 225 81 169 225121 196 144121 196 144 355 640 855 355 640 855 x x = 1850 = 1850

SS = =

SS = =

1818

Page 19: ANALIZA VARIJANSI

SS = S = S - S - S =244,53– 56,77 = 187,66 =244,53– 56,77 = 187,66

VV = =

VV = =

F = F =

FF = 3,68 Visina dohotka ne utiče sistematski na varijabilitet mesečne = 3,68 Visina dohotka ne utiče sistematski na varijabilitet mesečne potrošnje tog proizvodapotrošnje tog proizvoda

Zadatak 7. Zadatak 7.

Broj neispravnih proizvoda u jednom pogonu, na osnovu slučajnog uzorka, sBroj neispravnih proizvoda u jednom pogonu, na osnovu slučajnog uzorka, s obzirom na vrstu mašie, dat je u tabeli:obzirom na vrstu mašie, dat je u tabeli:

AA AA AA

1010151517171313101099

181817172020141410101313

151517171919131318181414

AA A A AA 10 18 1510 18 15 15 17 17 15 17 17 17 20 19 17 20 19 13 14 13 13 14 13

1919

Page 20: ANALIZA VARIJANSI

10 10 18 10 10 18 9 13 14 9 13 14

SS 74 92 96 74 92 96SS=262=262

SS 5476 8464 9216 5476 8464 9216 ∑ S∑ S =23156=23156

xx

100 324 225 100 324 225 225 289 289 225 289 289 289 400 361 289 400 361 169 196 169 169 196 169 100 100 324 100 100 324 81 169 196 81 169 196 964 1478 1564 964 1478 1564 x x = 4006 = 4006

SS = =

SS = =

SS = S = S - S - S =192,44– 45,77 = 146,66 =192,44– 45,77 = 146,66

VV = =

VV = =

F = F =

FF = 6,36 = 6,36FF = 3,68 = 3,68Prihvata se HPrihvata se H i za α=0,01 i za α=0,05 i za α=0,01 i za α=0,05

2020

Page 21: ANALIZA VARIJANSI

Zadatak 8. Zadatak 8.

Slučajnim izborom dobijeni su sledeći rezultati o broju studenata koji su Slučajnim izborom dobijeni su sledeći rezultati o broju studenata koji su položili ispit iz statistike u junskom roku 1990. Godinepoložili ispit iz statistike u junskom roku 1990. Godine

Uspeh naUspeh na Kolokvijumu Kolokvijumu

Posećenost predavanjaPosećenost predavanjaStalno povremeno ne posećujeStalno povremeno ne posećuje

Do 65Do 6565 – 7565 – 7575 – 8575 – 8585 – 10085 – 100

10 6 1 10 6 1 15 8 3 15 8 3 20 11 5 20 11 5 30 15 2 30 15 2

A)ispitati uz rizik od 0,05 da li faktori na kolokvijumu i posećenost A)ispitati uz rizik od 0,05 da li faktori na kolokvijumu i posećenost predavanjima sistematski utiču na varijabilitet broja studenata koji su predavanjima sistematski utiču na varijabilitet broja studenata koji su položili ispit iz statistike.položili ispit iz statistike.b) izračunati Tukey-ov kriterijum za odgovarajući faktorb) izračunati Tukey-ov kriterijum za odgovarajući faktor

Posećenost Posećenost AAUspeh Uspeh B B

AA AA A A SS SS

BB

BB

BB

BB

110 0 6 6 1 1

115 5 8 8 3 3

220 0 11 11 55

30 15 230 15 2

1717

2626

3636

4747

289289

676676

12961296

22092209

2121

Page 22: ANALIZA VARIJANSI

SSSS

7575 40 40 11 11

5625 1600 1215625 1600 121

S=S=126126

∑ S∑ S ==73467346

∑ S∑ S ==44704470

xx

100 36 1100 36 1225 64 9225 64 9400 121 25400 121 25900 225 4900 225 4

1625 446 391625 446 39 x x = 2110 = 2110

SS = = ==

SS = = = =

SS = = xx - -

SS = S= S - (S - (S + S + S ) = 78) = 7877-(-(513,5513,5++167167)=)=101066,5,5

VV = = = =

VV = =

VV = =

F=F=

F =F =

2222

Page 23: ANALIZA VARIJANSI

FF =5,14 Faktor A utiče sistematski=5,14 Faktor A utiče sistematski

FF =4,76 Prihvata se H=4,76 Prihvata se H da faktor B ne utiče sistematski da faktor B ne utiče sistematski

b) Tb) T = Qα * = Qα *

Zadatak 9. Zadatak 9.

Na parcelama iste veličine, približno istog kvaliteta zasejane su 4 vrste Na parcelama iste veličine, približno istog kvaliteta zasejane su 4 vrste semena jedne kulture i korišćene 3 vrste đubriva. Sledeća tabela pokazuje semena jedne kulture i korišćene 3 vrste đubriva. Sledeća tabela pokazuje prinose slučajno odabranih parelaprinose slučajno odabranih parela

ĐubrivoĐubrivo Vrsta semenaVrsta semenaAA AA A A A A

BBBBBB

12 11 13 15 12 11 13 15 8 6 5 9 8 6 5 9 5 3 2 4 5 3 2 4

a)a) Ispitati na nivou značajnosti od 0,05 da li vrsta semena i đubriva utiču Ispitati na nivou značajnosti od 0,05 da li vrsta semena i đubriva utiču na varijabilitet prinosana varijabilitet prinosa

b)b) Da li bi neku vrstu semena, ili veštačkog đubriva preporučili?Da li bi neku vrstu semena, ili veštačkog đubriva preporučili?

Vrsta semena AVrsta semena AA A A AA A A A SS SS

Đubrivo B Đubrivo B       

BB12 11 13 1512 11 13 15 5151 26012601

        

BB 8 6 5 9 8 6 5 9 2828 784784

       

2323

Page 24: ANALIZA VARIJANSI

BB 5 3 2 4 5 3 2 4 1414 196196

        

SS 25 20 20 2825 20 20 28 S=93S=93∑ S∑ S

   ∑ S∑ S35813581

SS625 400 400 784625 400 400 784 22092209  

xx

144 121 169 225 144 121 169 225 64 36 25 81 64 36 25 81 25 9 4 16 25 9 4 16

233 166 198 322233 166 198 322 x x = 919 = 919

SS = = ==

SS = = = =

SS = = xx - -

SS = S= S - (S - (S + S + S ) = ) = 198,25198,25-(-(15,5815,58++174,5174,5)=)=8,178,17

VV = = = =

VV = =

2424

Page 25: ANALIZA VARIJANSI

VV = =

F=F=

F =F =

FF =4,76 Prihvata se H=4,76 Prihvata se H da vrsta ne utiče na varijabilitet prinosa da vrsta ne utiče na varijabilitet prinosa

FF =5,14 Odbacuje se H=5,14 Odbacuje se H da vrsta đubriva sistematski utiče na varijabilitet prinosa. da vrsta đubriva sistematski utiče na varijabilitet prinosa.

b) Tb) T = Qα * = Qα *

Zadatak 10. Zadatak 10.

Na slučajan način 10 paklica maslaca mase od 200 grama izmereno je, pri Na slučajan način 10 paklica maslaca mase od 200 grama izmereno je, pri čemu su dobijeni sledeći rezultati: 198, 199, 200, 201, 202, 203, 204, 205.čemu su dobijeni sledeći rezultati: 198, 199, 200, 201, 202, 203, 204, 205.Izračunati varijansu.Izračunati varijansu.

Masa Masa xx ((x - x - )) ((x - x - ))

     11 22 33

198198 -3-3 99199199 -2-2 44200200 -1-1 11201201 00 00202202 11 11203203 22 44

2525

Page 26: ANALIZA VARIJANSI

204204 33 99205205 44 1616

16121612 -- 4444

= = = =

= 201.5 = 201.5

≈ 201 ≈ 201 [g][g]

ProseProsečna masa maslaca od 10 paklica je 201 gramčna masa maslaca od 10 paklica je 201 gram

µ = δµ = δ = =

σσ = = = 5.5 = 5.5

σσ = 5.5 = 5.5Prosek kvadrata odstupanja pojedinačne mase maslaca od prosečne Prosek kvadrata odstupanja pojedinačne mase maslaca od prosečne mase maslaca iznosi 5.5mase maslaca iznosi 5.5

2626

Page 27: ANALIZA VARIJANSI

LiteraturaLiteratura

1.1. Metod statističke analizeMetod statističke analizeDr Mileva Žižić, Dr Miodrag LovrićDr Mileva Žižić, Dr Miodrag LovrićDr Dubravka PavličićDr Dubravka Pavličić

2.2. Metodi statističke analize – Zbirka rešenih zadatakaMetodi statističke analize – Zbirka rešenih zadatakaDr Olga Bošković, Dr Miodrag LovrićDr Olga Bošković, Dr Miodrag LovrićDr Dubravka Pavličić, Mr Radmila DragutinovićDr Dubravka Pavličić, Mr Radmila Dragutinović

3.3. Zbirka rešenih zadataka iz opše statistikeZbirka rešenih zadataka iz opše statistike Mirjana M. Šekarić Mirjana M. Šekarić

2727