analiza varijansi
DESCRIPTION
Analiza varijanseTRANSCRIPT
ANALIZA VARIJANSIANALIZA VARIJANSI
Da bi smo istovremeno, jednim postupkom, Da bi smo istovremeno, jednim postupkom, ispitali jednakost ispitali jednakost aritmetičkih sredina više skupovaaritmetičkih sredina više skupova koristimo statiskički metod koji se koristimo statiskički metod koji se naziva naziva analizom varijanse analizom varijanse (često se koristi skraćenica ANOVA). Osnovne (često se koristi skraćenica ANOVA). Osnovne ideje i doprinose analizi varijanse dao je britanski statističar Ronald Fisher uideje i doprinose analizi varijanse dao je britanski statističar Ronald Fisher u prvoj polovini XX veka. Na prvi pogled izgleda da sam naziv analiza prvoj polovini XX veka. Na prvi pogled izgleda da sam naziv analiza varijanse nije odgovarajući jer se testiraju aritmetičke sredine, ali kao što varijanse nije odgovarajući jer se testiraju aritmetičke sredine, ali kao što ćemo videti postupak analize varijanse se sprovodi upoređivanjem ćemo videti postupak analize varijanse se sprovodi upoređivanjem odgovarajućih varijansi.odgovarajućih varijansi.
Analiza varijanse je veliku primenu našla u različitim Analiza varijanse je veliku primenu našla u različitim eksperimentalnim situacijama u kojima je eksperimentalnim situacijama u kojima je cilj istraživanja uticaja jednog cilj istraživanja uticaja jednog ili više faktora na varijabilitet određene pojave. ili više faktora na varijabilitet određene pojave. Faktore čiji uticaj Faktore čiji uticaj ispitujem u jednom eksperimentu nazvaćemo ispitujem u jednom eksperimentu nazvaćemo kontrolisanim kontrolisanim faktorima. U faktorima. U tzv. tzv. Klasičnim Klasičnim eksperimentu moguće je podešavati uslove pod kojim se vrši eksperimentu moguće je podešavati uslove pod kojim se vrši eksperiment; svi faktori osim proučenog se zadržavaju konstantnim, tako da eksperiment; svi faktori osim proučenog se zadržavaju konstantnim, tako da se dobijeni rezultati mogu jasno pripisati kontrolisanom faktoru.se dobijeni rezultati mogu jasno pripisati kontrolisanom faktoru.
Takvi faktori moraju se označiti kao Takvi faktori moraju se označiti kao nekontrolisani faktorinekontrolisani faktori i njihov i njihov uticaj ispitivati i izdvajati jedino uticaj ispitivati i izdvajati jedino statističkim eksperimentom. Statistički statističkim eksperimentom. Statistički eksperiment ne zahteva konstantnost ni jednog faktora koji deluje na eksperiment ne zahteva konstantnost ni jednog faktora koji deluje na posmatranu pojavu,posmatranu pojavu, a kako se elementi iz populacije biraju po principu a kako se elementi iz populacije biraju po principu slučajnosti, doneseni zaključci se uz odgovarajući verovatnoću mogu slučajnosti, doneseni zaključci se uz odgovarajući verovatnoću mogu uopštavati.uopštavati.
Suština analize varijanse je u razlaganju ukupnog varijabiliteta Suština analize varijanse je u razlaganju ukupnog varijabiliteta posmatrane pojave na sastavne komponente: varijabilitet koji nastaje pod posmatrane pojave na sastavne komponente: varijabilitet koji nastaje pod uticajem kontrolisanih faktora i tzv. Rezidualni varijabilitet, nastao pod uticajem kontrolisanih faktora i tzv. Rezidualni varijabilitet, nastao pod uticajem ostalih tj. nekontrolisanih foktora. Faktore čije delovanje uticajem ostalih tj. nekontrolisanih foktora. Faktore čije delovanje ispitujemo označavaćemo velikim slovima: A, B itd. modaliteti određenog ispitujemo označavaćemo velikim slovima: A, B itd. modaliteti određenog faktora u analizi varijanse nazivaju se faktora u analizi varijanse nazivaju se nivoima nivoima tog faktora, ili tog faktora, ili tretmanima.tretmanima.
Analiza varijanse sa jednim faktoromAnaliza varijanse sa jednim faktorom
Osnovni elementi Osnovni elementi eksperimentalnog planaeksperimentalnog plana su: izbor kontrllisanih su: izbor kontrllisanih faktora i tretmana, način izbora eksperimentalnih jedinica i metod faktora i tretmana, način izbora eksperimentalnih jedinica i metod dodeljivanja tretmana eksperimentalnim jedinicama.dodeljivanja tretmana eksperimentalnim jedinicama.
Najjednostavnija vrsta eksperimentalnog plana zasniva se na Najjednostavnija vrsta eksperimentalnog plana zasniva se na ispitivanju uticaja jednog faktora na varijabilitet posmatrane pojave, pri ispitivanju uticaja jednog faktora na varijabilitet posmatrane pojave, pri čemu se tretmani primenjuju na slučajno odabrane, što je moguće sličnije, čemu se tretmani primenjuju na slučajno odabrane, što je moguće sličnije, eksperimentalne jedinice. Takav plan naziva se eksperimentalne jedinice. Takav plan naziva se potpuno slučajnim planom, potpuno slučajnim planom, aa postupak kojim se dobijeni podaci ispituju postupak kojim se dobijeni podaci ispituju analizom varijanse sa jednom analizom varijanse sa jednom
11
faktorom.faktorom. Ukoliko bi kontrolisani faktor značajno uticao na varijabilitet Ukoliko bi kontrolisani faktor značajno uticao na varijabilitet broja poena, on bi prouzrokovao varijacije u uspehubroja poena, on bi prouzrokovao varijacije u uspehu između grupa između grupa uzorka. uzorka. Ostali, nekontrolisani faktori koji deluju na pojavi mogu prouzokovati Ostali, nekontrolisani faktori koji deluju na pojavi mogu prouzokovati varijacije varijacije unutar pojedinih grupa, unutar pojedinih grupa, ili manja odstupanja između grupa. ili manja odstupanja između grupa. Postupak analize varijanse se zato zasniva na sledećoj ideji: Postupak analize varijanse se zato zasniva na sledećoj ideji: što su veće što su veće varijacije između grupa prema varijacijama unutar njih, veći je i uticaj varijacije između grupa prema varijacijama unutar njih, veći je i uticaj kontrolisanog faktora u odnosu na nekontrolisane, i obrnuto.kontrolisanog faktora u odnosu na nekontrolisane, i obrnuto.
Prosečan broj poena u uzorcima međusobno se razlikuju. Do ove Prosečan broj poena u uzorcima međusobno se razlikuju. Do ove razlike može doći iz dva razloga:razlike može doći iz dva razloga:
Zbog razlika između aritmetičkih sredina osnovnih skupova, Zbog razlika između aritmetičkih sredina osnovnih skupova, što bi značilo da kontrolisani faktor sistematski utiče na što bi značilo da kontrolisani faktor sistematski utiče na varijabilitet posmatrane pojave,varijabilitet posmatrane pojave,
Usled slučajnih odstupanja uzoraka, bez obzira na jednakost ili Usled slučajnih odstupanja uzoraka, bez obzira na jednakost ili nejednakost aritmetičkih sredina skupova.nejednakost aritmetičkih sredina skupova.
Model analize varijanse sa jednim faktoromModel analize varijanse sa jednim faktorom
Model analize varijanse sa jednim faktorom formulisaćemo tako što Model analize varijanse sa jednim faktorom formulisaćemo tako što ćemo postaviti jednačinu za proizvoljnu opservaciju Xćemo postaviti jednačinu za proizvoljnu opservaciju X : :
Model analize varijanseModel analize varijanse Sa jednim faktorom X Sa jednim faktorom X ==µ + αµ + α + ε + ε
Gde je: Gde je:
XX jj-ta opservacija izabrana iz -ta opservacija izabrana iz ii-te populacije-te populacije µ Zajednička aritmetička sredina posmatranih populacija µ Zajednička aritmetička sredina posmatranih populacija α α Efekat i-tog tretmana Efekat i-tog tretmana ε ε Slučajna greška Slučajna greška
Ovaj model je Ovaj model je linearanlinearan, i prema njemu se svaka opservacija sastoji iz , i prema njemu se svaka opservacija sastoji iz tri tri aditivne aditivne komponente: dve neslučajne veličine µ i αkomponente: dve neslučajne veličine µ i α , i slučajne , i slučajne promenljive εpromenljive ε , preko koje se izražava uticaj nekontrolisanih faktora. , preko koje se izražava uticaj nekontrolisanih faktora.
Razlaganje ukupnog varijabilitetaRazlaganje ukupnog varijabiliteta
22
Ukupan (totalan) varijabilitet posmatrane pojave (promenljive X)Ukupan (totalan) varijabilitet posmatrane pojave (promenljive X) jednak je zbiru varijabiliteta nastalih pod dejstvom kontrolisanog jednak je zbiru varijabiliteta nastalih pod dejstvom kontrolisanog fakotra i varijabiliteta pod dejstavom rezidualnih (nekontrolisanih) fakotra i varijabiliteta pod dejstavom rezidualnih (nekontrolisanih) faktora.faktora.
Ukupno odstupanje (XUkupno odstupanje (X - - ).).
Ukupan varijabilitet SUkupan varijabilitet S = = ( X( X - - ))
Kvadriranjem i sređivanje izraza može se doći do matematičke Kvadriranjem i sređivanje izraza može se doći do matematičke formulacije ranije navedene relacije:formulacije ranije navedene relacije:
( X( X - - )) = = n n ( ( - - )) + + ( X( X - - ))
S S S S S S
Ukupan Faktorski Rezidualni Ukupan Faktorski Rezidualni Varijabilitet varijabilitet varijabilitetVarijabilitet varijabilitet varijabilitet
(ukupna (faktorska (rezidualna(ukupna (faktorska (rezidualnasuma kvadrata) suma kvadrata) suma kvadrata)suma kvadrata) suma kvadrata) suma kvadrata)
Pretpostavke analize varijansePretpostavke analize varijanse
Pretpostavke analize varijanse se razlikuju u zavisnosti od načina na Pretpostavke analize varijanse se razlikuju u zavisnosti od načina na koji su izabrani tretmani. U slučaju kada se nivoi faktorakoji su izabrani tretmani. U slučaju kada se nivoi faktora fiksiraju unapred fiksiraju unapred govori se o modelima sa govori se o modelima sa fiksiranim efektima.fiksiranim efektima. Ukoliko se nivoi faktora biraju Ukoliko se nivoi faktora biraju na slučajan način iz skupa mogućih nivoa, radi se o modelu sa na slučajan način iz skupa mogućih nivoa, radi se o modelu sa slučajnim slučajnim efektimaefektima i zaključci se mogu uopštiti sa sve nivoe. i zaključci se mogu uopštiti sa sve nivoe.
Korektno izvođenje zaključka na osnovu analize varijanse zahteva Korektno izvođenje zaključka na osnovu analize varijanse zahteva ispunjenost sledećih pretpostavki.ispunjenost sledećih pretpostavki.
1.1. NormalnostNormalnost. Slučajne greške ε. Slučajne greške ε imaju normalan raspored imaju normalan raspored
33
2.2. Homogenost varijansi (homoskedastičnost)Homogenost varijansi (homoskedastičnost). Sve slučajne . Sve slučajne imaju jednake varijanse:imaju jednake varijanse:
Var (εVar (ε ) = σ) = σ
3.3. E(εE(ε ) = 0) = 0 za svako za svako ii i i jj . Slučajne greške u proseku su jednake . Slučajne greške u proseku su jednake nuli.nuli.
4.4. Slučajne greške su međusobno nezavisne.Slučajne greške su međusobno nezavisne.
5.5. Aditivnost. Aditivnost. Svaka opservacija XSvaka opservacija X se može smatrati kao se može smatrati kao zbir zbir
tri komponente: µ, αtri komponente: µ, α i ε i ε
Prve tri pretpostavke možemo na jednostavniji način prikazati u Prve tri pretpostavke možemo na jednostavniji način prikazati u obliku:obliku:
εε : N (0, σ: N (0, σ ),),
Svi posmatrani osnovni skupovi imaju normalan raspored sa jednakimSvi posmatrani osnovni skupovi imaju normalan raspored sa jednakim varijansama σvarijansama σ . U skladu sa tim, homogenost varijansi znači:. U skladu sa tim, homogenost varijansi znači:
σσ = σ = σ = . . . = σ = . . . = σ = . . . . . = σ = . . . . . = σ = σ = σ ..
Postupak analize varijansePostupak analize varijanse
U opštem slučaju u jednofaktorskoj analiz varijanse nultu hipotezu U opštem slučaju u jednofaktorskoj analiz varijanse nultu hipotezu postavljamo u obliku:postavljamo u obliku:
HH : µ : µ = µ = µ = . . . = µ = . . . = µ = . . . = µ = . . . = µ = µ, = µ,
U odnosu na alternativnu:U odnosu na alternativnu:
H : aritmetičke sredine bar d va skupa se među sobom razlikuju.H : aritmetičke sredine bar d va skupa se među sobom razlikuju.
Ukoliko je nulta hipoteza istinita i ranije navedena pretpostavke Ukoliko je nulta hipoteza istinita i ranije navedena pretpostavke ispunjene, svi osnovni skupovi će se potupuno izjednačiti, pa će ispitivati ispunjene, svi osnovni skupovi će se potupuno izjednačiti, pa će ispitivati uzorci pripadati samo jendom osnovnom skupu, uzorci pripadati samo jendom osnovnom skupu, čija će aritmetička sredina čija će aritmetička sredina biti jednaka , a varijansa . Ukoliko je biti jednaka , a varijansa . Ukoliko je nulta hipoteza tačna, opservacije nulta hipoteza tačna, opservacije
44
varijaju samo pod uticajem nekontrolisanih faktora.varijaju samo pod uticajem nekontrolisanih faktora. Stoga nulta hipotezu Stoga nulta hipotezu možemo ekvivalentno formulisati u vidu:možemo ekvivalentno formulisati u vidu:
HH : α : α = α = α = . . . = α = . . . = α = . . . = α = . . . = α = 0. = 0.
Što znači da se nijedan metod nastave po svom efektu na uspeh ne Što znači da se nijedan metod nastave po svom efektu na uspeh ne razlikuje od drugih primenjenih metoda. Alternativna hipoteza u ovom razlikuje od drugih primenjenih metoda. Alternativna hipoteza u ovom slučaju glasi:slučaju glasi:
H : Efekat barem jednog tretmana se razlijuje od nule.H : Efekat barem jednog tretmana se razlijuje od nule.
Dakle, Dakle, ako je alternativna hipoteza tačna, tada opsrvacije variraju i ako je alternativna hipoteza tačna, tada opsrvacije variraju i pod uticajem kontrolisanog faktora.pod uticajem kontrolisanog faktora.
55
Faktorska i rezidualna varijansaFaktorska i rezidualna varijansa
Polazeći od opservacija uzoraka, formulisati dve takve ocene, Polazeći od opservacija uzoraka, formulisati dve takve ocene, odnosno mere varijabiliteta. Prva od njih je odnosno mere varijabiliteta. Prva od njih je ocena varijanse pojedinačnih ocena varijanse pojedinačnih skupova skupova i ukazuje na i ukazuje na varijacije nastale pod dejstvom nekontrolisanih varijacije nastale pod dejstvom nekontrolisanih faktora.faktora. Naziva se Naziva se rezidualnom varijansomrezidualnom varijansom (ili prosečnim kvadratom (ili prosečnim kvadratom greške). Oznaka je Vgreške). Oznaka je V . vidi se da je: . vidi se da je:
VV = ocena σ = ocena σ
Druga ocena, pored uticaja nekontrolisanih faktora, odražava i Druga ocena, pored uticaja nekontrolisanih faktora, odražava i eventualne eventualne varijacije nastale pod dejstvomkontrolisanog faktora.varijacije nastale pod dejstvomkontrolisanog faktora. Naziva se Naziva se faktorskom varijansomfaktorskom varijansom (ili prosečnim kvadratom tretmana). Obeležava se (ili prosečnim kvadratom tretmana). Obeležava se sa Vsa V . faktorskom varijansom merimo disperziju zajednikog skupa, pa je . faktorskom varijansom merimo disperziju zajednikog skupa, pa je ona jednaka:ona jednaka:
VV = ocena σ = ocena σ = ocena σ = ocena σ + ocena varijabiliteta između + ocena varijabiliteta između aritmetičkih sredina skupova. aritmetičkih sredina skupova.
Faktorska suma kvadrata, SFaktorska suma kvadrata, S , se dobija na osnovu odstupanja , se dobija na osnovu odstupanja pojedinih aritmetičkih sredina uzoraka, pojedinih aritmetičkih sredina uzoraka, , od njihove zajedničke , od njihove zajedničke aritmetičke sredine, aritmetičke sredine, . Kada se jednom izračuna . Kada se jednom izračuna , samo (, samo (r – 1r – 1) ) aritmetičkih sredina mogu slobodno da variraju, pa broj stepeni slobode aritmetičkih sredina mogu slobodno da variraju, pa broj stepeni slobode iznosi iznosi r – 1r – 1. stoga formula za faktorsku varijansu glasi:. stoga formula za faktorsku varijansu glasi:
Faktorska VFaktorska V = = = = , , ii = 1,2,..., = 1,2,...,rr
VarijansaVarijansa
66
Gde su: Gde su: n n veličina uzorka, veličina uzorka, r r broj uzoraka, broj uzoraka, r - 1r - 1 broj stepeni slobode, broj stepeni slobode, aritmetička sredina aritmetička sredina i-i-tog uzorka, a tog uzorka, a zajednička aritmetička sredina zajednička aritmetička sredina
svih uzoraka.svih uzoraka.
Kako je ukupan broj opservacija u uzorcima jednak Kako je ukupan broj opservacija u uzorcima jednak rnrn , broj stepeni , broj stepeni slobode iznosi slobode iznosi rn - rrn - r . Formula za rezidualnu varijansu stoga glasi: . Formula za rezidualnu varijansu stoga glasi:
Rezidualna Rezidualna
Varijansa VVarijansa V = = = = i i =1,2,...,=1,2,...,rr
J J = 1,2,...,= 1,2,...,rr
Statistika F testa i Snedecorov F rasporedStatistika F testa i Snedecorov F raspored
Prethodno izlaganje nam sugeriše da kao statistiku testa odaberemo Prethodno izlaganje nam sugeriše da kao statistiku testa odaberemo količnik varijansi Vkoličnik varijansi V /V/V ’ . takav kreterijum obeležava se sa F i naziva ’ . takav kreterijum obeležava se sa F i naziva statiskikom F testa: statiskikom F testa:
Statistika F =Statistika F =
F testaF testa
77
Kriva F sarpodela (6,6), (20,6) i (30,30) stepeni slobodeKriva F sarpodela (6,6), (20,6) i (30,30) stepeni slobode
F raspored spada u grupu neprekidnih teorijskih rasporeda. Definisan F raspored spada u grupu neprekidnih teorijskih rasporeda. Definisan je za realne brojeve od 0 do + ∞ , i asimetričan je udesno. Slično je za realne brojeve od 0 do + ∞ , i asimetričan je udesno. Slično tt rasporedu zavisi od broja stepeni slobode.rasporedu zavisi od broja stepeni slobode.
Sa slike se može uočiti da se asimetrija Sa slike se može uočiti da se asimetrija f f krive smanjuje sa krive smanjuje sa povećanjem broja stepeni slobode.povećanjem broja stepeni slobode.
Pošto vrednosti Pošto vrednosti f statistikef statistike koje su veće od 1 sugerišu neistinitost nulte koje su veće od 1 sugerišu neistinitost nulte hipoteze, kritična oblast nalazi se na desnoj strani rasporeda, dakle, u analizi hipoteze, kritična oblast nalazi se na desnoj strani rasporeda, dakle, u analizi varijanse se primenjuje varijanse se primenjuje jednosmeranjednosmeran test. test.
Odbacivanje nulte hipotezeOdbacivanje nulte hipoteze
Korišćenjem osobine aditivnosti, potrebne sume kvadrata Korišćenjem osobine aditivnosti, potrebne sume kvadrata izračunavamo na jednostavniji način:izračunavamo na jednostavniji način:
88
SS = =
SS = =
SS = S = S - S - S
gde su: Sgde su: S zbir podataka u zbir podataka u ii-tom uzorku, a -tom uzorku, a SS zbir podataka u svim zbir podataka u svim uzorcima.uzorcima.
Višestruka komparacijaVišestruka komparacija
Formulišemo takav metod poređenja parova uzoraka kod kojeg bi Formulišemo takav metod poređenja parova uzoraka kod kojeg bi stvarni nivo značajnosti bio jednak unapred postavljenom. stvarni nivo značajnosti bio jednak unapred postavljenom. To nam pružaju To nam pružaju tzv. Metoditzv. Metodi višestruke komparacije. višestruke komparacije. Njihova osnovna karakteristika je da Njihova osnovna karakteristika je da fiksiraju nivo značajnosti: ako unapred postavimo rizik greške α =0,05, bez fiksiraju nivo značajnosti: ako unapred postavimo rizik greške α =0,05, bez obzira na broj parova uzoraka koji se porede, stvarni nivo značajnosti ostaće obzira na broj parova uzoraka koji se porede, stvarni nivo značajnosti ostaće jednak 0,05.jednak 0,05.
U statističkoj literaturi je predloženo više različitih metoda za U statističkoj literaturi je predloženo više različitih metoda za višestuku komparaciju. Jedan od metoda koji se najčešće koristi jestevišestuku komparaciju. Jedan od metoda koji se najčešće koristi jeste Tukey- Tukey-ev testev test, zasnovan na , zasnovan na kriterijumukriterijumu T. U slučaju kada uzorci imaju jednak broj T. U slučaju kada uzorci imaju jednak broj elemenata, kriterijum T se određuje po formuli:elemenata, kriterijum T se određuje po formuli:
Tukey-evTukey-ev
Kriterijum T =QKriterijum T =Q
Gde su: QGde su: Q kritična vrednost i za nivo značajnosti α, V kritična vrednost i za nivo značajnosti α, V rezidualna rezidualna varijansa, a varijansa, a nn veličina pojedinačnog uzorka. veličina pojedinačnog uzorka.
Tukey-ev metod koristi se samo u slučaju kada smo prethodno na Tukey-ev metod koristi se samo u slučaju kada smo prethodno na osnovu statistike F odbacili nultu hipotezuosnovu statistike F odbacili nultu hipotezu. U tom slučaju ovaj metod . U tom slučaju ovaj metod garantuje da će otkriti statistički značajnu razliku bar između jednog para garantuje da će otkriti statistički značajnu razliku bar između jednog para aritmetičkih sredina.aritmetičkih sredina.
99
Analiza varijanse sa dva faktoraAnaliza varijanse sa dva faktora
Kada postoje indicije da na posmatranu pojavu bitno utiče više Kada postoje indicije da na posmatranu pojavu bitno utiče više faktora, primenjuje faktora, primenjuje modeli analize varijase sa dva i više faktora.modeli analize varijase sa dva i više faktora. Ja ću se Ja ću se zadržati samo na modelu sa dva kontrolisana faktora. Kontrolisane faktore zadržati samo na modelu sa dva kontrolisana faktora. Kontrolisane faktore označićemo sa A i B; pri tome faktor A ima označićemo sa A i B; pri tome faktor A ima rr različitih nivoa: A različitih nivoa: A , A, A , . . . ,A , . . . ,A , . . .,A, . . .,A , a faktor B, , a faktor B, ss različitih nivoa: B različitih nivoa: B , B, B , . . . , B, . . . , B , . . . , B, . . . , B
Teorijski model analize varijanse sa dva faktora (postavljen slučajan Teorijski model analize varijanse sa dva faktora (postavljen slučajan plan, uz jednu opservaciju za svaku kombinaciju nivoa faktora) postaviću naplan, uz jednu opservaciju za svaku kombinaciju nivoa faktora) postaviću na sledeći način:sledeći način:
Model analize varijanse Model analize varijanse ii = 1,2,...., = 1,2,...., rr Sa dva faktora X Sa dva faktora X =µ + α=µ + α + β + β + ε + ε j j = 1,2,....,= 1,2,....,ss
gde su:gde su:
X X Opservacija koja odgovara Opservacija koja odgovara ii-tom nivou faktora A i -tom nivou faktora A i jj-tom -tom nivou faktora B nivou faktora B µ zajednička artmetička sredina µ zajednička artmetička sredina α α efekat efekat ii-tog nivoa faktora A-tog nivoa faktora A β β efekat efekat jj-tog nivoa faktora B-tog nivoa faktora B ε ε slučajna greška. slučajna greška.
Pored pretpostavki koje su uvedene kod jednofaktorskog modela Pored pretpostavki koje su uvedene kod jednofaktorskog modela analize varijanse, ovde je potrebno uvesti dodatnu pretpostavku:analize varijanse, ovde je potrebno uvesti dodatnu pretpostavku:
Faktori A i B su aditivni (tj. nema interakcije faktora).Faktori A i B su aditivni (tj. nema interakcije faktora).U dvofaktorskoj analizi varijanse postavljam U dvofaktorskoj analizi varijanse postavljam dve dve nulte hipoteze. Prva nulte hipoteze. Prva
nulta hipoteza se odnosi na faktor A i glasi da se nivoi faktora A ne razlikujunulta hipoteza se odnosi na faktor A i glasi da se nivoi faktora A ne razlikuju po efektima na posmatranu pojavu, odnosno u našem primeru:po efektima na posmatranu pojavu, odnosno u našem primeru:
HH : α: α = α = α = α = α = α = α = 0, = 0,
Dok bi odgovarajuća alternativna hipoteza glasila:Dok bi odgovarajuća alternativna hipoteza glasila:
1010
HH : Efekat barem jednog nivoa fakotra A se razlikuje od nule.: Efekat barem jednog nivoa fakotra A se razlikuje od nule.
Druga nulta hipoteza se tiče faktora B i tvrdi da se nivoi faktora B ne Druga nulta hipoteza se tiče faktora B i tvrdi da se nivoi faktora B ne razlikuju po efektima na posmatranu pojavu, tj. u našem primeru:razlikuju po efektima na posmatranu pojavu, tj. u našem primeru:
HH : β: β = β = β = β = β = 0, = 0,
A odgovarajuća alaternativna, hipoteza glasi:A odgovarajuća alaternativna, hipoteza glasi:HH : Efekat barem jednog nivoa faktora B se razlikuje od nule: Efekat barem jednog nivoa faktora B se razlikuje od nule
Efekti narušavanja pretpostavki analize varijanseEfekti narušavanja pretpostavki analize varijanse
Na osnovu pretpostavki analize varijanse zaključujemo da ona spada uNa osnovu pretpostavki analize varijanse zaključujemo da ona spada u parametarske statističke metode.parametarske statističke metode. U najvećem broju radova se zaključuje U najvećem broju radova se zaključuje da će odstupanje od normalnosti skupova i homogenosti varijansi imati malida će odstupanje od normalnosti skupova i homogenosti varijansi imati mali efekat, pod uslovom da se primenjuju uzorci sa jednakim brojem elemenata.efekat, pod uslovom da se primenjuju uzorci sa jednakim brojem elemenata. Zbog toga se preporučuje da se pri izvođenju eksperimenta uzimaju uzorci Zbog toga se preporučuje da se pri izvođenju eksperimenta uzimaju uzorci iste veličine.iste veličine.
ZadaciZadaci
1111
Zadatak 1.Zadatak 1.
Osam stabala bresaka dalo je prinos u kilogramima: 20, 23, 31, 37, 40, 46, Osam stabala bresaka dalo je prinos u kilogramima: 20, 23, 31, 37, 40, 46, 49 i 53. Izračunaj varijansu49 i 53. Izračunaj varijansu
Prinos Prinos xx ((xx - - )) ((xx - - ))11 22 3320202323313137374040464649495353
-17-17-14-14-6-600339912121616
289289196196363600998181144144256256
299299 -- 10111011
= = = =
= 37.3 = 37.3
≈ 37 ≈ 37 [kg][kg]
ProseProsečan prinos bresaka po jednom stablu je 37 kilogramačan prinos bresaka po jednom stablu je 37 kilograma
µ = δµ = δ = =
σσ = = = 126,3 = 126,3
σσ = 126,3 = 126,3
Prosek kvadrata odstupanja pojedinačnih prinosa po stablu od Prosek kvadrata odstupanja pojedinačnih prinosa po stablu od prosečno prinosa bresaka iznosi 126,3prosečno prinosa bresaka iznosi 126,3
1212
Zadatak 2.Zadatak 2.
Na 185 parcela zasejanih pšenicom bačena je sledeća količina Na 185 parcela zasejanih pšenicom bačena je sledeća količina đubriva:đubriva:
Količina đubrivaKoličina đubriva (x (x ): ): 350-400 400-450 450-500 500-550 550-600350-400 400-450 450-500 500-550 550-600
Broj parcelaBroj parcela (f (f ) ) 10 30 40 45 60 10 30 40 45 60
Izračunaj varijansu:Izračunaj varijansu:
KoličinaKoličina đubrivađubriva
xx
Broj Broj parcelaparcela
f f
RazrednaRazredna sredinasredina
xx
xx - f- f (x(x -- )) (x(x -- )) ff (x (x -- ))
11 22 33 44 55 66 77350-400350-400400-450400-450450-500450-500500-550500-550550-600550-600
10103030404045456060
375375425425475475525525575575
375037501275012750190001900023625236253450034500
-131-131-81-81-31-3119196969
17161171616561656196196136136147614761
17161017161019683019683038440384401624516245285660285660
UkupnoUkupno 185185 -- 9362593625 -- -- 708785708785
= = = =
= 506; = 506; [kg/ha][kg/ha]
1313
σσ = = = = = 3831,27 = 3831,27
σσ = 3831,27 [kg/ha] = 3831,27 [kg/ha]
Zadatak 3.Zadatak 3.
Metod nastaveMetod nastave A A A A A A 35 35 38 4238 42 25 40 25 40 3939 38 36 45 38 36 45 26 35 26 35 38 38 36 36 31 4631 46 ∑ 160 180 210 ∑ 160 180 210Aritmetička Aritmetička =32 =32 =36 =36 =42=42Sredina Sredina UzorakaUzoraka
Zajednička aritmetička Zajednička aritmetička == =36,67=36,67
SredinaSredina
Na osnovu tabele gde je broj uzoraka 3 (Na osnovu tabele gde je broj uzoraka 3 (rr=3), a veličina svakog uzorka je 5 =3), a veličina svakog uzorka je 5 ((nn=5) izračunati vrednost faktorske varijanse iznosi:=5) izračunati vrednost faktorske varijanse iznosi:
VV = = == =126,67=126,67
A izračunata vrednost rezidualne varijanse:A izračunata vrednost rezidualne varijanse:
VV == == =20,17=20,17
1414
Zadatak Zadatak 4. 4.
Tip pakovanja ATip pakovanja AVrsta prodavnice BVrsta prodavnice B
AA A A A A A A SS SS
BB
BB
BB
80 86 89 6980 86 89 69
75 79 92 7275 79 92 72
70 78 86 6670 78 86 66
324324
318318
300300
104976104976
101124101124
9000090000
SSSS
225 243 267 207225 243 267 207
50625 59049 71289 4284950625 59049 71289 42849
S=942S=942
∑ S∑ S =223812=223812
∑ S∑ S =296100=296100
Kada je dvofaktorska analiza varijanse potrebno je odrediti tri nezavisne Kada je dvofaktorska analiza varijanse potrebno je odrediti tri nezavisne ocene nepoznate varijanse σocene nepoznate varijanse σ : dve fakotrkse varijanse i rezidualnu.: dve fakotrkse varijanse i rezidualnu.
SS = = ==
SS = = = =
SS = = xx - -
SS = S= S - (S - (S + S + S ) = 781-(657+78)=46) = 781-(657+78)=46
Izračunate vrednosti faktorskih i rezidualne varijanse iznosiće:Izračunate vrednosti faktorskih i rezidualne varijanse iznosiće:
VV = = = =
1515
VV = =
VV = =
Na nivou značajnosti od 0,05, uticaj faktora A na posmatranu pojavu iznosi:Na nivou značajnosti od 0,05, uticaj faktora A na posmatranu pojavu iznosi:
F=F=
Uticaj faktora B uz isti nivo značajnosti iznosi:Uticaj faktora B uz isti nivo značajnosti iznosi:
F =F =
Zadatak 5.Zadatak 5.
Tokom sedam dana posmatrana je prodaja jedne vrste prehrambenog Tokom sedam dana posmatrana je prodaja jedne vrste prehrambenog proizvoda u slučajnim uzorcima od 5 prodavnica i dobijeni su sledeći proizvoda u slučajnim uzorcima od 5 prodavnica i dobijeni su sledeći rezultati prdaje (u 000 din.)rezultati prdaje (u 000 din.)
‘’Srbijanka’’‘’Srbijanka’’ ‘’Soko Štark’’‘’Soko Štark’’ ‘’Josip Kraš’’‘’Josip Kraš’’20202525272730303030
34343737323234343535
20202828343420202525
Ispitati uz rizik greške o 0,05 da li kupci vode računa o poreklu proizvoda Ispitati uz rizik greške o 0,05 da li kupci vode računa o poreklu proizvoda prilikom kupovine.prilikom kupovine.
AA A A AA
1616
20 34 2020 34 20 25 37 28 25 37 28 27 32 34 27 32 34 30 34 20 30 34 20 30 35 25 30 35 25
SS 132 172 127 132 172 127SS 431 431
SS 17424 29584 16129 17424 29584 16129 ∑ S∑ S 6313763137
xx
400 1156 400 400 1156 400 625 1369 784625 1369 784729 1024 1156729 1024 1156900 1156 400900 1156 400900 1225 625900 1225 6253554 5930 33653554 5930 3365 x x = 12849 = 12849
SS = =
SS = =
SS = S = S - S - S = 465 – 243,33 = 221,6 = 465 – 243,33 = 221,6
VV = =
VV = =
F = F =
1717
FF =3,89 Odbacujemo H=3,89 Odbacujemo H , odnosno kupci vode računa o poreklu , odnosno kupci vode računa o poreklu proizvodaproizvoda
Zadatak 6. Zadatak 6.
Mesečna potrošnja jednog proizvoda u kg. Na osnovu uzoraka od po 6 Mesečna potrošnja jednog proizvoda u kg. Na osnovu uzoraka od po 6 domaćinstva, s obzirom na visinu dohotka, data je sledećom tabelom.domaćinstva, s obzirom na visinu dohotka, data je sledećom tabelom.
AA A A AA 2 3 52 3 5 6 8 11 6 8 11 7 9 12 7 9 12 8 11 14 8 11 14 9 13 15 9 13 15 11 14 12 11 14 12
SS 43 58 69 43 58 69SS=170=170
SS 1849 3364 4761 1849 3364 4761 ∑ S∑ S =9974=9974
xx
4 9 25 4 9 25 36 64 121 36 64 121 49 81 144 49 81 144 64 121 196 64 121 196 81 169 225 81 169 225121 196 144121 196 144 355 640 855 355 640 855 x x = 1850 = 1850
SS = =
SS = =
1818
SS = S = S - S - S =244,53– 56,77 = 187,66 =244,53– 56,77 = 187,66
VV = =
VV = =
F = F =
FF = 3,68 Visina dohotka ne utiče sistematski na varijabilitet mesečne = 3,68 Visina dohotka ne utiče sistematski na varijabilitet mesečne potrošnje tog proizvodapotrošnje tog proizvoda
Zadatak 7. Zadatak 7.
Broj neispravnih proizvoda u jednom pogonu, na osnovu slučajnog uzorka, sBroj neispravnih proizvoda u jednom pogonu, na osnovu slučajnog uzorka, s obzirom na vrstu mašie, dat je u tabeli:obzirom na vrstu mašie, dat je u tabeli:
AA AA AA
1010151517171313101099
181817172020141410101313
151517171919131318181414
AA A A AA 10 18 1510 18 15 15 17 17 15 17 17 17 20 19 17 20 19 13 14 13 13 14 13
1919
10 10 18 10 10 18 9 13 14 9 13 14
SS 74 92 96 74 92 96SS=262=262
SS 5476 8464 9216 5476 8464 9216 ∑ S∑ S =23156=23156
xx
100 324 225 100 324 225 225 289 289 225 289 289 289 400 361 289 400 361 169 196 169 169 196 169 100 100 324 100 100 324 81 169 196 81 169 196 964 1478 1564 964 1478 1564 x x = 4006 = 4006
SS = =
SS = =
SS = S = S - S - S =192,44– 45,77 = 146,66 =192,44– 45,77 = 146,66
VV = =
VV = =
F = F =
FF = 6,36 = 6,36FF = 3,68 = 3,68Prihvata se HPrihvata se H i za α=0,01 i za α=0,05 i za α=0,01 i za α=0,05
2020
Zadatak 8. Zadatak 8.
Slučajnim izborom dobijeni su sledeći rezultati o broju studenata koji su Slučajnim izborom dobijeni su sledeći rezultati o broju studenata koji su položili ispit iz statistike u junskom roku 1990. Godinepoložili ispit iz statistike u junskom roku 1990. Godine
Uspeh naUspeh na Kolokvijumu Kolokvijumu
Posećenost predavanjaPosećenost predavanjaStalno povremeno ne posećujeStalno povremeno ne posećuje
Do 65Do 6565 – 7565 – 7575 – 8575 – 8585 – 10085 – 100
10 6 1 10 6 1 15 8 3 15 8 3 20 11 5 20 11 5 30 15 2 30 15 2
A)ispitati uz rizik od 0,05 da li faktori na kolokvijumu i posećenost A)ispitati uz rizik od 0,05 da li faktori na kolokvijumu i posećenost predavanjima sistematski utiču na varijabilitet broja studenata koji su predavanjima sistematski utiču na varijabilitet broja studenata koji su položili ispit iz statistike.položili ispit iz statistike.b) izračunati Tukey-ov kriterijum za odgovarajući faktorb) izračunati Tukey-ov kriterijum za odgovarajući faktor
Posećenost Posećenost AAUspeh Uspeh B B
AA AA A A SS SS
BB
BB
BB
BB
110 0 6 6 1 1
115 5 8 8 3 3
220 0 11 11 55
30 15 230 15 2
1717
2626
3636
4747
289289
676676
12961296
22092209
2121
SSSS
7575 40 40 11 11
5625 1600 1215625 1600 121
S=S=126126
∑ S∑ S ==73467346
∑ S∑ S ==44704470
xx
100 36 1100 36 1225 64 9225 64 9400 121 25400 121 25900 225 4900 225 4
1625 446 391625 446 39 x x = 2110 = 2110
SS = = ==
SS = = = =
SS = = xx - -
SS = S= S - (S - (S + S + S ) = 78) = 7877-(-(513,5513,5++167167)=)=101066,5,5
VV = = = =
VV = =
VV = =
F=F=
F =F =
2222
FF =5,14 Faktor A utiče sistematski=5,14 Faktor A utiče sistematski
FF =4,76 Prihvata se H=4,76 Prihvata se H da faktor B ne utiče sistematski da faktor B ne utiče sistematski
b) Tb) T = Qα * = Qα *
Zadatak 9. Zadatak 9.
Na parcelama iste veličine, približno istog kvaliteta zasejane su 4 vrste Na parcelama iste veličine, približno istog kvaliteta zasejane su 4 vrste semena jedne kulture i korišćene 3 vrste đubriva. Sledeća tabela pokazuje semena jedne kulture i korišćene 3 vrste đubriva. Sledeća tabela pokazuje prinose slučajno odabranih parelaprinose slučajno odabranih parela
ĐubrivoĐubrivo Vrsta semenaVrsta semenaAA AA A A A A
BBBBBB
12 11 13 15 12 11 13 15 8 6 5 9 8 6 5 9 5 3 2 4 5 3 2 4
a)a) Ispitati na nivou značajnosti od 0,05 da li vrsta semena i đubriva utiču Ispitati na nivou značajnosti od 0,05 da li vrsta semena i đubriva utiču na varijabilitet prinosana varijabilitet prinosa
b)b) Da li bi neku vrstu semena, ili veštačkog đubriva preporučili?Da li bi neku vrstu semena, ili veštačkog đubriva preporučili?
Vrsta semena AVrsta semena AA A A AA A A A SS SS
Đubrivo B Đubrivo B
BB12 11 13 1512 11 13 15 5151 26012601
BB 8 6 5 9 8 6 5 9 2828 784784
2323
BB 5 3 2 4 5 3 2 4 1414 196196
SS 25 20 20 2825 20 20 28 S=93S=93∑ S∑ S
∑ S∑ S35813581
SS625 400 400 784625 400 400 784 22092209
xx
144 121 169 225 144 121 169 225 64 36 25 81 64 36 25 81 25 9 4 16 25 9 4 16
233 166 198 322233 166 198 322 x x = 919 = 919
SS = = ==
SS = = = =
SS = = xx - -
SS = S= S - (S - (S + S + S ) = ) = 198,25198,25-(-(15,5815,58++174,5174,5)=)=8,178,17
VV = = = =
VV = =
2424
VV = =
F=F=
F =F =
FF =4,76 Prihvata se H=4,76 Prihvata se H da vrsta ne utiče na varijabilitet prinosa da vrsta ne utiče na varijabilitet prinosa
FF =5,14 Odbacuje se H=5,14 Odbacuje se H da vrsta đubriva sistematski utiče na varijabilitet prinosa. da vrsta đubriva sistematski utiče na varijabilitet prinosa.
b) Tb) T = Qα * = Qα *
Zadatak 10. Zadatak 10.
Na slučajan način 10 paklica maslaca mase od 200 grama izmereno je, pri Na slučajan način 10 paklica maslaca mase od 200 grama izmereno je, pri čemu su dobijeni sledeći rezultati: 198, 199, 200, 201, 202, 203, 204, 205.čemu su dobijeni sledeći rezultati: 198, 199, 200, 201, 202, 203, 204, 205.Izračunati varijansu.Izračunati varijansu.
Masa Masa xx ((x - x - )) ((x - x - ))
11 22 33
198198 -3-3 99199199 -2-2 44200200 -1-1 11201201 00 00202202 11 11203203 22 44
2525
204204 33 99205205 44 1616
16121612 -- 4444
= = = =
= 201.5 = 201.5
≈ 201 ≈ 201 [g][g]
ProseProsečna masa maslaca od 10 paklica je 201 gramčna masa maslaca od 10 paklica je 201 gram
µ = δµ = δ = =
σσ = = = 5.5 = 5.5
σσ = 5.5 = 5.5Prosek kvadrata odstupanja pojedinačne mase maslaca od prosečne Prosek kvadrata odstupanja pojedinačne mase maslaca od prosečne mase maslaca iznosi 5.5mase maslaca iznosi 5.5
2626
LiteraturaLiteratura
1.1. Metod statističke analizeMetod statističke analizeDr Mileva Žižić, Dr Miodrag LovrićDr Mileva Žižić, Dr Miodrag LovrićDr Dubravka PavličićDr Dubravka Pavličić
2.2. Metodi statističke analize – Zbirka rešenih zadatakaMetodi statističke analize – Zbirka rešenih zadatakaDr Olga Bošković, Dr Miodrag LovrićDr Olga Bošković, Dr Miodrag LovrićDr Dubravka Pavličić, Mr Radmila DragutinovićDr Dubravka Pavličić, Mr Radmila Dragutinović
3.3. Zbirka rešenih zadataka iz opše statistikeZbirka rešenih zadataka iz opše statistike Mirjana M. Šekarić Mirjana M. Šekarić
2727