8-anova 2009
Post on 13-Apr-2016
7 Views
Preview:
DESCRIPTION
TRANSCRIPT
12008/2009 S. Spasić
STATISTIKA U FARMACIJISTATISTIKA U FARMACIJI
Analiza varijanse - ANOVAAnaliza varijanse - ANOVA
22008/2009 S. Spasić
Testovi za dve i više populacijaTestovi za dve i više populacija
dvedve i više i više populacijapopulacija
varijansavarijansasrednja srednja vrednostvrednost
F F ttestest
z-testz-testt-testt-test ANOVAANOVA
brojbrojuzorakauzoraka
22 nn
32008/2009 S. Spasić
F-test za odnos dve varijanseF-test za odnos dve varijanse
Parametarski testParametarski test
Testira razliku izmedju dve nezavisne populacione Testira razliku izmedju dve nezavisne populacione varijansevarijanse
Pretpostavka za test:Pretpostavka za test:
obe populacije su normalno distribuiraneobe populacije su normalno distribuirane
42008/2009 S. Spasić
F-test - postavljanje hipotezeF-test - postavljanje hipoteze
HipotezeHipotezeHH00: : 11
22 = = 2222 i i HH11: : 11
22 ≠≠ 2222
Izračunava seIzračunava se
Dve grupe stepena slobodeDve grupe stepena slobodedfdf11 = N = N11 - 1; - 1; df df22 = N = N22 - 1 - 1
Sledi F distribucijuSledi F distribuciju
22
212
2
21 SdSduslov,
Sd
SdF
52008/2009 S. Spasić
F-test - kritične vrednostiF-test - kritične vrednosti
00
odbacuje se Hodbacuje se H00
FF
αα/2/2αα/2/2
odbacuje se Hodbacuje se H00
prihvata se Hprihvata se H00
FFlevolevo FFdesnodesno
1,01,0
62008/2009 S. Spasić
F-test - RešenjeF-test - Rešenje
SdSd11 = 1,30 Sd = 1,30 Sd22 = 1,16 = 1,16
HH00: : 1122 = = 22
22
HH11: : 1122 22
22
αα 0,05 0,05
dfdf11 2 222 dfdf22 24 24
HH00 se prihvata, nema značajne razlike izmedju Sd se prihvata, nema značajne razlike izmedju Sd1122 i Sd i Sd22
22
1,251,161,30F 2
2
FF
0,0250,0250,0250,025
2,002,00
72008/2009 S. Spasić
F-test - RešenjeF-test - Rešenje
φ1 φ2
1 2 3 ... 18 22
1 161,4 199,5 215,7 ... 247,3 248,6
2 18,51 19,00 19,16 ... 19,44 19,45
3 10,13 9,55 9,28 ... 8,67 8,65
4 7,71 6,94 6,59 ... 5,82 5,79
... ... ... ... ... ... ...
22 1,30 3,44 3,05 ... 2,10 2,05
23 4,28 3,42 3,03 ... 2,08 2,02
24 1,26 3,40 3,01 ... 2,05 2,00
25 1,24 3,39 2,99 ... 2,04 1,98
FF0,05, 20, 240,05, 20, 24 = 2,00 – 2,05 F = 2,00 – 2,05 Fizrizr = 1,25 F = 1,25 Fizrizr < F < F0,050,05
HH00 se prihvata, nema značajne razlike izmedju Sd se prihvata, nema značajne razlike izmedju Sd1122 i Sd i Sd22
22
82008/2009 S. Spasić
Testovi za dve i više populacijaTestovi za dve i više populacija
Analiza varijanseAnaliza varijanse (ANOVA) (ANOVA)
F-testF-test
Tukey-Tukey-SnedecorSnedecor
testtest
JednofaktorskaJednofaktorska ANOVAANOVA
DvofaktorskaDvofaktorska ANOVAANOVA
Efekat Efekat interakcijainterakcija
92008/2009 S. Spasić
Student t-testStudent t-test
Student tStudent t-test-test – testiranje razlike između srednjih vrednosti – testiranje razlike između srednjih vrednosti 2 grupe podataka2 grupe podataka HH00 : : μμ11 = = μμ22 HH11 : : μμ11 ≠ ≠ μμ22 αα = 0,05 (nivo značajnosti testa) = 0,05 (nivo značajnosti testa) 0,05 (5%) – verovatnoća da se odbaci ispravna nulta 0,05 (5%) – verovatnoća da se odbaci ispravna nulta
hipotezahipoteza
greška tip Igreška tip I – odbacivanje ispravne nulte hipoteze – odbacivanje ispravne nulte hipoteze greška tip IIgreška tip II – prihvatanje neispravne nulte hipoteze – prihvatanje neispravne nulte hipoteze
102008/2009 S. Spasić
Student t-testStudent t-test
Testiranje razlike između srednjih vrednosti više grupa Testiranje razlike između srednjih vrednosti više grupa podatakapodataka potrebno izvođenje t-testa više putapotrebno izvođenje t-testa više puta
Koliko je potrebno t-testova?Koliko je potrebno t-testova? 3 grupe podataka: A, B i C – 3 t-testa3 grupe podataka: A, B i C – 3 t-testa
poređenja: A:B, A:C i B:Cpoređenja: A:B, A:C i B:C 4 grupe podataka: A, B, C i D – 6 t-testova4 grupe podataka: A, B, C i D – 6 t-testova
poređenja: A:B, A:C, A:D, B:C, B:D i C:Dpoređenja: A:B, A:C, A:D, B:C, B:D i C:D
112008/2009 S. Spasić
Istovremeno izvođenje više t-testovaIstovremeno izvođenje više t-testova
Kod izvođenja više t-testova javlja se “Kod izvođenja više t-testova javlja se “FFamilywise error amilywise error rate” problem (FWER)rate” problem (FWER) FWERFWER – verovatnoća da se neispravno odbaci – verovatnoća da se neispravno odbaci
najmanje jedna nulta hipoteza u grupi poređenjanajmanje jedna nulta hipoteza u grupi poređenja FWER = 1 – (1 – FWER = 1 – (1 – αα))kk
αα – nivo značajnosti testa – nivo značajnosti testa k – broj t-testovak – broj t-testova
Za 6 t-testova:Za 6 t-testova: FWER = 1 – (1 – 0,05)FWER = 1 – (1 – 0,05)66 = 1 – 0,735 = 0,265 = 27% = 1 – 0,735 = 0,265 = 27% 27% verovatnoće da napravimo najmanje jednu grešku 27% verovatnoće da napravimo najmanje jednu grešku
tip Itip I
122008/2009 S. Spasić
ANOVAANOVA
Analiza varijanse omogućava istovremeno testiranje Analiza varijanse omogućava istovremeno testiranje razlika između više srednjih vrednostirazlika između više srednjih vrednosti
Ispituje se jedna ili više nezavisnih varijabliIspituje se jedna ili više nezavisnih varijabli – faktora – faktora uticaja na zavisnu varijabluuticaja na zavisnu varijablu Jedan faktor uticaja – jednofaktorska ANOVAJedan faktor uticaja – jednofaktorska ANOVA Više faktora uticaja – višefaktorska ANOVA (multipla Više faktora uticaja – višefaktorska ANOVA (multipla
ANOVA – MANOVA)ANOVA – MANOVA) Svaki faktor uticaja ima više kategorija (grupa)Svaki faktor uticaja ima više kategorija (grupa)
132008/2009 S. Spasić
Jednofaktorska ANOVA - hipotezeJednofaktorska ANOVA - hipoteze
HH00: : 11 = = 22 = = 33
Sve populacione srednje vrednosti su jednakeSve populacione srednje vrednosti su jednake Faktor uticajaFaktor uticaja nema efekta nema efekta
HH11: : 11 22 33
HH11: : 11 = = 22 33
HH11: : 1 1 22 = = 33
HH11: : 1 1 == 33 22 HH11: : - - nisu sve jednakenisu sve jednake
Najmanje 1 srednja vrednost je različitaNajmanje 1 srednja vrednost je različita Postoji efekat Postoji efekat faktora uticajafaktora uticaja
142008/2009 S. Spasić
Jednofaktorska ANOVAJednofaktorska ANOVA
Sve srednje vrednosti su jednakeSve srednje vrednosti su jednake::Nulta hipoteza je ispravnaNulta hipoteza je ispravna
((nema efekta faktora uticajanema efekta faktora uticaja))
3210 μμμ:H
321 μμμ
jednakesveNisuμ:H1
152008/2009 S. Spasić
Najmanje jedna srednja vrednost je različitaNajmanje jedna srednja vrednost je različita::Nulta hipoteza nije ispravnaNulta hipoteza nije ispravna ((postoji efekat faktora uticajapostoji efekat faktora uticaja))
321 μμμ 321 μμμ
iliili
Jednofaktorska ANOVAJednofaktorska ANOVA
3210 μμμ:H
jednakesveNisuμ:H1
162008/2009 S. Spasić
Logika Analize varijanseLogika Analize varijanse
VVariarijjaacija (varijansa) izmeđucija (varijansa) između grup grupaa upoređuje se saupoređuje se sa varivarijacijom (varijansom) unutar jacijom (varijansom) unutar grupgrupaa Varijacija između grupaVarijacija između grupa je varijacija (razlika) između je varijacija (razlika) između
srednjih vrednosti koja je posledica uticaja uzorka i srednjih vrednosti koja je posledica uticaja uzorka i uticaja faktora koji se ispituje (ako postoji)uticaja faktora koji se ispituje (ako postoji)
Varijacija unutar grupaVarijacija unutar grupa je varijacija koja je posledica je varijacija koja je posledica uticaja uzorkauticaja uzorka
Ukupna varijacijaUkupna varijacija je zbir varijacije između grupa i je zbir varijacije između grupa i varijacije unutar grupavarijacije unutar grupa
172008/2009 S. Spasić
Jednofaktorska ANOVA - osnovna idejaJednofaktorska ANOVA - osnovna ideja
Uporedjivanje Uporedjivanje dva tipa varijacijedva tipa varijacije da bi se ocenila razlika da bi se ocenila razlika izmedju srednjih vrednostiizmedju srednjih vrednosti
Baza za poredjenje je Baza za poredjenje je odnos varijansiodnos varijansi
Zašto ANOVA?Zašto ANOVA?
Test baziran na varijansama je osetljiviji nego test Test baziran na varijansama je osetljiviji nego test baziran na srednjim vrednostimabaziran na srednjim vrednostima
ANOVA ANOVA ima manji rizik za grešku tip Iima manji rizik za grešku tip I
ANOVA ANOVA ima manji rizik za grešku tip IIima manji rizik za grešku tip II
182008/2009 S. Spasić
Jednofaktorska ANOVAJednofaktorska ANOVA
Pretpostavke za testPretpostavke za test
Eksperimentalne jedinice su slučajno odabraneEksperimentalne jedinice su slučajno odabrane Populacije su normalno distribuiranePopulacije su normalno distribuirane Homogenost varijansiHomogenost varijansi - - Populacije imaju jednake varijansePopulacije imaju jednake varijanse Podaci su izraženi intervalnom ili skalom odnosaPodaci su izraženi intervalnom ili skalom odnosa
192008/2009 S. Spasić
VarijansaVarijansa
1N
xxSd
2i2
2i xx
1N
Suma kvadrata odstupanja od srednje Suma kvadrata odstupanja od srednje vrednosti (suma kvadrata, SK)vrednosti (suma kvadrata, SK)
VarijansaVarijansa
Broj stepena slobode Broj stepena slobode
202008/2009 S. Spasić
Razdvajanje varijacijeRazdvajanje varijacije
mNSK
V ugug
1mSK
V igig
1NSKV tot
tot
varijansa između grupavarijansa između grupa
varijansa unutar grupavarijansa unutar grupa
ukupna varijansaukupna varijansa
Mere varijacije se dobijaju “razdvajanjem” ukupne varijacijeMere varijacije se dobijaju “razdvajanjem” ukupne varijacije
212008/2009 S. Spasić
Jednofaktorska ANOVA – F testJednofaktorska ANOVA – F test
Stepeni slobodeStepeni slobode dfdf11 = = mm – 1 ( – 1 (mm = = broj grupabroj grupa)) dfdf22 = = NN – – mm ( (NN = = ukupan broj podataka u svim grupama zajednoukupan broj podataka u svim grupama zajedno))
ug
ig
VV
F
HH00: : μμ11= = μμ22 = … = … = = μμcc
HH11: : μμ – najmanje jedna srednja vrednost je različita– najmanje jedna srednja vrednost je različita
222008/2009 S. Spasić
Kritične vrednosti FKritične vrednosti F
Ako su srednje vrednosti jednake, Ako su srednje vrednosti jednake, FF = =VVigig//VVugug 1 1
Odbacuje se HOdbacuje se H00 samo za veliko F samo za veliko F
Uvek jednostrani test!Uvek jednostrani test!
0
odbacuje se Hodbacuje se H00
F
prihvata se Hprihvata se H00
21 df,dfα,F
232008/2009 S. Spasić
Razdvajanje varijacijeRazdvajanje varijacije
UkupnaUkupna vari varijjaacciija (suma kvadrata odstupanja od srednje ja (suma kvadrata odstupanja od srednje vrednosti) može da se razdvoji u dva delavrednosti) može da se razdvoji u dva dela::
SSKKtottot = = ukupna suma kvadrata ukupna suma kvadrata
(ukupna(ukupna vari varijacija)jacija)
SSKKigig = = suma kvadrata između grupa suma kvadrata između grupa
(varijacija između grupa(varijacija između grupa))
SSKKugug = = suma kvadrata unutar grupa suma kvadrata unutar grupa
((varijacija unutar grupavarijacija unutar grupa))
SKtot = SKig + SKug
242008/2009 S. Spasić
Ukupna varijacijaUkupna varijacija
2i,n
2
2,1
2
1,1tot XXXXXXSKi
grupa 1 grupa 2 grupa 3
x
252008/2009 S. Spasić
Varijacija izmedju grupaVarijacija izmedju grupa
2cc
2
22
2
11ig XXnXXnXXnSK
grupa 1 grupa 2 grupa 3
x1x
2x
3x
262008/2009 S. Spasić
Varijacija unutar grupaVarijacija unutar grupa
2ii,n2
12,12
11,1ug XXXXXXSKi
grupa 1 grupa 2 grupa 3
1x2x
3x
272008/2009 S. Spasić
Faktori koji utiču na zaključakFaktori koji utiču na zaključak
Razlika između Razlika između srednjih vrednostisrednjih vrednosti
Veličina uzorkaVeličina uzorka
Varijacija unutar Varijacija unutar grupagrupa
ANOVAANOVA F F ++
++––
282008/2009 S. Spasić
Razlika između srednjih vrednostiRazlika između srednjih vrednosti
mala razlika između grupamala razlika između grupaNulta hipoteza se lako dokazujeNulta hipoteza se lako dokazuje
velika razlika između grupavelika razlika između grupaNulta hipoteza se teško dokazujeNulta hipoteza se teško dokazuje
292008/2009 S. Spasić
Veličina uzorkaVeličina uzorka
mali broj podataka u grupimali broj podataka u grupiNulta hipoteza se lako dokazujeNulta hipoteza se lako dokazuje
veliki broj podataka u grupiveliki broj podataka u grupiNulta hipoteza se teško dokazujeNulta hipoteza se teško dokazuje
302008/2009 S. Spasić
Varijacija unutar grupaVarijacija unutar grupa
velika varijacija unutar grupavelika varijacija unutar grupaNulta hipoteza se lako dokazujeNulta hipoteza se lako dokazuje
mala varijacija unutar grupamala varijacija unutar grupaNulta hipoteza se teško dokazujeNulta hipoteza se teško dokazuje
312008/2009 S. Spasić
ANOVA - izrazi za izračunavanjeANOVA - izrazi za izračunavanje
1N
xNΣxV22
suma kvadrata odstupanja od suma kvadrata odstupanja od srednje vrednosti - SKsrednje vrednosti - SK
broj stepena slobode - dfbroj stepena slobode - df
N
ΣxΣxN
ΣxNΣx
NΣxNΣx)x(NΣxSK
22
2
22
2222
C
322008/2009 S. Spasić
ANOVA - izrazi za izračunavanjeANOVA - izrazi za izračunavanje
igtotug
i
2i
2
22
1
21
ig
2tot
2
SKSKSK4.
Cn
Σx....
nΣx
nΣx
SK3.
CΣxSK2.
NΣxC1.
332008/2009 S. Spasić
ANOVA - sumarna tabelaANOVA - sumarna tabela
ug
ig
V
VF kritična vrednost Fkritična vrednost Fαα za df za df1 1 = m-1 i df= m-1 i df2 2 = N-m= N-m
342008/2009 S. Spasić
Jednofaktorska ANOVA- primerJednofaktorska ANOVA- primer
tip A tip B tip C
vreme (dani)
1,2 1,5 1,7 1,8 1,6 1,4
1,5 1,4 1,3 1,6 1,8 1,4
2,0 1,8 1,7 2,2 1,9 2,1
∑x 9,2 9,0 11,7
xsr 1,53 1,50 1,95
∑x2 14,34 13,66 22,99
Ispitivanje toksičnog delovanja leka na tri tipa ćelijaIspitivanje toksičnog delovanja leka na tri tipa ćelija
Prikazano je vreme (u danima) posle koga je ostalo 50% ćelijaPrikazano je vreme (u danima) posle koga je ostalo 50% ćelija
352008/2009 S. Spasić
Jednofaktorska ANOVA- primerJednofaktorska ANOVA- primer
0
0,5
1
1,5
2
2,5
grupe
dani
A B C
BxAx
Cx
x
HH00: : AA = = BB = = CC
HH11: : - - nisu sve nisu sve jednakejednake
= = 00,,0505
dfdf1 1 = 2 i df= 2 i df2 2 = 15= 15
362008/2009 S. Spasić
ANOVA – primer 1ANOVA – primer 1
568333,0754445,0322778,1
754445,010,92,9
322778,1C99,50)99,2266,131
1801,894,9
ug
222
ig
tot
2
SK4.
C-50,421667C6,71
66SK3.
C4,34(SK2.
49,66722218
11,7)0(9,2C1.
372008/2009 S. Spasić
ANOVA – primer 1ANOVA – primer 1
953,90,03790,3772F
FF0,050,05 = 3,68 za df = 3,68 za df1 1 = 2 i df= 2 i df2 2 = 15= 15
Nulta hipoteza se odbacuje, negde postoji Nulta hipoteza se odbacuje, negde postoji razlika izmedju srednjih vrednosti !razlika izmedju srednjih vrednosti !
F0 3,68
382008/2009 S. Spasić
ANOVA – Tukey-Snedecor test ANOVA – Tukey-Snedecor test
292,007947,0
07947,0
3,67D
60,03789S3,67Q6n
N
nN
1m1n
n
VSQSD
x
2ug
xx
392008/2009 S. Spasić
ANOVA – Tukey-Snedecor testANOVA – Tukey-Snedecor test
xx
f(x)f(x)
μμAAμμBB μ μ33
CBCABA xxxxxx
402008/2009 S. Spasić
ANOVA – Tukey-Snedecor testANOVA – Tukey-Snedecor test
412008/2009 S. Spasić
ANOVA – primer 2ANOVA – primer 2
grupa Agrupa A grupa Bgrupa B grupa Cgrupa C grupa Dgrupa D2,512,51 2,492,49 2,502,50 2,522,522,512,51 2,502,50 2,492,49 2,522,522,522,52 2,532,53 2,482,48 2,532,532,522,52 2.502.50 2,482,48 2,512,512,502,50 2,502,50 2,472,47 2,522,522,532,53 2,522,52 2,482,48 2,532,532,522,52 2,522,52
2,522,52nn 77 66 66 88xxsrsr 2,5162,516 2,5072,507 2,4832,483 2,5212,521
ΣΣxx 17,6117,61 15,0415,04 14,914,9 20,1720,17ΣΣxx22 44,302344,3023 37,701437,7014 37,002237,0022 50,853950,8539
HH00: : AA = = BB = = CC = = DD
HH11: : - - nisu sve jednake nisu sve jednake
= = 00,,0505
dfdf1 1 = 3 i df= 3 i df2 2 = 23= 23
422008/2009 S. Spasić
ANOVA - primerANOVA - primer
0,0025260,0054740,008SK4.
0,005474C8
20,176
14,96
15,047
17,61SK3.
0,00801CSK2.
169,851827
20,17)14,9015,04(17,61C1.
ug
2222
ig
tot
2
)8539,500022,377014,373023,44(
432008/2009 S. Spasić
ANOVA - primerANOVA - primer
591,610,00011
0,001825F
FF0,050,05 = 3,03 za df = 3,03 za df1 1 = 3 i df= 3 i df2 2 = 23= 23
Nulta hipoteza se odbacuje, negde postoji Nulta hipoteza se odbacuje, negde postoji razlika izmedju srednjih vrednosti !razlika izmedju srednjih vrednosti !
F0 3.03
442008/2009 S. Spasić
ANOVA - Tukey-Snedecor testANOVA - Tukey-Snedecor test
0,0163,9260,00405D
0,004056,716
0,00011S3,926Q6,716n
Nn
N1m
1nn
VSQSD
x
2ug
xx
452008/2009 S. Spasić
ANOVA - Tukey-Snedecor testANOVA - Tukey-Snedecor test
x
f(x)
μA=μB=μD μC
CDBA xxxx
462008/2009 S. Spasić
ANOVA - Tukey-Snedecor testANOVA - Tukey-Snedecor test
top related