statisti Čki testovi (testovi znaČajnosti)

31
STATISTIČKI TESTOVI (TESTOVI ZNAČAJNOSTI)

Upload: cally-ramirez

Post on 31-Dec-2015

94 views

Category:

Documents


1 download

DESCRIPTION

STATISTI ČKI TESTOVI (TESTOVI ZNAČAJNOSTI). Subjektivna procena? NE!  STATISTIČKI TEST (Test značajnosti). parametrijski neparametrijski. t- test Ocena ‘ tačnosti ’ srednje vrednosti: Da li metoda daje tačne rezultate? Poređenje eksperimentalno određenog i očekivanog sastava - PowerPoint PPT Presentation

TRANSCRIPT

STATISTIČKI TESTOVI (TESTOVI ZNAČAJNOSTI)

t- testOcena ‘tačnosti’ srednje vrednosti:Da li metoda daje tačne rezultate?Poređenje eksperimentalno određenog i očekivanog sastavaOcena razlike dve srednje vrednosti

parametrijski neparametrijski

Subjektivna procena? NE!

STATISTIČKI TEST (Test značajnosti)

             William Gosset lived from 1876 to 1937 Gosset invented the t -test to handle small samples for quality control in brewing. He wrote under the name "Student".

NULTA HIPOTEZA, H0: Nema razlike između μ i x

Kolika je verovatnoća (P) da je razlika uslovljena SAMOslučajnim greškama?P tačnost nulte hipoteze

Obično: P < 1 : 20 (0,05 ili 5 %) nulta hipoteza se odbacuje tj. Razlika je značajna na nivou od 5%

Nulta hipoteza prihvaćena tačna= nije dokazano da je

pogrešna

s

nxt

t > tk odbacuje se nulta hipoteza

Poređenje dve srednje vrednosti:

BA

BA

n1

n1

s

xxt

2

11 22

BA

BBAA

nn

snsns 2nn BA

BnBs

AnAs

BxAxt

22

2

1n

ns

1n

ns

ns

ns

B

2

B

2B

A

22A

2

B

2B

A

2A

A

Paired t-test – “metoda diferencije”(uporedni t-test)

Nulta hipoteza: nema razlike između parova rezultata dobijenih dvema metodama

1n,s

nxt

d

d

Jednosmerno ili dvosmerno testiranje?

a) dvosmerni; b) i c) jednosmerni testovi:

Osenčeni deo = vrednosti koje se odbacuju

t-raspodela

Vrednost t za interval pouzdanosti od

90% 95% 98% 99%

Kritična t vrednost za P

vrednosti od 0,10 0,05 0,02 0,01

Broj stepeni slobode

1 6,31 12,71 31,82 63,66 2 2,92 4,30 6,96 9,92 3 2,35 3,18 4,54 5,84 4 2,13 2,78 3,75 4,60 5 2,02 2,57 3,36 4,03 6 1,94 2,45 3,14 3,71 7 1,89 2,36 3,00 3,50 8 1,86 2,31 2,90 3,36 9 1,83 2,26 2,82 3,25 10 1,81 2,23 2,76 3,17 12 1,78 2,18 2,68 3,05 14 1,76 2,14 2,62 2,98 16 1,75 2,12 2,58 2,92 18 1,73 2,10 2,55 2,88 20 1,72 2,09 2,53 2,85 30 1,70 2,04 2,46 2,75 50 1,68 2,01 2,40 2,68 1,64 1,96 2,33 2,58

Kritične t vrednosti odgovaraju dvosmernom testu. Za jednosmerni test vrednosti se uzimaju

iz kolona koje odgovaraju dvostruko većim vrednostima P. Npr. za jednosmerni test, P = 0,05, ν = 5, očitava se vrednost iz kolone za P = 0,10 koja iznosi 2,02.

F–test – poređenje standardnih devijacija

22

21

s

sF F > 1

Da li je jedna metoda preciznija od druge? Jednosmerni F-test

Kada F-test prethodi t-testu dvosmerni test

Grube greške i eliminisanje “spoljnih” rezultata

Gausov zakon: čak i najveće greške se mogu smatrati slučajnim(P jako malo)

Prave grube greške = greške analitičaraMogu se javiti uvekJako iskrivljuju krajnji rezultatGruba greška sistematska (zbog veličine i izolovanog javljanja)

Outlying results = outliers – “spoljni” rezultati

Grubbs-ov test

s

xxG n

n

ilis

xxG 1

1

G1, Gn > Gk eliminisanje rezultata

Dixon-ov Q-test

R

xxQ 1nn

n

iliR

xxQ 12

1

Qn ili Q1 > Qk eliminisati rezultat

Pažljivo sa “spoljnim” rezultatima!

a) Q7 (0,18) < Qk (0,57) Rezultat 2,9 “maskira” rezultat 3,1

Specijalni postupci opisani u odgovarajućoj literaturi

Npr. V. Barnett and T. Lewis, Outliers in Statistical Data

ANALIZA VARIJANSEANalysis Of VAriance ANOVA

Da li postoje razlike između nekoliko aritmetičkih sredina?

OSNOVNA IDEJA: Dokazati da li je varijabilitet MEĐU grupama veći od varijabiliteta UNUTAR grupa

DA Grupe ne pripadaju istoj populaciji

NE Grupe pripadaju istoj populaciji

Grupe pripadajuistoj populaciji

Grupe ne pripadajuistoj populaciji

Analiza varijanse = “rastavljanje” varijabiliteta svih dobijenih rezultata na interni varijabilitet unutar svake pojedine grupe i na varijabilitet između pojedinih grupa

Dve pretpostavke:• svi rezultati su normalno distribuirani• varijanse unutar grupa su homogene

isti uzorak različiti uslovi isti uzorak različite metode isti uzorak, ista metoda, različite laboratorije, ...

jednofaktorska višefaktorska

H0: srednje vrednosti ispitivanih grupa se međusobno ne razlikuju značajno

acceptedHFF tabledfdf

groupswithin

groupsbetween

0,2

2

21

H0 prihvaćena

Lab. Rezultati

A 102, 100, 101 101

B 101, 101, 104 102

C 97, 95, 99 97

D 90, 92, 94 92

Zajednička sr. vr. 98

x

Lab.

Y

Varijabilitet unutar grupa:

1

13

101101101100101102 2222A

3

13

102104102101102101 2222B

4

13

979997959797 2222C

4

13

929492929290 2222D

34

4431grupa-unutar2

0

ν = 8 (4 grupe x 2 stepena slobode)

U opštem slučaju: 1nh

xxj

2iij

i20

Tzv. Srednji kvadrat (MS)MS = 3 SS = 3x8 = 24

Varijabilitet između-grupa:Ako grupe pripadaju populaciji čija je varijansa σ0

2

njihova srednja vrednost pripada populaciji sa varijansom σ0

2/n

3

62

14

989298979810298101

n

222220

Onda je σ02 između-grupa = 62/3 × 3 = 62

U opštem slučaju:

1h

xxni

2i

20

Tzv. MSMS = 62; SS = 186

MS unutar grupa = 3, ν = 8MS između grupa = 62, ν = 3Nulta hipoteza: ove dve procene varijanse se ne razlikuju značajno

Da li je varijabilitet između grupa veći od varijabiliteta unutar grupa? jednosmerni F-test: F3,8 = 62/3 = 20,7

F > Fk (= 4,066; P = 0,05)ODBACUJE SE NULTA HIPOTEZA!

Najmanja značajna razlika = 1nhtn

2s

Za dati primer = 26,305,0306,23

23 P

A i B se ne razlikuju značajno!

χ2-test

Poredi teorijsku (očekivanu) i opaženu frekvenciju:

t

2to2

f

ff

Upotreba:• da li frekvencije jednog seta rezultata odstupaju od onih koje se očekuju u skladu sa određenom hipotezom• da li se frekvencije dva seta rezultata međusobno razlikuju

Uslov: pojedinačna ft > 5 (Yates-ova korekcija: fo-ft |fo-ft|-0,5

Još nešto o statističkim testovima

Da li je raspodela normalna?

• n ≥ 50 χ2

• tzv. papir verovatnoće

• Kolmogorov-Smirnovljev test

Normalna raspodela

Merenje

f

(%)

Papir verovatnoće

Greške pri testiranju hipoteza

Dve vrste grešaka:

1. Odbacivanje H0 kada je ona tačna (nivo značajnosti α)

greška prvog reda (tipa I)

2. Prihvatanje pogrešne H0 (odbacivanje tačne H1)

greška drugog reda (tipa II) - β