regresija i korelacija
Post on 14-Sep-2015
239 Views
Preview:
DESCRIPTION
TRANSCRIPT
-
Regresija i korelacija
-
Regresija i korelacija
Neke masovne pojave su meusobno povezane i uvjetovane
Cilj istraivanja odnosa meu pojavama je utvrditi statistiku ovisnost i pokazatelje jakosti takve ovisnosti
Za to se koriste metode regresijske i korelacijske analize
Regresija = statistiki odnos meu pojavama
Korelacija = uzajamna ovisnost
-
Funkcionalne i statistike veze
Funkcionalna veza = odnos koji se izraava analitiki jednadbom Svakoj vrijednosti jedne pojave odgovara tono odreena vrijednost druge
pojave.
Statistika (stohastika) veza = slabija od funkcionalne Svakoj vrijednosti jedne pojava odgovara vie razliitih vrijednosti druge
pojave.
npr. Sve osobe iste visine nemaju i istu teinu
-
Regresijska analiza
Regresijska analiza sastoji se u primjeni metoda kojima se analitiki (jednadbom) objanjava statistika veza izmeu promatranih pojava
Istrauje se uzrono-posljedini karakter veze jedna varijabla je uzrok (nezavisna varijabla), a druga je posljedica (zavisna varijabla)
Temelji se na regresijskom modelu = jednadbi s parametrima i varijablama kojima se objanjava povezanost promatranih pojava
Ako imamo samo jednu nezavisnu varijablu = jednostavni regresijski model
Ako imamo vei broj nezavisnih varijabli = model multiple ili viestruke regresije
-
Za statistiku analizu potrebno je izabrati: Empirijske vrijednosti za varijable X i Y
Oblik modela, tj funkciju f(X)
Pomono sredstvo za izbor funkcije je dijagram rasipanja
-
Dijagram rasipanja
-
Dijagram rasipanja
-
Dijagram rasipanja
-
Dijagram rasipanja
-
Korelacija
Meuzavisnost ili povezanost varijabli
Po smjeru korelacija moe biti pozitivna ili negativna
Pozitivna = rast jedne varijable prati rast druge varijable
Negativna = rast jedne varijable prati pad druge varijable
-
Zadaa regresijske analize:
Pronai analitiko-matematiki oblik veze izmeu jedne ovisne ili regresand varijable i jedne ili vie neovisnih ili regresorskih varijabli.
-
Model jednostavne linearne regresije
Ako su u analizi prisutne samo dvije varijable, onda se radi o jednostavnoj regresiji.
Na temelju uzorka parova varijabli X i Y crta se dijagram rasipanja
-
Model jednostavne linearne regresije
Jednostavna linearna regresija predstavlja odnos izmeu dvije pojave i to takav da promjenu jedne pojave prati priblino linearna promjena druge pojave
= + ,
gdje je deterministika komponenta, a je sluajna pogreka.
Deterministiki dio modela glasi:
= +
-
Model jednostavne linearne regresije Povuemo li na dijagramu rasipanja pravac, on je oblika
= +
Svaka toka dijagrama rasipanja zadovoljava jednadbu = + +
Odnosno svaka toka Yi odstupa od linije pravca za
-
Model jednostavne linearne regresije
Regresijska analiza trai parametre a i b tako da pravac prolazi izmeu stvarnih toaka promatranih varijabli i da najbolje tumai vezu izmeu njih, tj. pravac mora biti takav da odstupanja budu minimalna
Parametri se ocjenjuju metodom najmanjih kvadrata
-
Regresijska funkcija
= +
a = oekivana vrijednost zavisne varijable kad je nezavisna varijabla jednaka 0
b = prosjena promjena zavisne varijable kad se nezavisna varijabla promijeni za jedinicu mjere
-
Regresijska funkcija
Moe se postaviti i suprotna ovisnost u modelu, tj. zamijeniti zavisna i nezavisna varijabla
= + +
Analiza se provodi na isti nain, osim to u metodi najmanjih kvadrata X i Y mijenjaju mjesta.
-
Procjena parametara modela
Imamo n vrijednosti X i Y. Model se moe tada zapisati kao:
= + + = + =
Kriterij za izbor procjene parametara metodom najmanjih kvadrata:
=1
( )2 =
-
Parametri modela
= =1
=1
2 2, =
Regresijska funkcija:
= +
-
Drugi regresijski model
Analogno, zamjenom X i Y, tj zavisne i nezavisne varijable, dobije se drugi regresijski model s parametrima
= =1
=1
2 2, =
Regresijski model:
= +
-
Reprezentativnost linearne regresije
Varijanca regresije aritmetika sredina kvadrata rezidualnih odstupanja
2 =
=1 ( )
2
Standardna devijacija regresije prosjeni stupanj varijacije stvarnih
vrijednosti ovisne varijable u odnosu na oekivane regresijske vrijednosti
= =1
( )2
-
Reprezentativnost linearne regresije
Relativni pokazatelj reprezentativnosti regresijskog modela je koeficijent varijacije regresije
=
100
Ako je koeficijent varijacije manji od 10%, model se smatra dobrim (reprezentativnim).
-
Reprezentativnost linearne regresije
Odstupanja protumaena modelom (SP=ST-SR)
= =0
( )2
Ukupna odstupanja
= =0
( )2
Neprotumaena odstupanja
= =0
( )2
-
Reprezentativnost linearne regresije
Koeficijent determinacije R2 = omjer protumaenih i ukupnih odstupanja
2 =
= 1
Model je reprezentativniji to je R2 blie 1.
-
Procjena koeficijenta korelacije
Najpoznatija mjera je Pearsonov koeficijent linearne korelacije (r)
Kree se u intervalu od -1 do 1
-
Procjena koeficijenta korelacije
Rauna se kao
= 2
Ili
= =1
-
VANO!
Prije donoenja zakljuka provjeriti koeficijent varijacije regresije (je li zaista rije o linearnoj funkciji)
Kod donoenja zakljuka treba tumaiti i koeficijent determinacije i koeficijent korelacije
-
Primjer
top related