kvantili, mere sredine, regresija, korelacija
TRANSCRIPT
8/18/2019 Kvantili, mere sredine, regresija, korelacija
http://slidepdf.com/reader/full/kvantili-mere-sredine-regresija-korelacija 1/30
KLIMATOGEOGRAFIJAvaje
Pripravil: doc. dr. Matej Ogrin
Poglavje 4: Kvantili, mere sredine, regresija, korelacija
8/18/2019 Kvantili, mere sredine, regresija, korelacija
http://slidepdf.com/reader/full/kvantili-mere-sredine-regresija-korelacija 2/30
• V klimatoloških in tudi hidroloških poročilih pogosto uporabljamo osnovnestatistične obdelave podatkov, zato je njihovo poznavanje nujno pri interpretacijiin razumevanju dogajanja v naravi. Osnove statističnih obdelav klimatskihpodatkov
• Rangi in kvantiliImamo množico podatkov števila dni s snežno odejo na postaji Planina pod Golicov obdobju 1979 -2009.
• Absolutni rangRanžirna vrsta: rezultate populacije razvrstimo po velikosti. Vsako leto ima nekozaporedno številko v ranžirni vrsti ali RANG. Z drugimi besedami nam pove,katera po vrsti je neka vrednost (Sagadin, 2003).
• Če ranžirno vrsto urediš od najmanjše vrednosti do največje, potem ima rang 1leto z najmanjšim številom dni s snežno odejo in rang 30 ima leto z največjimštevilom dni s snežno odejo.
2
Matej Ogrin, Oddelek za geografijo FF UL
8/18/2019 Kvantili, mere sredine, regresija, korelacija
http://slidepdf.com/reader/full/kvantili-mere-sredine-regresija-korelacija 3/30
• Absolutni rangi si v našem primeru sledijo v zaporedju 1, 2, ..29,30. Enotskirazmik ranga 1 je med 0,5 in 1,5, enotski razmik ranga 2 pa med 1,5 in 2,5, itn.To pomeni, da je rang 1 definiran med vrednostjo ranga 0,5 in 1,5, rang 2 pamed vrednostjo 1,5 in 2,5, itn.
• Relativni rangdobimo kot razmerje med absolutnim rangom in številom enotpopulacije (N). V razmerje vzamemo spodnjo mejo ustreznega enotskegarazmika. Pove nam, kolikšen del populacije je nad oziroma pod neko vrednostjo.Relativni rang torej vedno primerjamo s populacijo, absolutni rang pa nam povele katera po vrsti je neka vrednost (Sagadin, 2003, str. 41).
N R
P 5,0•Torej:
R = absolutni rangR - 0,5 je spodnja meja absolutnega ranga oziroma enotskega razmika
Relativni rang P imenujemo kvantilni rang in nam pove, koliki del populacijeima manjše rezultate, kot je ta vrednost ( Sagadin, 2003, str. 42).
3
Matej Ogrin, Oddelek za geografijo FF UL
8/18/2019 Kvantili, mere sredine, regresija, korelacija
http://slidepdf.com/reader/full/kvantili-mere-sredine-regresija-korelacija 4/30
KVARTILI, DECILI, CENTILIKvartili
Prvi kvartil je kvantil, s kvantilnim rangom 0,25. Pomeni, da ima 25 % vrednosti v populacijinižjo vrednost. Drugi kvartil je kvantil s kvantilnim rangom 0,50 in tretji kvartil ima vrednostkvantilnim rangom 0,75.
Q1 = x0,25;Q2 = x0,50,Q3 = x0,75;
Kvartili torej razdelijo populacijo na 4 po velikosti enake dele – na četrtine.
Drugi kvartil imenujemo tudimediana. Mediana je torej srednja vrednost po položaju,kar pomeni, da ima pol populacije višjo vrednost, pol pa nižjo od mediane.
4
Matej Ogrin, Oddelek za geografijo FF UL
8/18/2019 Kvantili, mere sredine, regresija, korelacija
http://slidepdf.com/reader/full/kvantili-mere-sredine-regresija-korelacija 5/30
Decili• Prvi decil je kvantil, s kvantilnim rangom 0,10, Drugi decil je kvantil, s kvantilnimrangom 0,20, …deveti decil pa ima kvantilni rang 0,90. Označimo jih z D1, D2, D3,
…D9. Decili torej razdelijo populacijo na 10 enakih delov – na desetine (N/10).
• D1 = x0,10;• D2 = x0,20,• …
• D9 = x0,90;Centili• Centili pa razdelijo populacijo na 100 po velikosti enakih delov – na stotine
(N/100).• Cn1 = x0,01;• Cn2 = x0,02,
• …• Cn10= x0,10• …
• Cn99 = x0,99
• Deseti centil se ujema s prvim decilom, dvajseti z drugim, …petdeseti centil seujema s petim decilom in drugim kvartilom ter mediano, itn. 5
Matej Ogrin, Oddelek za geografijo FF UL
8/18/2019 Kvantili, mere sredine, regresija, korelacija
http://slidepdf.com/reader/full/kvantili-mere-sredine-regresija-korelacija 6/30
Srednje vrednosti
• Mediana: srednja vrednost po položaju – gre za vrednost, ki delipopulacijo na pol;
• Modus: vrednost, ki se največkrat pojavi;
• Aritmetična sredina: seštevek vseh vrednosti, deljen s številom vsehvrednosti;
6
Matej Ogrin, Oddelek za geografijo FF UL
8/18/2019 Kvantili, mere sredine, regresija, korelacija
http://slidepdf.com/reader/full/kvantili-mere-sredine-regresija-korelacija 7/30
Mere razpršenostiVrednosti enot populacije se odklanjajo od srednje vrednosti populacije navzgorin navzdol. Pravimo, da variirajo okoli srednje vrednosti.Poznamo več mer variacije v populaciji, ki jih delimo na razmike ter odklone:
• Variacijski razmik: je razpon med največjo in najmanjšo vrednostjo;
x max– xmin
• Kvartilni razmik:
Q3–Q1Kvartilni razmik je razlika med tretjim in prvim kvartilom, torej obsega srednjih50 % vrednosti populacije. 25 % najmanjših in 25 % največjih vrednosti je zunajnjega. Je stabilnejša mera variacije, saj nanj ne vplivajo skrajne vrednosti.
7
Matej Ogrin, Oddelek za geografijo FF
8/18/2019 Kvantili, mere sredine, regresija, korelacija
http://slidepdf.com/reader/full/kvantili-mere-sredine-regresija-korelacija 8/30
• Decilni razmik:Je razlika med devetim in prvim decilom. Je tudi neodvisen od skrajnih vrednosti.D9 – D1
• Kvartilni odklon: je polovica kvartilnega razmika;
Q = (Q3 – Q1) /2
• Povprečni absolutni odklon(pravimo mu tudi: povprečni odklon, povprečnaabsolutna deviacija, srednji odklon);
Je aritmetična sredina absolutnih vrednosti odklonov vseh rezultatov xi odnjihove aritmetične sredine M.
N
M xiP
N
i M
1
8
Matej Ogrin, Oddelek za geografijo FF UL
8/18/2019 Kvantili, mere sredine, regresija, korelacija
http://slidepdf.com/reader/full/kvantili-mere-sredine-regresija-korelacija 9/30
VARIANCAJe aritmetična sredina kvadratov odklonov vseh rezultatov xi odnjihove aritmetične sredine M.
Standardni odklon ali standardna deviacija pa jekvadratni koren iz variance.
2
σσ
N
M x N
ii
1
2
2)(
σ
9
Matej Ogrin, Oddelek za geografijo FF UL
8/18/2019 Kvantili, mere sredine, regresija, korelacija
http://slidepdf.com/reader/full/kvantili-mere-sredine-regresija-korelacija 10/30
7,993
4,952
3,68
σ
σ
σ
x
x
x % enot populacije
% enot populacije% enot populacije
Za normalno porazdelitev velja, da je v intervalih:
10
Matej Ogrin, Oddelek za geografijo FF UL
Povzeto po Sagadin, 2003, str. 88
8/18/2019 Kvantili, mere sredine, regresija, korelacija
http://slidepdf.com/reader/full/kvantili-mere-sredine-regresija-korelacija 11/30
Uporaba v klimatologiji:
“Povprečna temperatura je bila 0,2 °C nad dolgoletnim povprečjem,kar je v okviru običajne spremenljivosti, saj znaša standardni odklon 1,4 °C .“
ali
Povprečna temperatura je bila 3,4 °C pod dolgoletnim povprečjem, karpomembno presega običajno spremenljivost, saj znaša standardni odklon 1,4 ° C”Ali je nek odklon običajen ali ne, se navadno kaže s standardnim odklonom. Ni vsakodklon statistično značilen in pomemben, njegovo pomembnost pove primerjava sstandardnim odklonom. Velika večina vrednosti se razlikuje od povprečne vrednosti, aso znotraj standardnega odklona in s tega vidika so odkloni teh vrednostistatistično nepomembni.
11Matej Ogrin, Oddelek za geografijo FF UL
8/18/2019 Kvantili, mere sredine, regresija, korelacija
http://slidepdf.com/reader/full/kvantili-mere-sredine-regresija-korelacija 12/30
Primer:Število dni s snežno odejo na Planini pod Golico
0
20
40
60
80
100
120
140
1 9 7 9
/ 1 9 8
0
1 9 8 0
/ 1 9 8
1
1 9 8 1
/ 1 9 8
2
1 9 8 2
/ 1 9 8
3
1 9 8 3
/ 1 9 8
4
1 9 8 4
/ 1 9 8
5
1 9 8 5
/ 1 9 8
6
1 9 8 6
/ 1 9 8
7
1 9 8 7
/ 1 9 8
8
1 9 8 8
/ 1 9 8
9
1 9 8 9
/ 1 9 9
0
1 9 9 0
/ 1 9 9
1
1 9 9 1
/ 1 9 9
2
1 9 9 2
/ 1 9 9
3
1 9 9 3
/ 1 9 9
4
1 9 9 4
/ 1 9 9
5
1 9 9 5
/ 1 9 9
6
1 9 9 6
/ 1 9 9
7
1 9 9 7
/ 1 9 9
8
1 9 9 8
/ 1 9 9
9
1 9 9 9
/ 2 0 0 0
2 0 0 0
/ 2 0 0 1
2 0 0 1
/ 2 0 0 2
2 0 0 2
/ 2 0 0 3
2 0 0 3
/ 2 0 0 4
2 0 0 4
/ 2 0 0 5
2 0 0 5
/ 2 0 0 6
2 0 0 6
/ 2 0 0 7
2 0 0 7
/ 2 0 0 8
2 0 0 8
/ 2 0 0 9
zima
š t . d n
i
1979/1980 110 1989/1990 7 1999/2000 107
1980/1981 109 1990/1991 110 2000/2001 54
1981/1982 118 1991/1992 35 2001/2002 61
1982/1983 66 1992/1993 42 2002/2003 85
1983/1984 108 1993/1994 57 2003/2004 101
1984/1985 96 1994/1995 93 2004/2005 88
1985/1986 121 1995/1996 115 2005/2006 121
1986/1987 107 1996/1997 83 2006/2007 80
1987/1988 78 1997/1998 45 2007/2008 83
1988/1989 15 1998/1999 115 2008/2009 12112
Vir: ARSO
Vir: ARSO
Matej Ogrin, Oddelek za geografijo FF UL
8/18/2019 Kvantili, mere sredine, regresija, korelacija
http://slidepdf.com/reader/full/kvantili-mere-sredine-regresija-korelacija 13/30
1989/1990 7 1994/1995 93
1988/1989 15 1984/1985 96
1991/1992 35 2003/2004 101
1992/1993 42 1986/1987 107
1997/1998 45 1999/2000 107
2000/2001 54 1983/1984 108
1993/1994 57 1980/1981 109
2001/2002 61 1979/1980 110
1982/1983 66 1990/1991 110
1987/1988 78 1995/1996 115
2006/2007 80 1998/1999 115
1996/1997 83 1981/1982 118
2007/2008 83 1985/1986 121
2002/2003 85 2005/2006 121
2004/2005 88 2008/2009 121
Variacijski razmik: 121 – 7 = 114
To pomeni, da je razlika med najbolj in najmanj sneženo zimo kar 114 dni.
Kakšne so torej zime?;Aritmetična sredina: 84,4 dni;
13
Vir: ARSO
Matej Ogrin, Oddelek za geografijo FF UL
8/18/2019 Kvantili, mere sredine, regresija, korelacija
http://slidepdf.com/reader/full/kvantili-mere-sredine-regresija-korelacija 14/30
• Povprečni absolutni odklon: 26 dni – nam pomeni, da je povprečno odstopanje od povprečja 26dni.
• Standardni odklon: 31,7 dni:
• 84,4 ± 31, 7 = 52,7 in 116,1
• Vsaka zima, ki ima število dni s snežno odejo od 53 – 116 dni je običajna glede naspremenljivost snežne odeje, saj je znotraj standardnega odklona.
• Kvartilni razmik: Q3 – Q1 = 110 – 61 = 49
14
Matej Ogrin, Oddelek za geografijo FF UL
8/18/2019 Kvantili, mere sredine, regresija, korelacija
http://slidepdf.com/reader/full/kvantili-mere-sredine-regresija-korelacija 15/30
Korelacija in regresija
• Poznamo funkcijsko odvisnost Y = f(x).
• Y = f(x) – kaže tesno in nedvoumno zvezo med spremenljivkama;
• Če so vse f(x) na eni premici– povezava je linearna;
• Če pojava nista tesno oziroma funkcijsko povezana, sta pa povezana, govorimo oSPLOŠNI TENDENCI ODVISNOSTI oziroma o POVEZANOSTI.
• Če se splošna tendenca odvisnosti kaže med dvema spremenljivkama, govorimo, da je med njima KORELACIJA oziroma, da med njima obstaja STATISTIČNAPOVEZANOST oziroma STOHASTIČNA POVEZANOST.
15
Matej Ogrin, Oddelek za geografijo FF UL
8/18/2019 Kvantili, mere sredine, regresija, korelacija
http://slidepdf.com/reader/full/kvantili-mere-sredine-regresija-korelacija 16/30
Korelacija je lahko:• Pozitivna: če z naraščanjem ene spremenljivke narašča tudi druga;
• Negativna: če z naraščanjem ene spremenljivke druga upada;
• Linearna: če je regresijska črta, ki kaže povezanost med spremenljivkama
ravna;• Krivuljčna ali nelinearna: če je regresijska črta, ki kaže povezanost, krivulja;
Funkcijska povezanost; y = f(x);
Y = k x + n;člen k pomeni strmino premice, oziroma pove za koliko se spremeni y na
enoto x;člen n pa pomeni višino premice v točki x = 0.
16
Matej Ogrin, Oddelek za geografijo FF UL
8/18/2019 Kvantili, mere sredine, regresija, korelacija
http://slidepdf.com/reader/full/kvantili-mere-sredine-regresija-korelacija 17/30
Potek temperature ob toplotnem obratu
0,0
2,0
4,0
6,0
8,0
10,0
12,0
0 100 200 300 400 500 600
relativna višina
T ( ˚ C )
Spremenljivki T in relativna višina sta tesno povezani, med njima obstajakorelacija, a o strogi funkcijski povezavi ne moremo govoriti, saj vrednosti odvisnespremenljivke niso vse na isti premici.
Potek temperature ob toplotnem obratu
0,0
2,0
4,0
6,0
8,0
10,0
12,0
1 0 0
1 2 0
1 4 0
1 6 0
1 8 0
2 0 0
2 2 0
2 4 0
2 6 0
2 8 0
3 0 0
3 2 0
3 4 0
3 6 0
3 8 0
4 0 0
4 2 0
4 4 0
4 6 0
4 8 0
5 0 0
relativna višina
T ( ˚ C )
Funkcijska povezanost; y = f(x); Y = 0,16 x + 3,2
17
Matej Ogrin, Oddelek za geografijo FF UL
8/18/2019 Kvantili, mere sredine, regresija, korelacija
http://slidepdf.com/reader/full/kvantili-mere-sredine-regresija-korelacija 18/30
Potek temperature z višino
-3,0
-2,5
-2,0
-1,5
-1,0
-0,5
0,0
0,5
0 100 200 300 400 500 600
relativna višina
T ( ˚ C )
Primer negativne korelacije. Neodvisna spremenljivka raste, odvisna pada.
18
Matej Ogrin, Oddelek za geografijo FF UL
8/18/2019 Kvantili, mere sredine, regresija, korelacija
http://slidepdf.com/reader/full/kvantili-mere-sredine-regresija-korelacija 19/30
0
2
4
6
8
10
12
14
16
18
0 100 200 300 400 500 600 700
Korelacije med spremenljivkama ni, kar pomeni, da spreminjanje enene vpliva na spremembo druge spremenljivke. Pojava nista povezana.
19
Matej Ogrin, Oddelek za geografijo FF UL
8/18/2019 Kvantili, mere sredine, regresija, korelacija
http://slidepdf.com/reader/full/kvantili-mere-sredine-regresija-korelacija 20/30
• Enačba regresijske premice (Ferligoj, 1995)Ugotovili smo že, da povezava pri pojavih ni funkcijska temveč gre za korelacijosaj točke ne ležijo na isti premici.
• Poiščemo tisto premico, ki “v največji možni meri” upošteva vse vrednosti.
• Enačba regresijske premice:• Regresijska funkcija Y’ = f(X) kaže, kakšen bi bil vpliv spremenljivke X na Y,
razen spremenljivke X ne bi bilo drugih vplivov na spremenljivko Y. Ker pa soponavadi še drugi vplivi na proučevano spremenljivko Y, se točke, ki predstavljenote v razsevnem grafikonu, odklanjajo od idealne regresijske krivulje:
Y = Y’ +E = f(x) + E
• X imenujemo neodvisna spremenljivka, Y pa odvisna, E pa člen motnje, lahko napake;
20
Matej Ogrin, Oddelek za geografijo FF UL
8/18/2019 Kvantili, mere sredine, regresija, korelacija
http://slidepdf.com/reader/full/kvantili-mere-sredine-regresija-korelacija 21/30
• Če je regresijska odvisnost linearna:• Y’ = f(X) = a + bX
• Tedaj je regresijska odvisnost:• Y = Y‘ + E = a + bX + E
• Oziroma za i-ti člen:• Yi= y‘i + ei = a + bxi + ei
V razsevnem grafikonu poiščemo tisto krivuljo, ki se najbolj prilega točkam. Kotmerilo prilagojenosti krivulje točkam vzamemo:
• To metodo imenujemo metoda najmanjših kvadratov.
min)'( 2
11
2 N
iii
N
i y ye
21
Matej Ogrin, Oddelek za geografijo FF UL
8/18/2019 Kvantili, mere sredine, regresija, korelacija
http://slidepdf.com/reader/full/kvantili-mere-sredine-regresija-korelacija 22/30
• Kako do statističnih izračunov z Excelom?
22
Matej Ogrin, Oddelek za geografijo FF UL
8/18/2019 Kvantili, mere sredine, regresija, korelacija
http://slidepdf.com/reader/full/kvantili-mere-sredine-regresija-korelacija 23/30
Z desnim gumbom miške kliknemo na vrednosti inizberemo ukaz “dodaj trendno črto”.
23
Matej Ogrin, Oddelek za geografijo FF UL
8/18/2019 Kvantili, mere sredine, regresija, korelacija
http://slidepdf.com/reader/full/kvantili-mere-sredine-regresija-korelacija 24/30
Izberemo enega od trendov.
24
Matej Ogrin, Oddelek za geografijo FF UL
8/18/2019 Kvantili, mere sredine, regresija, korelacija
http://slidepdf.com/reader/full/kvantili-mere-sredine-regresija-korelacija 25/30
Dobimo trendno črto, ki je regresijska premica, poteka po črti najmanjše
vsote kvadratov odklonov dejanskih vrednosti od poteka premice.
25
Matej Ogrin, Oddelek za geografijo FF UL
8/18/2019 Kvantili, mere sredine, regresija, korelacija
http://slidepdf.com/reader/full/kvantili-mere-sredine-regresija-korelacija 26/30
Če želimo dobiti še enačbo regresijske premice, kliknemo z levim gumbkom miškena regresijsko premico, da se odpre okno, kjer izberemo možnost prikaza enačbe.
26
Matej Ogrin, Oddelek za geografijo FF UL
8/18/2019 Kvantili, mere sredine, regresija, korelacija
http://slidepdf.com/reader/full/kvantili-mere-sredine-regresija-korelacija 27/30
Dobimo regresijsko premico z ustrezno regresijsko enačbo.
27
Matej Ogrin, Oddelek za geografijo FF UL
8/18/2019 Kvantili, mere sredine, regresija, korelacija
http://slidepdf.com/reader/full/kvantili-mere-sredine-regresija-korelacija 28/30
Domača naloga:• Iz spletnih strani arhiva ARSO si izberi eno leto ter na graf
nanesi podatke o povprečni letni temperaturi za vsaj 10 postaj,ki so na različnih nadmorskih višinah. Ugotovi, ali obstajakorelacija med temperaturo in nadmorsko višino!
• Nariši razsevni graf ter regresijsko premico z regresijskoenačbo. Razloži jo in razloži, kaj lahko pomenijo odstopanja odfunkcijske odvisnosti, da ne gre za funkcijsko odvisnost.Izračunaj trend.
28
Matej Ogrin, Oddelek za geografijo FF UL
8/18/2019 Kvantili, mere sredine, regresija, korelacija
http://slidepdf.com/reader/full/kvantili-mere-sredine-regresija-korelacija 29/30
Zima št. dni Zima št. dni
1979/1980 100 1994/1995 49
1980/1981 86 1995/1996 69
1981/1982 90 1996/1997 20
1982/1983 13 1997/1998 3
1983/1984 80 1998/1999 68
1984/1985 62 1999/2000 15
1985/1986 103 2000/2001 1
1986/1987 91 2001/2002 0
1987/1988 24 2002/2003 30
1988/1989 1 2003/2004 54
1989/1990 2 2004/2005 25
1990/1991 91 2005/2006 121
1991/1992 1 2006/2007 22
1992/1993 4 2007/2008 7
1993/1994 14 2008/2009 114
V preglednici so podatki s številom dni s snežno odejo debelejšo od 30 cm na Planipod Golico za 30-letno obdobje.
Izračunaj:Aritmetično sredino; variacijski razmik, kvartilni razmik, decilni razmik,povprečni absolutni odklon, standardni odklon.Klasificiraj leta glede na standardno deviacijo (± δ). 29
Vir: ARSO
Matej Ogrin, Oddelek za geografijo FF UL
8/18/2019 Kvantili, mere sredine, regresija, korelacija
http://slidepdf.com/reader/full/kvantili-mere-sredine-regresija-korelacija 30/30
Literatura
•Arhiv ARSO
•Ferligoj, A., 1995: Osnove statistike na prosojnicah. Samozaložba Z. Batagelj, Ljubljana, 210 str.
•Sagadin, J. 2003. Statistične metode za pedagoge. Obzorja Maribor, Maribor, 469 str.
Dodatno branje
•Ferligoj, A., 1995: Osnove statistike na prosojnicah. Samozaložba Z. Batagelj, Ljubljana, 210 str.
•Sagadin, J. 1993. Osnovne statistične metode za pedagoge. Obzorja Maribor, 426 str.
•Ogrin, M., Ogrin., D, Bunčič, G., Kozina, E., Rodman, N., Vengar, R., Močnik, M., Smolej, A.Študija klimatskih razmer za oceno smotrnosti širjenja smučišča Španov vrh nad Jesenicami inbioklimatska študija za območje Planine pod Golico : končno poročilo raziskovalne naloge.Ljubljana: Filozofska fakulteta, Oddelek za geografijo, 2009. 84 str.
30
Matej Ogrin, Oddelek za geografijo FF UL