primjena matematiČke statistike i raČuna …e-ucenje.gfmo.ba/predmeti/attachments/article/722/ih...

55
PRIMJENA MATEMATIČKE STATISTIKE I RAČUNA VJEROJATNOSTI U HIDROLOGIJI Bez obrade pomoću matematičke statistike i/ili računa vjerojatnosti opažane i izmjerene hidrološke i meteorološke pojave (veličine) samo su skup nepovezanih pa i nesuvislih veličina koje tek primjenom matematičke nepovezanih pa i nesuvislih veličina, koje tek primjenom matematičke statistike i računa vjerojatnosti daju potrebne pokazatelje (parametre) za definiranje režima tih pojava. Metode matematičke statistike i račun vjerojatnosti su primjenjena Metode matematičke statistike i račun vjerojatnosti su primjenjena matematička teorija slučajnih događaja Pojavnost meteoroloških i hidroloških veličina se na fizikalnim zakonitostima prirodnih pojava pa bi se moglo pomisliti da se ta pojavnost zakonitostima prirodnih pojava, pa bi se moglo pomisliti da se ta pojavnost može definirati (odrediti) pomoću poznatih fizikalnih zakona. Međutim, redovito se radi o mnoštvu geografsko-fizičkih koji sudjeluju u formiranju konkretne pojave, a koji nam u kvantitativnom smislu pa ponekad niti teoretski nisu poznati Zbog toga se izmjereni pokazatelji ponekad niti teoretski nisu poznati. Zbog toga se izmjereni pokazatelji meteoroloških i hidroloških pojava smatraju slučajnim veličinama. ''U pravilu se smatra slučajem onaj događaj koji nastaje kao posljedica toliko mnogo uzroka da nismo u mogućnosti točno izračunati kada i gdje toliko mnogo uzroka, da nismo u mogućnosti točno izračunati kada i gdje će stanoviti događaj nastupiti. (Vranić 1965.)

Upload: buihanh

Post on 21-May-2018

243 views

Category:

Documents


4 download

TRANSCRIPT

PRIMJENA MATEMATIČKE STATISTIKE I RAČUNA VJEROJATNOSTI U HIDROLOGIJI

• Bez obrade pomoću matematičke statistike i/ili računa vjerojatnosti opažane i izmjerene hidrološke i meteorološke pojave (veličine) samo su skup nepovezanih pa i nesuvislih veličina koje tek primjenom matematičkenepovezanih pa i nesuvislih veličina, koje tek primjenom matematičke statistike i računa vjerojatnosti daju potrebne pokazatelje (parametre) za definiranje režima tih pojava.

• Metode matematičke statistike i račun vjerojatnosti su primjenjenaMetode matematičke statistike i račun vjerojatnosti su primjenjena matematička teorija slučajnih događaja

• Pojavnost meteoroloških i hidroloških veličina zasniva se na fizikalnim zakonitostima prirodnih pojava pa bi se moglo pomisliti da se ta pojavnostzakonitostima prirodnih pojava, pa bi se moglo pomisliti da se ta pojavnost može definirati (odrediti) pomoću poznatih fizikalnih zakona. Međutim, redovito se radi o mnoštvu geografsko-fizičkih parametara koji sudjeluju u formiranju konkretne pojave, a koji nam u kvantitativnom smislu pa ponekad niti teoretski nisu poznati Zbog toga se izmjereni pokazateljiponekad niti teoretski nisu poznati. Zbog toga se izmjereni pokazatelji meteoroloških i hidroloških pojava smatraju slučajnim veličinama.

• ''U pravilu se smatra slučajem onaj događaj koji nastaje kao posljedica toliko mnogo uzroka da nismo u mogućnosti točno izračunati kada i gdjetoliko mnogo uzroka, da nismo u mogućnosti točno izračunati kada i gdje će stanoviti događaj nastupiti. (Vranić 1965.)

HIDROLOŠKE VELIČINE

Pod hidrološkom veličinom se podrazumjeva sve ono što se u hidrologiji može izmjeriti i izraziti brojem (vodostaji, protoci, dubine vode, mutnoća, pronos nanosa i drugo).

Ako se jedna veličina u toku nekog procesa ne mijenja, naziva se konstantom

Veličine koje se u toku nekog procesa mijenjaju nazivaju se promjenljivim veličinama ili varijablama; razlikuju se zavisne i nezavisne varijableveličinama ili varijablama; razlikuju se zavisne i nezavisne varijable.primjer: hidrostatki tlak vode na određenu površinu je konstantan ako se dubina (razina) vode ne mjenja; s promjenom dubine mjenja se i hidrostatski tlak; hidrostatski tlak je zavisna varijabla a dubina vode nezavisna hidrološka varijabla

Izmjerene hidrološke veličine, (varijable) su pokazatelji hidroloških procesa.

Hidrološki procesi su procesi koji se događaju s vodom u okviru hidrološkog ciklusa.

Hidrološki su procesi slučajni (stohastički) procesi.Stohastički procesi su procesi koji se odvijaju u prirodi tijekom vremena a kojima ne znamo uzrok(e) pa ih nije moguće sa sigurnošću predvidjeti.

Izmjerene hidrološke veličine su slučajne hidrološke varijable.

Hidrološka mjerenja i podaci, vremenske serije podataka

O ž j i j j hid l ijiOpažanja i mjerenja u hidrologiji: - sekvencijalna (diskontinuirana) - kontinuiranao t u a a

Vremenska serija podataka:kronološki poredani podaci o stohastičkom procesu izmjereni u prirodi.

Diskretna (diskontinuirana) vremenska serija: kada imamo izmjerenu realizaciju stohatičkog procesa samo u nekim vremenskim točkama; to je skup hronološki poredanih podataka od diskrektnih mjerenja (najčešćeskup hronološki poredanih podataka od diskrektnih mjerenja (najčešće okularnih očitanja) po nekom režimu mjerenja na klasičnim mjernim instrumentima (meteorološka očitanja na mjernim instrumentima - npr. temperature i vlažnosti zraka, te hidrološka očitanja - npr. čitanja p , j p jvodostaja na vodomjernoj letvi)

Kontinuirana vremenska serija: kada u svakoj vremenskoj točki imamo i j ij d t t h tičk t i i i t tizmjerenu vrijednost stohastičkog procesa; to su zapisi sa instrumenata za kontinuirano mjerenje procesa (ombrografi, limnigrafi, razni instrumenti s data loggerima).

VRSTE PODATAKA ZA HIDROLOŠKE ANALIZE

Za istraživanje osobina hidroloških veličina (slučajnih varijabli) koje se odnosena raspodjele količine i kakvoće vode u vremenu i prostoru na raspolaganjusu četiri tipa podataka:

1. Povjesni podaci osmatranja hidroloških procesa tijekom vremena s pojedinih lokacija, tj. kontinuirane ili diskretne hidrološke vremenske serije.

2. Podaci terenskih osmatranja duž pravca (profila), ili mjerenja hidroloških pojava po površini ili u prostoru (npr. određivanje dubine vodopropusnih slojeva sa podzemnom vodom, određivanje karakteristika nanosa duž riječnog korita i slična mjerenja)mjerenja).

3. Laboratorijski ili terenski eksperimentalni podaci koji se odnose na hidrologiju, a dobiveni su metodama sličnim kao pri dobivanju podataka pri hidrauličkim p j p peksperimentima (npr. koeficijenti filtracije),

4. Simultana mjerenja dvije ili više slučajnih varijabli sa ciljem da se utvrdi veza između tih varijabli uglavnom za svrhe prenošenja statističkih informacija s jedneizmeđu tih varijabli, uglavnom za svrhe prenošenja statističkih informacija s jedne na drugu varijablu (npr. korespodentni vodostaji)

UVJETI KOJE MORAJU ISPUNJAVATI HIDROLOŠKI PODACIDA BI SE MOGAO PRIMJENITI RAČUN VJEROJATNOSTIDA BI SE MOGAO PRIMJENITI RAČUN VJEROJATNOSTI

Meteorološke i hidrološke podloge sačinjavaju podaci dobiveni motrenjem i mjerenjem Od prikupljenih podatakadobiveni motrenjem i mjerenjem. Od prikupljenih podataka formira se vremenski niz (slijed, serija) podataka koji predstavlja podatke poredane redoslijedom kojim su bili opaženi ili izmjereni.opaženi ili izmjereni.Primjeri slijedova (nizova, serija) podataka su: maksimalne godišnje oborine različitih intenziteta (satne, jedno-, dvo- i tro- dnevne), ukupne godišnje oborine u vešegodišnjem razdoblju, ), p g j g j j ,maksimalni, srednji i minimalni godišnji protoci u višegodišnjem razdoblju i drugo.

Slijed podataka se može prihvatiti kao niz vrijednosti slučajne varijable (promjenljive veličine), koji predstavlja podatke o nekim pojavama po redoslijedu (kronološki) ili uređeno (po veličini) i na

j i ij iti t d t tičk t ti tik injega se mogu primijeniti metode matematičke statistike i račun vjerojatnosti ako je ispunjeno slijedećih 5 uvjeta:

1.) Članovi niza su slučajne veličine.Meteorološke i hidrološke veličine mogu se smatrati slučajnima zbog vrlovelikog broja različitih utjecaja o kojima one ovise.j j j j

2.) Članovi niza su međusobno neovisni.Član kronološkoga niza ne smije utjecati na veličinu (iznos) člana koji slijedi.Primjerice, za godišnje ekstremne vrijednosti u hidrološkim godinamaPrimjerice, za godišnje ekstremne vrijednosti u hidrološkim godinamaredovito se može usvojiti da su međusobno neovisne.

3.) Niz mora biti homogen.Homogenost ili istovrsnost podataka je potrebno ispitati ako postojeHomogenost ili istovrsnost podataka je potrebno ispitati ako postojerazlozi za to (npr. promjene u vodnom režimu, promjne u profilu vodotoka i sl.).Ispitivanja homogenosti provode se različitim testovima, npr. testom Kolmogorova, Wilcoxonovim testom, i sl.g

4.) Članovi niza moraju biti stacionarni.Različite promjene uzrokuju nestacionarnost koja se na podatke odražava uvidu trendova, periodičnosti i dr.vidu trendova, periodičnosti i dr.Trend kronološkog niza hidroloških podataka je generalni prirast hidrološkeveličine po jedinici vremena (pozitivan ili negativan prirast, padajuće ili rastuće usmjerivanje) i odnosi se na cijeli vremenski niz. Periodičnost u nizu hidroloških podataka predstavljaju pravilni ili promjenljivi oblici (grupe podataka) koji se dnevno, sezonski, godišnje ili višegodišnjepravilno izmjenjuju. Periodičnost se ispituje različitim testovima (npr. Fischerov test).

5.) Niz mora biti dovoljno dug.Kada se primjenjuju hidrološki postupci temeljni problem predstavlja procjenjivanje jesu li raspoloživi nizovi osnovnih hidroloških podataka dovoljno dugi za donošenje

d ih klj č k U lit t i hid l šk li č j ličitpouzdanih zaključaka. U literaturi se za razne hidrološke analize preporučuju različita minimalna razdoblja mjerenja. Duljina hidrološkoga niza može se provjeriti na osnovu veličine pogreške koeficijenta varijacije σcv prema formuli koju preporuča UNESCO:

c21 2+

gdje je: cv koeficijent varijacije, a n je broj članova niza;Ukoliko je σcv < 0,10 niz se može smatrati dovoljno dugim za korištenje.

nc

c vvcv 2

21+=σ

j cv , j g jUz isti kriterij (σcv < 0,10) može se primjeniti nešto stroža Kricky-Menkelova formula (s istim oznakama kao u prethodnoj formuli):

( )231v c

c+=σ

Za primjenu ovih formula moraju biti ispunjena tri uvjeta: a) članovi niza međusobno su neovisni

( )31

12 vcv cn

++

σ

b) razmatrani je niz homogenc) raspodjela članova niza je asimetrična.

Uobičajeno je pravilo u hidrološkoj praksi da se za primjenu metoda matematičke statistike koriste nizovi ulaznih podataka od najmanje 30 godina.statistike koriste nizovi ulaznih podataka od najmanje 30 godina.Kada razmatrani hidrološki niz zadovoljava navedenih pet uvjeta, na njegove se podatke mogu primijeniti metode matematičke statistike i račun vjerojatnosti.

ISPITIVANJE HOMOGENOSTI NIZA HIDROLOŠKIH PODATAKA

Pomanjkanje homogenosti niza podataka predstavlja obično glavni problemprilikom njegovog formiranja Nehomogenost niza znači da su njegovi članoviprilikom njegovog formiranja. Nehomogenost niza znači da su njegovi članovi(podaci) uzeti iz dvije ili više različitih ‘populacija’, (tj. podskupova) mjerenih podataka koji se razlikuju u svojoj genezi. Npr.: formiranje niza maksimalnih

diš jih d j i k f d j ih d k kgodišnjih vodostaja iz ukupnog fonda mjerenih podataka na nekom vodomjernom profilu na kojem je mjenjana kota nule vodomjera, ili pak na vodomjernom profilu koji je nakon dužeg razdoblja mjerenja dospio pod utjecaj neke riječne građevine (npr. brane), pa se rezultati mjerenja vodostaja (i protoka) prije i nakon izgradnje te građevine razlikuju u svojoj genezi.

Za ispitivanje homogenosti niza podataka u hidrologiji se najčešćeprimjenjuje Smirnov- Kolmogorov test, kao i Wilcoxonovneparametarski test (test rangiranja).

Smirnov-Kolmogorov test homogenosti

Teorem Smirnova: ako elementi (članovi) dvaju uzoraka veličine k i l pripadaju istojTeorem Smirnova: ako elementi (članovi) dvaju uzoraka veličine k i l pripadaju istoj ‘populaciji’ (tj. ako su homogeni), tada najveća |apsolutna| razlika d između dvije empirijske razdijobe vjerojatnosti (za uzorak k i uzorak l) pomnožena sa veličinom:

tj.

stvara slučajnu varjablu s distribucijom koja odgovara funkciji Kolmogorova L(z) , pod

lklkn+⋅

= ndz ⋅=

uvjetom da su k i l dovoljno veliki.

Prema matematičkoj statistici za homogenost niza treba biti zadovoljen uvijet: p = 100 [ 1 – L(z)] ≥ 5 %p [ ( )]Ukoliko je 1% < p < 5% hipoteza o homogenosti je nesigurna, a za p < 1% homogenost niza nije zadovoljena.

U praksi se niz opaženih podataka podjeli na dva dijela (k i l); obično granica podjeleU praksi se niz opaženih podataka podjeli na dva dijela (k i l); obično granica podjeleodgovara terminu za koji se pretpostavlja da je nastala promjena u genezi podataka (npr. promjena ‘0’ vodomjera); zatim se za nizove k i l konstruiraju njihove empirijske razdiobe vjerojatnosti i utvrdi se maksimalna razlika tih razdioba d, kao i parametar n1/2

1/2i z = d · n1/2 a zatim se pomoću funkcije Kolmogorova ustanovi vrijednost L(z) , te vrijednost p = 100 [ 1 – L(z)]. Za p ≥ 5% smatra se da je uvijet homogenosti niza zadovoljen.

FUNKCIJA KOLMOGOROVA

ISPITIVANJE HOMOGENOSTI NIZA WILCOXONOVIM TESTOM

Za ispitivanje homogenosti pogodan je zbog objektivnosti i jednostavnostiZa ispitivanje homogenosti pogodan je zbog objektivnosti i jednostavnosti Wilcoxonov neparametarski test (test rangiranja).

Osnovne pretpostavke za provođenje tog testa su:- članovi osnovnih skupova međusobno su neovisni;- osnovni skupovi su neprekinuti;- oblici razdioba skupova su nepoznati.

Kada se primjenjuje ovaj test, oblici razdioba razmatranih skupova ne pretpostavljajuse unaprijed. U tome je njegova praktična prednost u odnosu na većinu klasičnih metoda parametarskih testiranja homogenosti, koje polaze od pretpostavke da je razmatrana varijabla ili normalno raspoređena ili da prati neku drugu raspodjelu s poznatim parametrimapoznatim parametrima.

Postupak: iz ukupnoga niza podatak od n članova izdvajaju se dva osnovna niza (poskupa) –‘ i i l i’ n čl i ‘ difi i i’ n čl i č j n n + n‘originalni’ s nl članova, i ‘modificirani’ s n2 članova, pri čemu je n = nl + n2(‘modificirani’ niz je onaj za koji se pretpostavlja da ima ‘modificiranu’ genezupodataka)U računu vjerojatnosti dokazano je da suma rangova* osnovnih nizova velikih skupovaU računu vjerojatnosti dokazano je da suma rangova osnovnih nizova velikih skupova slijedi normalnu raspodjelu, uz uvjet da su nl i n2 veći od 7 .* [rang člana u uređenom nizu podataka (po opadanju ili po porastu) je njegov redni broj u

takvom nizu]

ISPITIVANJE HOMOGENOSTI NIZA WILCOXONOVIM TESTOM nastavak I

Uz uvjet da su nl i n2 veći od 7 očekivana vrijednost sume rangova osnovnih nizova je:

2)1( 212

)(++

=nnnE s

)1( 2121 ++ nnnnStandardno odstupanje sume rangova osnovnih nizova σs je:

suma rangova ‘modificiranog’ niza S0 u cjelovitom uređenom nizu je:

12)1( 2121 ++

=nnnn

∑=2n

kSsuma rangova modificiranog niza S0 u cjelovitom uređenom nizu je:

a opaženo standardno jedinično odstupanje U0 je:

∑=

=1

0j

jkS

s

sESU

σ)(0

0

−=

Osnovnoj (nultoj) pretpostavci o homogenosti, tj. da nema značajnih promjena u podacima, suprostavljena je alternativna pretpostavka - da postoje značajne promjene uzrokovane prirodnim ili umjetnim uzrocima.Uz uvažavanje razine povjerenja α = 0 05 donja i gornja granica prihvaćanja nulte pretpostavkeUz uvažavanje razine povjerenja α = 0,05 donja i gornja granica prihvaćanja nulte pretpostavkeusvajaju se prema normalnoj raspodjeli: - 1,96 < U0 < + 1,96Prema tome, ako se vrijednost opaženog standardnog jediničnog odstupanja nalazi unutar granica ± 1,96 može se s vjerojatnošću većom od 95% usvojiti da je niz homogen (95 % vrijednosti standardne normalne raspodjele je u intervalu - 1,96 < z < + 1,96). Ako je vrijednost U0 izvan granica ± 1,96 vjerojatnost za prihvaćanje nulte pretpostavke je manja od 95 %, pa je takav niz, prema usvojenom kriteriju, nehomogen.

ISPITIVANJE HOMOGENOSTI NIZA WILCOXONOVIM TESTOMprimjer

Srednji godišnji protoci Krke u profilu Marasovine

ISPITIVANJE HOMOGENOSTI NIZA WILCOXONOVIM TESTOM: primjer – nastavak (proračun)

Prosjek sume rangova osnovnih nizova: 1452

)11018(102

)1( 212)( =

++=

++=

nnnE s

Standardno odstupanje sume rangova: 86,2012

)11018(101812

)1( 2121 =++⋅⋅

=++

=nnnn

Suma rangova ‘modificiranog’ niza: 209282725242321191614122

10 =+++++++++==∑

=

n

jjkS

Standardno jedinično odstupanje: 96,107,386,20145209

0)(0

0 =>=−

=−

= UES

Us

s

σ

Na osnovu provedenog izračuna (testa) može se zaključiti da razmatrani niz srednjih godišnjih protoka nije homogen, tj. ukupan niz podataka o srednjim godišnjim protocima Krke u profilu Marasovine sastoji se od dva zasebnagodišnjim protocima Krke u profilu Marasovine sastoji se od dva zasebna (nekompatibilna) niza, jedan iz razdoblja 1963.- 1980. god. i drugi iz razdoblja 1981.- 1990. god.

VJEROJATNOST : definicijeKlasična definicija: vjerojatnost nekog događaja je omjer broja za njega povoljnih j j j g g j j j j j g p j

slučajeva prema broju svih jednako mogućih slučajeva..Klasična definicija zahtjeva da skup povoljnih i svih mogućih d đ j b d k č i t t k i ij tk d đ

nmxP =)(

događaja bude konačan i poznat, a to se u praksi rijetko događa

Statistička vjerojatnost: vjerojatnost na osnovu iskustva (mjerenja).

relativna frekvencija: omjer broja slučajeva kad je nastupio povoljan događaj (f)(onaj koji promatramo) u odnosu na ukupan broj opaženih (mjerenih) slučajeva (N);fxf =)( ( j ) j ( );relativna frekvencija povoljnog događaja u nizu pokusa (mjerenja) uz iste uslove teži prema granici koja je jednakavjerojatnosti tog događaja, kada broj pokusa (N) raste prema

Nxfr )(

NfxP

N ∞→= lim)(

bezkonačno. vjerojatnost možemo shvatiti kao relativnu frekvenciju P(x)= m/n = f/N pa vrijedi: 0 ≤ P(x) ≤ 1

NN ∞→

za f=0 P(x)=0 tj. vjerojatnost nemogućeg događaja jednaka je nuliza f=N P(x)=1 tj. vjerojatnost sigurnog događaja jednaka je jedinici

(kada su svi događaji povoljni)

TOTALNA VJEROJATNOST

l (k l ) j j k l d đ žtotalna (kumulativna) vjerojatnost: ako povoljan događaj moženastupiti na više načina koji se međusobno isključuju (ne mogu nastupiti istovremeno, tj. događa se ili jedan ili drugi način s tim da je svaki povoljan) i svaki način ima svoju vjerojatnost, tada je vjerojatnost povoljnog događaja jednaka sumi vjerojatnosti svakog od načina njegovog nastajanja.njegovog nastajanja.Ako skupu od N elemenata imamo f1 elemenata povoljnog događaja prve vrste (x1) i f2 elemenata povoljnog događaja druge

( ) b ćvrste (x2) tada je:vjerojatnost događaja prve vrste: P(x1)= f1 /Nvjerojatnost događaja druge vrste: P(x )= f /Nvjerojatnost događaja druge vrste: P(x2)= f2 /Nukupna vjerojatnost povoljnih događaja:

ffff )()()( 212121 xPxP

Nf

Nf

NffxP +=+=+=

SLOŽENA VJEROJATNOST

Složena vjerojatnost: vjerojatnost da će istovremeno t iti iš d đ j k ji đ b i inastupiti više događaja koji su međusobno nezavisni

(tj. ishod jednog ne zavisi od ishoda drugog događaja) jednaka je produktu vjerojatnosti svih pojedinih događaja koji se i t j j jistovremeno javjaju.

Ps (x)= P(x1)·P(x2)· . . . . · P(xk)(Primjer: vjerojatnost da se istovremeno dogodi poplava Zagreba od ( j j j g p p grijeke Save i od potoka s Medvednice)

NUMERIČKE KARAKTERISTIKE SLUČAJNE VARIJABLE

Srednja (očekivana) vrijednost (aritmetička sredina, centar):NN

xfx ⋅∑∑n

nni

N

i

iiii

ii

sr ffffxfxfxx

Nf

N

xf

N

xx

++++++

=⋅=⋅

== ∑∑∑

=

==

..........

21

2211

1

11

Geometrijska sredina: nnsrg xxxxx

1

321 )....( ⋅⋅⋅⋅=

Harmonijska sredina: NHarmonijska sredina:(recipročna vrijednost od srednje vrijednosti recipročnih ∑

=

= N

i i

srh

x

Nx

1

1

elemenata skupa)i

Medijana: iznos slučajne hidrološke varijable koji odgovara trajanju (kumulativnoj učestalosti) T=50 %trajanju (kumulativnoj učestalosti) T 50 % (dijeli površinu koju zatvara krivulja učestalosti s koordinatnom osi varijable na dva jednaka dijela);

vrijednost slučajne varijable X koja dijeli njenu funkciju raspodjele gustoće vjerojatnosti na dva jednaka dijela: F(X ≥ x) = F(X ≤ x) = 1/2jednaka dijela: F(X ≥ x) F(X ≤ x) 1/2

Modus (mod): iznos slučajne hidrološke varijable koji ima najveću učestalost (za tu vrijednost krivuljanajveću učestalost (za tu vrijednost krivulja trajanja ima točku infleksije)

to je ona vrijednost slučajne varijable X koja seto je ona vrijednost slučajne varijable X koja se najčešće javlja, tj. koja ima najveću vrijednost funkcije raspodjele gustoće vjerojatnosti;

ij d t l č j ij bl čij jona vrijednost slučajne varijable čija je vjerojatnost najveća

POKAZATELJI DISPERZIJE

xxfN

∑ −Srednje apsolutno odstupanje:

bi i ( l ) i d

N

xxfxO i

srii∑== 1)(

∑N

rf1Obični (elementarni) momenti r-tog reda:

∑N1

∑=

=i

riir xf

Nm

1

Centralni statistički momenti: ∑=

−=i

rsriir xxf

N 1)(1μ

Varijanca (centralni moment drugog reda): ∑=

−==N

isrii xxf

N 1

222 )(1σμ

Standardna devijacija :2σ ∑=

−=N

isrii xxf

N 1

2)(1σ

N1

Koeficijent varijacije:sr

N

isrii

srv x

xxfN

xC

∑=

−== 1

2)(1σ

KOEFICIJENT (indikator) ASIMETRIJE

Koeficijent asimetrije krivuljeučestalosti, odnosno funkcije

dj l ć j j iraspodjele gustoće vjerojatnosti:

3)(μμ

xxfN

srii∑ −

služi za ocjenu simetričnosti krivulje

31

32

333

σμμ

σμ

NC i

s====

učestalosti, odnosno funkcijeraspodjele gustoće vjerojatnosti:

0,00 <Cs < 0,10 nema asimetrije0,10 <Cs < 0,25 asimetrija je mala0,25 <Cs < 0,50 asimetrija je osrednja

C 0 50 l kCs > 0,50 asimetrija je velika

KOEFICIJENT (indikator) SPLJOŠTENOSTI

( )∑ −==N

sri xxN

E 444

4 1σσ

μ

μ4 . . . centralni moment četvrtog redat d d d ij ij

=iN 1σσ

σ . . . standardna devijacija

EMPIRIJSKE VJEROJATNOSTI

empirijska vjerojatnost za niz u opadanju: F(X≥x ) = m/N (a)empirijska vjerojatnost za niz u opadanju: F(X≥xm) = m/N (a)empirijska vjerojatnost za niz u porastu: F(X≤xm) = (N-m+1)/Nobzirom da je: F(X≥xm) + F(X≤xm) = 1vrijedi: F(X≥x ) = 1 - F(X≤x ) = 1 – (N-m+1)/N = (m-1)/N (b)vrijedi: F(X≥xm) 1 F(X≤xm) 1 (N m+1)/N (m 1)/N (b)usporedba (a) i (b) navodi na zaključak da je: (m-1)/N < F(X≥xm) < m/N

Zbog toga su mnogi autori predložili kompromisne izraze za empirijsku vjerojatnost.

primjer iz tablice: F(X≥ a3) = m/N = 3/6 = 1/2 (a)F(X≥ a ) (m 1)/N (3 1)/6 2/6 1/3 (b)F(X≥ a3) = (m-1)/N = (3-1)/6 = 2/6 = 1/3 (b)

zaključak: 1/3 < F(X≥xm) < 1/2

Redni broj 1 2 3 4 5 6

niz u opadanju a1 > a2 > a3 > a4 > a5 > a6

< a < a < a < a < aniz u porastu a6 < a5 < a4 < a3 < a2 < a1

m=3 N-m+1 N=6

KOMPROMISNI IZRAZI ZA EMPIRIJSKU VJEROJATNOĆU

Hazen: Blom:N

mxXF2

12)( −=≥

4/18/3)(

+−

=≥NmxXF

N2 4/1+N

Weibull: Tukey:1

)(+

=≥N

mxXF 1313)(

+−

=≥NmxXF

1+N

440Čegodajev: Gringorten:

4,03,0)(

+−

=≥NmxXF 12,0

44,0)(+−

=≥NmxXF

PARAMETRI EMPIRIJSKIH RASPODJELA VJEROJATNOSTI

T blič i l d č l i (f k ij ) i d j ćiTablični pregled učestalosti (frekvencija) i odgovarajući grafički prikazi (krivulje trajanja i učestalosti) predstavljaju jedan vid organiziranja serija podataka hidroloških mjerenja. Njihove numeričke karakteristike interpretiraju se slijedećimNjihove numeričke karakteristike interpretiraju se slijedećim vrstama parametara:

- Parametri koji karakteriziraju centralnu tendenciju i lokaciju j j j jraspodjele učestalosi: srednja vrijednost, geometrijska sredina, harmonijska sredina, medijana, mod;

P t i k ji k tifi i j ( k j ) di ij ij d ti- Parametri koji kvantificiraju (pokazuju) disperziju vrijednosti slučajne varijable oko srednje vrijednosti:interval varijacije, varijanca, standardna devijacija, koeficijent

ij ij i dvarijacije i dr.

- Parametri s kojima se precizira (određuje) asimetrija i spljoštenost krivulje učestalosti:spljoštenost krivulje učestalosti:koeficijent asimetrije, mjera spljoštenosti.

Najčešće statističke obrade hidroloških veličina

Vremenska serija hidrološke varijable s krivuljama učestalosti: (1) svih članova uzorka,(2) maksimuma, (3) minimuma, (4) srednjih vrijednosti specificiranih vremenskih intervala

Najčešće vjerojatnosne analize u hidrologiji

Temeljem vremenskih serija hidroloških podataka najćešće se provode analize ili proračuni vjerojatnosti pojavljivanja slijedećh hidroloških veličina:

- maksimalni vodostaji- minimalni vodostaji- srednji godišnji protocisrednji godišnji protoci- srednji godišnji volumeni protekle vode - maksimalni protoci- minimalni protoci- minimalni protoci- maksimalni volumeni velikih vodnih valova- srednji godišnji pronos riječnog nanosa

godišnji volumeni pronosa riječnog nanosa- godišnji volumeni pronosa riječnog nanosa- maksimalni, minimalni i srednji nivoi podzemnih voda

Cilj vjerojatnosnih analiza je pridružiti bilo kojem promatranom mjernom iznosuCilj vjerojatnosnih analiza je pridružiti bilo kojem promatranom mjernom iznosu hidrološke veličine (tj. slučajne varijable) vjerojatnost pojavljivanja upravo tog promatranog mjernog iznosa

Formiranje skupova podataka za vjerojatnosne analize u hidrologiji

Za vjerojatnosne analize u hidrologiji biraju se iz ukupnog fonda hidroloških podataka oniZa vjerojatnosne analize u hidrologiji biraju se iz ukupnog fonda hidroloških podataka oni podaci koji su reprezentativni za problem koji se analizom treba riješiti:Za analize srednjih voda biraju se srednje vrijednosti iz specificiranih vremenskih intervala (npr. srednji godišnji vodostaji ili protoci).Za analize velikih voda biraju se podaci samo iz domene velikih voda. U praksi se primjenjuju dva osnovna principa formiranja reprezentativnog niza podataka o velikim vodama i to: niz maksimuma - iz svake godine (tj. specificiranog vremenskog intervala) bira se samomaksimalan podatak (vodostaj protok ili volumen vala velike vode zavisno o problem koji se reješava)maksimalan podatak (vodostaj, protok ili volumen vala velike vode – zavisno o problem koji se reješava),

niz prekoračenja praga (treshhold princip) - iz svake godine (tj. specificiranog vremenskogintervala) biraju se svi oni podaci koji su veći od neke odabrane vrijednosti (tj. praga vodostaja, protoka ili volumena vala velike vode – zavisno o tome koji se problem reješava),Za analize malih voda biraju se podaci samo iz domene malih voda. U praksi se također primjenjuju dva osnovna principa formiranja reprezentativnog niza podataka: niz minimuma - iz svake godine bira se samo minimalan podatak (vodostaj ili protok – zavisnoo tome koji se problem riješava)o tome koji se problem riješava), niz podbačenih vrijednosti ispod praga (treshhold princip) - iz svake godine biraju se svi oni podaci koji su manji od neke odabrane vrijednosti (tj. praga vodostaja ili protoka)

U hidrološkim analizama velikih i malih voda česta je potreba analizirati i njihova trajanjaU hidrološkim analizama velikih i malih voda česta je potreba analizirati i njihova trajanja.Razlog za to kod velikih voda su procjene štetnih učinaka poplavnih voda, a kod malih vodarazlog leži u procjenama štetnih ekoloških i egzistencijalnih učinaka uslijed pomanjkanja vode.

POVRATNI PERIOD HIDROLOŠKE VELIČINE

fi i ijDefinicija:Povratni period nekog promatranog (konkretnog)iznosa hidrološke (ili meteorološke) veličine je onaj

ki i d k j t j i ili ći d jvremenski period u kojem se taj iznos ili veći od njega pojavljuje prosječno, tj. prema računu vjerojatnosti, jedanput.

Tumačenje:Ako je skup (tj. vremenska serija) diskretnih podataka (tj. mjernih iznosa) neke hidrološke (ili meteorološke) veličine formiran tako da se svaki podatak odnosi na jedno konkretno jedinično vremensko razdoblje (najčešće kalendarsku godinu dana) i ako svakom jediničnom razdoblju (svakoj godini) pripada samo jedan reprezentativni podatak tako da je ukupan broj članova skupa podataka jednak ukupnom broju jediničnih vremenskih razdoblja N iz kojih su podaci prikupljeni (npr. maksimalni vodostaji iz N godina), tada vjerojatnost prekoračenja (tj. kumulativna vjerojatnost) najveĺeg člana (x1) promatranog skupa podataka X iznosi F(X≥x1) = 1/N( ≥ 1)(jer ne postoji niti jedan član veći od najveĺeg) pa kažemo da je Npovratno razdoblje (povratni period) tog člana skupa, tj. N = 1/ F(X≥x1)

Da je za najveći član promatranog skupa podataka kumulativna vjerojatnost jednaka: F(X≥x1) = 1/N lako se uočava ako promatranivjerojatnost jednaka: F(X≥x1) 1/N lako se uočava ako promatrani skup podataka sredimo po redosljedu opadanja:

x1 > x2 > x3 > . . . . . . . > xN-1 > xNN je dakle vremenski period u kojem se promatrani član x1 izN je dakle vremenski period u kojem se promatrani član x1 iz skupa X pojavio jedanput.

Povratno razdoblje obično se označava sa T( ) [ili P( )] Za prviPovratno razdoblje obično se označava sa T(x) [ili P(x)]. Za prvi (najveći) član niza je prema tome: T (x1) = N = 1/ F(X≥ x1)

Ako dalje promotrimo drugi član po veličini (x ) u promatranomAko dalje promotrimo drugi član po veličini (x2) u promatranom skupu, taj je član jedanput dostignut i jedanput prekoračen u Njediničnih razdoblja (godina), pa je njegova vjerojatnost prekoračenja jednaka: F(X≥x ) = 2/N = 1/(N/2)prekoračenja jednaka: F(X≥x2) = 2/N = 1/(N/2)tj. dva puta je taj član dostignut ili premašen u N jediničnih razdoblja, odnosno jedanput u N/2 jediničnih razdoblja. D kl t j j čl t d blj j d kDakle za taj je član povratno razdoblje jednako:T(x2) = N/2 = 1/ F(X≥ x2) jediničnih razdoblja (godina).

Dalje, za treći član po veličini biti će: F(X≥ x3) = 3/N = 1/(N/3)( 3) ( )T(x3) = N/3 = 1/ F(X≥ x3) jediničnih razdoblja, . . . . itd.

Opčenito vrijedi: T(x) = 1/ F(X≥x) p j (x) ( ≥ )

Povratno razdoblje je prema tome jednako recipročnoj vrijednosti od vjerojatnosti prekoračenja (kumulativne vjerojatnosti), pod uvjetom da je j j p j ( j j ), p j jpromatrani skup formiran kako je navedeno (tj. da se svaki podatak odnosi na jedno konkretno jedinično vremensko razdoblje, i da svakom jediničnom razdoblju pripada samo jedan reprezentativni podatak tako j j p p j p pda je ukupan broj članova skupa podataka jednak ukupnom broju jedinčnih vremenskih razdoblja N)

Npr. ako je jedinično vremensko razdoblje godina dana i ako za neku vrijednost promatrane hidrološke veličine (npr. vodostaj Save u Zagrebu od 300 cm) vjerojatnost prekoračenja iznosi F(X≥x) = 0,01 tada povratni period te vrijednosti (tj. za tih x=300 cm) iznosi: T (x) = 1/0,01 = 100 godina.

Povratni se period ustanovljuje računom vjerojatnosti, pa je prema tome to onaj vremenski period u kojem se je prema tome to onaj vremenski period u kojem se promatrani iznos hidrološke veličine ili veći od tog promatranog pojavljuje prosječno jedanput.

To praktično ne znači da se u bilo kojem vremenskom periodu, jednako dugačkom kao i povratno razdoblje, promatrana vrijednost hidrološke veličine mora obavezno i pojaviti.Niti to nadalje ne znači da se u takovom periodu promatrana vrijednost ne može pojaviti i dva ili više puta. j p j pBit je u tome da se u povratnom periodu promatrana vrijednost pojavljuje prosječno jedanput (npr. 300 cm vodostaja Save u Zagrebu bi se u periodu od recimo 100000 godina prosječnoZagrebu bi se u periodu od recimo 100000 godina prosječno pojavljivalo jedanput u 100 godina; pri tom bi bilo nekih perioda od 100 godina u kojima se prekoračenje tog vodostaja ne bi dogodilo, ali bi zato bilo i nekih drugih perioda od 100 godina u kojima bi se prekoračenje dogodilo 2 ili više puta)

Vjerojatnosti prekoračenja koja je po definiciji jednaka recipročnojVjerojatnosti prekoračenja koja je po definiciji jednaka recipročnoj vrijednosti povratnog razdoblja odnosi se na svako (bilo koje) jedinično razdoblje (npr. na bilo koju pojedinačnu godinu), što znači da događaj k ji i N diš j t d blj i k j di ikoji ima N godišnje povratno razdoblje ima u svakoj godinivjerojatnost pojavljivanja ili prekoračenja F(X≥x) = 1/N

U hid l šk j k i đ ti ij tk k j t b dU hidrološkoj se praksi međutim ne rijetko ukazuje potreba da se proračuna vjerojatnost (ili rizik) kojom bi se neki N godišnji hidrološki događaj (koji ima godišnju vjerojatnost pojavljivanja F(X≥x) = 1/N)

j i i k k i d d d j d dimogao pojaviti u nekom vremenskom periodu dužem od jedne godine.

Npr. ako se građevinska jama za izgradnju akumulacijske brane na rijeci štiti izgradnjom zaštitnih nasipa od pojave 100 godišnje velikevode i ako će izgradnja brane trajati 5 godina, postavlja se pitanje kolika je vjerojatnost da se 100 godišnja voda pojavi ili premaši u periodu izgradnje brane?

Zanima nas dakle vjerojatnost prekoračenja u n godina, tj. F(X≥x)n = ?Za rješenje ovog zadatka polazi se od izraza:

F(X≥x) + F(X≤x) = 1 (a) F(X≤x) = 1 - F(X≥x) (b)

F(X≥x) predstavlja godišnju vjerojatnst da će x biti dostignuto ili prekoračeno, a F(X≤ ) j diš j j j t t d ć biti d ti tF(X≤x) je godišnja vjerojatnost da x neće biti dostignuto. Po analogiji vrijedi: F(X≥x)n + F(X≤x)n = 1 (c)

F(X≥x)n = 1 - F(X≤x)n (d)F(X≥x)n . . vjerojatnst da će x biti jedan puta dostignuto ili prekoračeno u n godina;F(X≥x)n . . vjerojatnst da će x biti jedan puta dostignuto ili prekoračeno u n godina;F(X≤x)n . . vjerojatnost da x ne će biti dostignuto niti jednom u n godina, tj.

vjerojatnost da će se baš svake godine u periodu od n godina desiti podbačajPrema definiciji složene vjerojatnosti: F(X≤x)n = [F(X≤x)]n (e)uvrštavanjem (b) u (e) bit će: F(X≤x)n = [1 - F(X≥x)]n (f)uvrštavanjem (f) u (d) : F(X≥x)n = 1 - [1 - F(X≥x)]n (g)prema definiciji povratnog razdoblja: F(X≥x) = 1/T(x) (h)uvrštavanjem (h) u (g) biti će: F(X≥x) = 1 [1 1/T ]n (i)uvrštavanjem (h) u (g) biti će: F(X≥x)n = 1 - [1 - 1/T(x) ]n (i)U postavljenom primjeru biti će:

F(X≥x)5 = 1 - [1 - (1/100 )]5 = 0,049 = 4,90 %Dakle, vjerojatnost da 100 godišnja velika voda bude premašena jedan puta u 5 godina , j j g j p j p giznosi 4,9 % ; za jedan puta u 10 godina vjerojatnost iznosi 9,5 % ; za jedan puta u 50godina vjerojatnost iznosi 39,5 % ; za jedan puta u 100 godina vjerojatnost iznosi 63,4 %

SVRHA PRIMJENE RAČUNA VJEROJATNOSTI U HIDROLOGIJI

Osnovni cilj primjene računa vjerojatnosti u hidrologiji je određivanje vjerojatnosti iOsnovni cilj primjene računa vjerojatnosti u hidrologiji je određivanje vjerojatnosti i povratnog razdoblja pojavljivanja neke veličine (hidrološke ili metorološke) i to za: - odabranu veličinu (iznos) iz niza izmjerenih podataka;

ki liči ć d j č ili j d j j i j d tk- za neki veličinu veću od najveceg ili manju od najmanjeg izmjerenog podatka.(kod analiza velikih i malih voda, kod analize jakih kiša, maksimalnih i minimalnih temperatura i td.).

Za rješavanje prvog zadatka često se primjenjuju empirijske (kompromisne) razdiobe vjerojatnosti (Hazen, Weibull i dr.), a tehnikom ekstrapolacije moguće je pomoću tih razdioba riješavati i drugi spomenuti zadatak;

Za rješavanje drugo-navedenog zadatka češće se primjenjuju teorijske krivulje (funkcije) razdiobe vjerojatnosti, ali i prvo navedeni zadatak se sa tim krivuljama uspješno rješava.

Najčešće se u hidrologiji primenjuju nesimetričene teorijske krivulje razdiobevjerojatnosti (Pearsonove funkcije razdiobe, Gumbelova, Galtonova – log normalana razdioba i dr.))

Gaussova (normalna) raspodjela se rijeđe koristi za određivanje povratnih razdoblja, ali se koristi za procjene intervala povjerenja.

Gaussova (normalna) raspodjelaGaussova ili normalna raspodjele je matematički određena, simetrična, dvo-parametarskaraspodjela neprekinute slučajne varijable, zvonolika oblika.Dobro aproksimira slučajne pogreške.R dj l t l ških i hid l ških liči jč šć i i t ičRaspodjele meteoroloških i hidroloških veličina najčešće nisu simetrične.Normalna je raspodjela važan čimbenik korelacijskih analiza, a koristi se i za procjeneintervala povjerenja, generiranja hidroloških nizova itd.Međusobne veze varijabli koje imaju normalnu raspodjelu su linearne i vrednuju se naeđusob e ve e v j b oje ju o u spodje u su e e v ed uju seosnovu koeficijenta korelacije. Kada su raspodjele nesimetrične, podaci se mogu ‘normalizirati’ različitimTransformacijama, npr.: y = xa ili y = ln x, ili y = log x kojoj odgovara teorijska l l (G l ) dj llog-normalna (Galtonova) raspodjela.

Prema Gaussovu zakonu, raspodjela gustoće vjerojatnosti je:

( )2

gdje je: π = 3 14; σ je standardno odstupanje; e = 2 718 (baza prirodnog logaritma)

( )2

2

2)( 2

1 σ

πσ

srxx

x ep−

−=

gdje je: π = 3,14; σ je standardno odstupanje; e = 2,718 (baza prirodnog logaritma), a xsr je prosjek (srednja vrijednost) članova niza.

Supstitucijom u Gaussovu funkciju: σsrxxz −

=21 z

dobije se standardna normalna raspodjela:2

)( 21

x ep−

Varijanca standardne normalne raspodjele je σ2 = 1, a prosjek (sredina) je nula.Vrijednost p(z) maksimalne ordinate (za z = 0 i σ2 = 1, tj. σ = 1 ) je:

39901

P ši i d l k i lj di b j j t ti j d k j j di i i

399,02)( ==πxp

Površina ispod normalne krivulje razdiobe vjerojatnosti jednaka je jedinici. Ako se ta površina podijeli po sredini na dva jednaka dijela, tada se 50 posto vrijednosti (tj. članova niza) nalazi se u intervalu: xsr - 0,6745 σ i xsr + 0,6745 σVjerojatno odstupanje unutar kojega se nalazi 50 posto vrijednostiVjerojatno odstupanje, unutar kojega se nalazi 50 posto vrijednosti, tj. članova niza, određeno je izrazom: σv = ± 0,6745 σ

Maksimalno odstupanje σmax je određeno izrazom: σmax = ± 3σU intervalu maksimalnog odstupanja (xsr - 3σ i xsr + 3σ) nalazi se 99,73 posto pojava, tj. gotovo svi članovi razmatranog niza (skupa) podataka.

SVOJSTVA NORMALNE KRIVULJE RAZDIOBE VJEROJATNOSTI

Neke karakteristične površine ispod krivulje standardne normalne raspodjele =

k m lati ne jerojatnostikumulativne vjerojatnosti

2 Karakteristične površine ispod krivuljedzexXF

z z

∫∞−

−=≤ 2

2

21)(π

Karakteristične površine ispod krivulje standardne normalne raspodjele

z F (xsr - zσ < x < xsr + zσ)

z∞ 2

1

0,6745 0,50001 0,6827

1 645 0 9000dzexXFz

z

∫∞

−=≥ 2

21)(π

1,645 0,90001,96 0,9500

2 0,9546

Ove površine mogu se naći u tablicamastatističkih priručnika

,3 0,99734 1,0000

stat st č p uč a

INTERVAL I NIVO POVJERENJA

U hid l iji č t d fi i j j t l ti d t jU hidrologiji se često definira vjerojatno relativno odstupanje za interval (raspon) povjerenja u kojemu se pojavljuje 95 % podataka. To odstupanje kod normalne krivulje razdiobe iznsi: σp = ± 1,96 σ0

2

σ0 je relativno odstupanje: nx

xxn

i r

ri∑=

⎟⎟⎠

⎞⎜⎜⎝

⎛ −

±= 1

2

gdje je: xi izmjerena vrijednost (iznos) člana niza; xr je vrijednost izračunatapomoću analitičke krivulje kojom se interpretira stohastička zavisnost

n

niza podataka; n je broj podataka (članova niza)(npr. xi mogu biti izmjereni protoci Qi pri raznim vodostajima, a xr su u tom slučaju računske vrijednosti protoka Qr prema protočnoj krivulji)

Intervalu povjerenja od 95% odgovara nivo povjerenja α = ± 5% (α = 0,05). Nivo povjerenja od α = ± 5 % je vjerojatnost da samo 5 % članova razmatranogniza podataka leži izvan intervala povjerenja od 95%, tj. raspona u kojem se nalazi 95% članova niza.

Log-normalna (Galtonova) raspodjela

Galton je dokazao da se mnoge raspodjele vjerojatnosti mogu u logaritamskojtransformaciji prilagoduti Gaussovom zakonu:

( )21

sryy−−

pri čemu je:y = ln x (x je varijabla)

22)( 2

1 y

yx ep σ

πσ

⋅=

ysr .... sredina od y σy .... standardna devijacija od y

Između parametara originalnog niza podataka xsr i σx , i parametara izvedenog niza ysr i σy

postoji odnos: i 22

2

lnsrx

srsr

xxy+

)1ln( 2sr

xy x

σσ +=

Statistički parametri Galtonove raspodjele su:

koeficijent varijacije:

koeficijent asimetrije:

21

)1(2

−= yeCvσ

33 CCC +koeficijent asimetrije:

medijana:

33 vvs CCC +=

sryme ex =

PEARSONOVE FUNKCIJE RASPODJELE

Opća (osnovna) jednadžba gustoće vjerojatnosti: ∫∞−

++−x

dxcxbxaxm

exp))(( 2

)(Opća (osnovna) jednadžba gustoće vjerojatnosti:

Gdje su a, b, c i m konstante. Kriteriji za određivanje tipova funkcija su β1, β2 i k := ∞exp )(

23

1ηβ = 2

24

2ηβ = )3( 2

21 +=

ββk

η2 , η3 i η4 su drugi, treći i četvrti centralni momenti.Osnovna jednadžba ima 4 parametra (a, b, c i m), pa se prema njihovim vrijednostimad bi j ličit k i lj S t k i lj i d l tj i j j d h ( d) t čki

22

1 ηβ 2

22 η

β)632()34(4 1212 −−⋅− ββββ

k

dobivaju različite krivulje. Sve su te krivulje unimodalne, tj. imaju jedan vrh (mod) u točki x = m. Zbog toga ove krivulje imaju veliku sposobnost prilagođavanja. Postoji 12 tipovatih krivlja, a u hidrologiji se najčešće koristi III tip Pearsonove raspodjele kod koje je: k = , odnosno 2 β2 = 3 β1 + 6 , a gustoća vjerojatnosti je: ∞ β2 β1 g j j j

gdje je: 2

0 )1()(xcc e

mxpxp

−⋅+=

1+ ∞

14

1

−=β

c2

3

2 ηη⋅=

cm )1(

1

0 +Γ⋅⋅=

+

cec

mNp c

c

!)1(0

cdxexc xc ==+Γ ∫∞

Ova se Pearsonova raspodjela često koristi u modifikaciji Fostera i Ribkina.

JEDNOPARAMETARSKA GAMA RASPODJELA

11Gustoća vjerojatnosti za ovu raspodjelu je:

p(x) = 0 za x < 0

xexxp −− ⋅Γ

= 1

)(1)( α

α za x ≥ 0

p( )

gdje je:

Integral Γ(α) konvergira ako je x > 0 i zove se gama funkcija od α.Vrijedi: Γ(1) 1 ; Γ(α) (α 1) Γ(α 1) ; Γ(α+1) α Γ(α)

dxex x−∞

− ⋅=Γ ∫0

1)( αα

Vrijedi: Γ(1) = 1 ; Γ(α) = (α – 1) Γ(α - 1) ; Γ(α+1) = α · Γ(α) Γ(α) = (α – 1)! ; Γ(α+1) = α! xsr = α ; σ = α1/2 ; Cv = α-1/2 ; Cs = 2·α-1/2

DVOPARAMETARSKA GAMA RASPODJELA

x−1

Gustoća vjerojatnosti za ovu raspodjelu je:

0 ≤ x ≤ α > 0 β > 0( ) 0 < 0

βαα αβ

exxp − ⋅Γ

= 1

)(1)(

∞p(x) = 0 za x < 0

gdje je: Kumulativna funkcija vjerojatnosti je:

dxex x−∞

− ⋅=Γ ∫0

1)( ααdxexxF

x x

∫−

− ⋅⋅Γ

=0

1

)(1)( βα

α αβZa dato α i β gornji integral F(x) riješava se numeričkom integracijomKarakteristične vrijednosti raspodjele: xsr = α·β ; σ = β·α1/2 ; Cv = α-1/2 ; Cs = 2·α-1/2

TESTIRANJE PRILAGODBE χ2 TESTOM

Kvaliteta (dobrota) prilagodbe teorijskih krivulja vjerojatnosti na empirijske (izmjerene) podatke možese preliminarno uočiti grafičkom kontrolom na dijagramima (papirima) vjerojatnće. Egzaktnije provjeravanje prilagođavanja vrši se pomoću testiranja.Pearsonov χ2 test je najčešće korišćen test za dokazivanje prilagodbe.Ispitivanje prilagodbe teoretske funkcije empirijskim podacima polazi od razmatranja dvajuIspitivanje prilagodbe teoretske funkcije empirijskim podacima polazi od razmatranja dvajufrekvencija: empirijske fi i teoretske fit kroz n razreda u koje su podaci grupirani. Razlike se ustanove prema Fisherovom izrazu: Ova funkcija približno ima gama raspodjelu vjerojatnosti:∑

=

−=

n

i it

iti

fff

1

22 )(χ

22χk

gdje je k stupanj slobode koji ovisi o broju razreda n i o prirodi funkcije koja se testira zapravo o

( ) 222

2

2

2

22

1)(χ

χχ−−

⋅⎟⎠⎞

⎜⎝⎛Γ

= ek

pk

k

gdje je k stupanj slobode koji ovisi o broju razreda n i o prirodi funkcije koja se testira, zapravo o broju parametara koji tu funkciju definiraju. Stupanj slobode određen je izrazom k = n – r - 1 gdje je r broj parametara koji definiraju funkciju raspodjele koja se testira (npr.: binomna raspodjela r = 1 , Poasonova raspodjela r = 1 ; normalna raspodjela r = 2 ; Pearson III raspodjela r = 3).

2 j l il i liči j il đ j k f k ij i ij k jχ2 je vrlo ilustrativna veličina za ocjenu prilagođavanja teoretske frekvencije na empirijsku, jerukoliko su razlike između tih učestalosti veće biti će i χ2 veći. Prilagodba je dakle to bolja što jevrijednost χ2 manja. U praksi se konvencionalno uzima prag signifikantnosti α = 0,05 (5%), tj. smatrase da je neprihvatljivo ako χ2 padne izvan područja vrijednosti kojoj odgovara kumulativna vjerojatnostod F(χ2 ) = 1- α = 1- 0,05 = 0,95 = 95 % . Tada se kaže da je χ2 signifikantan, što znači da razmatranu teoretsku funkciju raspodjele treba odbaciti, jer su razlike empirijskih i teorijskih frekvencija prevelike

TESTIRANJE PRILAGODBE χ2 TESTOM - nastavak

Postupak testiranja:

1. Niz od N vrijednosti složenih po rastućem ili padajućem redu podijeli se u nrazreda, s time da svaki razred sadrži najmanje 5 eksperimentalnih (mjerenih)podataka. Svaki razred i omeđen je graničnim veličinama xi-l i xi .

2. Izračunaju se teoretske vrijednosti frekvenicija fit prema izabranom zakonu raspodjele koji se testira. Ako je p(x) gustoća vjerojatnosti zakona koji se testira tada je:

∫ix

dNf )(

3. Odrede se za svaki razred i razlike fi – fit koje se kvadriraju, a potom podjele s fit. Zbroj od n na taj način dobivenih veličina čini vrijednost χ2

0

∫−

⋅⋅=ix

it dxxpNf1

)(

Zbroj od n na taj način dobivenih veličina čini vrijednost χ 0 .

4. Usvoji se zatim prag signifikantnosti α (obično α = 0,05) i ustanovi se broj stupnjeva slobode k (k = n – r – 1 ) pa se za te vrijednost iz statističkih tablica za χ2

odredi pripadnu vjerojatnost χ2 , od koje prethodno proračunati χ20 ne bi smio biti p p j j χ j p p χ 0

veći. Ako je proračunati iznos χ20 manji od χ2 određenog iz tablica (na osnovu

usvojenog praga signifikantnosti α i utvrđenog stupnja slobode k), tada je teorijska krivulja raspodjele vjerojatnosti koju testiramo prihvatljiva za primjenu. Ako se testira više teorijskih krivulja, najbolja je ona koja ima najveću razliku j j j j j j jizmeđu vrijednosti χ2 iz tablica i proračunate vrijednosti χ2

0 .

ILUSTRACIJA PRILAGODBE NEKIH KRIVULJA RASPODJELE na jednom primjeru primjene

PRIMJER IZRAČUNA 100 i 1000 GODIŠNJEG PROTOKAprema Gaussovoj raspodjeli

r.br God. Qi,max[m3 /s] Qi – Qsr (Qi – Qsr )2

1 1950 122 14,8 219,042 51 83 - 24,2 585,64

Za Pr =100 i Pr =1000 godišnji protok vjerojatnost pojavljivanja je:

( ) 01,0100

11===≥=

rPxXFp ( ) 001,0

100011

===≥=P

xXFp3 52 72 - 35,2 1239,044 53 71 - 36,2 1310,445 54 109 1,8 3,246 55 182 74,8 5595,047 56 104 3 2 10 24

Iz tablica Gaussovog integrala očita se: za p = 0,01 → | z | = 2,33za p = 0,001 → | z | = 3,09

Prema definiciji Gaussove raspodjele:

r 1000rP

7 56 104 - 3,2 10,248 57 74 - 33,2 1102,249 58 75 -32,2 1036,84

10 59 112 4,8 23,0411 1960 192 84,8 7191,04

Iz zadanog niza podataka izračunaju se parametri raspodjele:

[ ]sm /3

σsrQQz −

= zQQ sr ⋅+= σ

12 61 171 63,8 4070,4413 62 96 - 11,3 125,4414 63 72 - 35,2 1239,0415 64 104 - 3,2 10,2416 65 89 18 2 331 24

2,10720

2144=== ∑

NQ

Q isr

( ) 1736202617111 2 =⋅== ∑ QQσ16 65 89 - 18,2 331,2417 66 99 - 8,2 67,2418 67 91 - 16,2 262,4419 68 84 -23,2 538,2420 69 142 34,8 1211,04

pa se dobiva:za Pr =100 g. → Q100 = Qsr + σ·z = 107,2 + 2,33 · 36,17 = 191,13 (m3 /s)

( ) 17,3620,2617120

=⋅=−= ∑ sri QQN

σ

, ,∑ 2144 26171,20

r g Q100 Qsr , , , , ( )za Pr =1000 g. → Q1000 = Qsr + σ·z = 107,2 + 3,09 · 36,17 = 218,97 (m3 /s)

PRIMJER IZRAČUNA 100 i 1000 GODIŠNJEG PROTOKAprema Galtonovoj (log-normalnoj) raspodjeli

r.br Qi,max[m3 /s] Yi= logQi,max Yi – Ysr (Qi – Qsr )2

1 122 2,0864 0,0776 0,00602 83 1,9191 -0,0897 0,0080

Za Pr =100 i Pr =1000 godišnji protok vjerojatnost pojavljivanja je:

( ) 01,0100

11===≥=

PxXFp ( ) 001,0

100011

===≥=P

xXFp3 72 1,8573 -0,1515 0,02304 71 1,8513 -0,1575 0,02485 109 2,0374 0,0286 0,00086 182 2,2601 0,2513 0,06327 104 2 0170 0 0082 0 0001

Iz Gaussovog integrala očita se: za p = 0,01 → | z | = 2,33za p = 0,001 → | z | = 3,09

Prema definiciji Galtnove raspodjele: Y = log Q tj Q = 10Y

100rP ( )1000rP

7 104 2,0170 0,0082 0,00018 74 1,8692 -0,1396 0,01959 75 1,8751 -0,1337 0,0179

10 112 2,0492 0,0404 0,001611 192 2,2833 0,2745 0,0754

Prema definiciji Galtnove raspodjele: Y log Q tj. Q 10

Iz zadanog niza podataka izračunaju se parametri raspodjele:

σsrYYz −

= zYY sr ⋅+= σ

12 171 2,2330 0,2242 0,050313 96 1,9823 -0,0265 0,000714 72 1,8573 -0,1515 0,023015 104 2,0170 0,0082 0,000116 89 1 9494 0 0594 0 0035

Iz zadanog niza podataka izračunaju se parametri raspodjele:

0088,2201756,40

=== ∑N

YY i

sr

( ) 1319,03481,011 2 =⋅=−= i YYσ16 89 1,9494 -0,0594 0,003517 99 1,9956 -0,0132 0,000218 91 1,9590 -0,0498 0,002519 84 1,9243 -0,0845 0,007120 142 2,1523 0,1435 0,0206

pa se dobiva:za Pr =100 g. → Y100 = Ysr + σ·z = 2,0088 + 2,33 · 0,1319 = 2,3156

Q100 = 10Y = 102,3156 = 206,82 (m3 /s)

( ) 1319,03481,020sriy YY

, , ,∑ 40,1756 0,3481 za Pr =1000 g.→ Y1000 = Ysr + σ·z = 2,0088 + 3,09 · 0,1319 = 2, 4164

Q1000 = 10Y = 102,4164 = 260,84 (m3/s)

Test Kolmogorova• Za ocjenu prilagodbe

empirijske raspodjele teoretskom uzima se najveća apsolutna razlika između te dvije funkcije raspodjele:

• Ddop su različite ovisno o pragu značajnosti a i opsegu uzorka n, te su dane tabelarno.

( ) ( )

α=≥≤

−=

)(

max

on

on

nn

DDPDD

xFxFD

Test Kolmogorov-Smirnova

Granične vrijednosti Do u funkciji veličine uzorka N i praga značajnosti a

PRIMJER IZRAČUNA 100 i 1000 GODIŠNJEG PROTOKApribližnim grafoanalitičkim postupkom po Weibullu

Empirijska vjerojatnost po Weibullu:

( ) =≥=nxXFp i

( )1+

=≥=N

nxXFp i

ni Qmax F(X≥x) [%]

1 192 0.0476 4.76

Ako se zadani niz podataka uredi po redosljedu opadanja i za njega proračuna Weibullva kompromisna

( )1+

≥N

xXFp2 182 0.0952 9.523 171 0.1429 14.294 142 0.1905 19.055 122 0.2381 23.816 112 0 2857 28 57 p p

vjerojatnost, moguće je te vjerojatnosti nanjeti na log-p papir i aproksimirati te vjerojatnosti pravcem. Sa tako dobivenog pravca moguće je očitati

6 112 0.2857 28.577 109 0.3333 33.338 104 0.3810 38.109 104 0.4286 42.86

10 99 0 4762 47 62 g p g jtražene vrijednsti protoka za 100 i 1000 godišnji povratni period. To je učinjeno, a dobiveni rezultat glasi:

10 99 0.4762 47.62

11 96 0.5238 52.38

12 91 0.5714 57.14

13 89 0.6190 61.90

14 84 0 6667 66 67Q100 = 222 m3/sQ1000 = 305 m3/s

14 84 0.6667 66.67

15 83 0.7143 71.43

16 75 0.7619 76.19

17 74 0.8095 80.95

18 72 0.8571 85.71

19 72 0.9048 90.48

20 71 0.9524 95.24

PRIMJER IZRAČUNA 100 i 1000 GODIŠNJEG PROTOKApribližnim grafoanalitičkim postupkom temeljem Weibull-ove vjerojatnoće

PAPIR VJEROJATNOSTI ZA NORMALNU RASPODJELU

p (%)

1

10

100

PAPIR VJEROJATNOSTI ZA LOG-NORMALNU

RASPODJELU

p (%)

100 - p (%)