alfred stach instytut paleogeografii i geoekologii uam

Baza danychprawdopodobieństwamaksymalnych miesięcznychi rocznych sum dobowych opadówz terenu Polski – wersja 1

Alfred StachInstytut Paleogeografii i Geoekologii UAM

Prawdopodobieństwo maksymalnych okresowych sum dobowych opadów Atlas hydrologiczny … 1986

Wykorzystano dane z 301 stacji i posterunków z lat 1951 – 1975

Do określenia prawdopodobieństwa maksymalnych sum dobowych zastosowano rozkład Pearsona III typu i metodę kwantyli do szacowania jego parametrów

„Zmienność maksymalnych sum dobowych w skali kraju jest niewielka, natomiast rozrzut wyników obliczeń dla jednakowych prawdopodobieństw występowania jest znaczny na obszarach o zbliżonych warunkach fizyczno-geograficznych” (Ciepielowski, Dąbkowski 2006)

„W związku z rozwojem metod empirycznych oceny maksymalnych przepływów prawdopodobnych pochodzenia deszczowego w zlewniach niekontrolowanych hydrologicznie, przydatność tej charakterystyki (tj. maksymalnych sum dobowych) jest duża, …” (Ciepielowski, Dąbkowski 2006)

Atlas hydrologiczny … 1986

Metodyka opracowania nowej bazy

Użyto wszystkie dostępne dane MSDO z okresu 1956 – 1980 (opublikowane w Rocznikach Opadowych i pozyskane z przygranicznej strefy na terenie Niemiec).

Zastosowano metodę przestrzenną – uwzględniającą autokorelację MSDO

Z dostępnych metod - kriging multigaussowski (ang. multigaussian kriging), kriging dysjunktywny (ang. disjunctive kriging) oraz kriging wartości kodowanych (ang. indicator kriging – IK) – wybrano ostatni z wymienionych

Metodykę IK przedstawiono 2 lata temu; kompletne opisy znajdują się w szeregu podręczników (między innymi Chilès, Delfiner 1999, Deutsch, Journel 1998, Goovaerts 1997, Webster, Oliver 2001)

Kryteria wyboru metodykrigingu wartości kodowanych (IK)

Wady: utrata części informacji ze względu dyskredytyzację ciągłej dystrybuanty

empirycznej, pracochłonność – konieczność czasochłonnego budowania modelu

semiwariancji dla każdej wartości progowej; często występujące trudności w określeniu modeli dla wartości bardzo niskich i bardzo wysokich zmuszają do subiektywnych decyzji, a te rodzą wątpliwości co do optymalności uzyskanych estymacji,

wykraczanie estymowanych prawdopodobieństw poza dopuszczalny zakres (0, 1), oraz błędy w ich relacjach porządkowych,

arbitralnie przyjmowana metoda interpolacji/ekstrapolacji uzyskanej warunkowej dystrybuanty.

Zalety: potwierdzona w dziesiątkach zastosowań i testów metodycznych

skuteczność, brak trudnych do weryfikacji założeń dotyczących rozkładu statystycznego

populacji (metoda nieparametryczna), żadna z alternatywnych metod nie jest wyraźnie lepsza, alternatywne metody są bardziej skomplikowane = bardziej „podatne” na

błędy metodyczne, łatwa możliwość uwzględnienia danych uzupełniających („twardych” i

„miękkich”). powszechna dostępność oprogramowania (Deutsch, Journel 1998, Mao,

Journel 1998, Pardo-Igúzquiza, Dowd 2005, Richmond 2002.

Problem rozdzielczościrastrowej bazy danych

Analizy GIS których efektem są rastrowe modele zmienności przestrzennej wymagają na etapie planowania metodyki podjęcia decyzji o ich rozdzielczości, czyli inaczej mówiąc o wymiarach oczka siatki.

Najważniejsze kryteria brane pod uwagę dotyczą zbioru danych na podstawie którego budowany jest model:

typ próbkowania (punktowe bądź obszarowe; losowe, regularne, preferencyjne, profilowe itp.),

zagęszczenie danych (ilość na jednostkę powierzchni), charakterystyki zmienności przestrzennej analizowanej cechy:

statystyki lokalne, parametry autokorelacji,

rozkład statystyczny błędów zarówno samych pomiarów, jak i określenia lokalizacji stanowisk pomiarowych.

Kryteria uzupełniające: docelowa skala modelu (mapy), przeznaczenie modelu, ograniczenia odnośnie mocy obliczeniowej i pamięci

komputera.

Problem rozdzielczościrastrowej bazy danych

Wykorzystano zalecenia Hengla (2006) Kryteria:

docelowa skala modelu (ok. 1 : 6 000 000): zakres rozdzielczości optymalnych od 600 do 15 000 m; rozdzielczość optymalna – 3 000 m,

ilość (zagęszczenie danych): zakres rozdzielczości optymalnych - od 567 do 1134 m; rozdzielczość optymalna – 900 m,

typ rozkładu przestrzennego danych źródłowych: zakres rozdzielczości optymalnych - od 1300 m do 3900 m; rozdzielczość optymalna – 2 800 m,

zasięg autokorelacji danych: zakres rozdzielczości optymalnych - od 1560 do 7750 m; rozdzielczość optymalna – 750 m,

Błąd określenia położenia stanowiska pomiarowego: od 600 do 900 m

Przyjęta ostatecznie rozdzielczość modelu: 1000 m

Problem zmian ilościi rozkładu przestrzennego danych

Dane pomiarowe

Kompletność serii pomiarowych

Równomierność pokrycia

Uzupełnianie serii pomiarowych

Analiza serii czasowych

Analiza przestrzenna (interpolacja)

Eliminacjadanych

Eliminacjadanych

Dane pomiarowe

Analiza przestrzenna

(interpolacja) dla t1

t1 t2 t4

Analiza statystyczna (w tym serii czasowych)







t3 t5


(interpolacja) dla t...


(interpolacja) dla tn-2

... tn-2


(interpolacja) dla tn-1

tn-1


(interpolacja) dla tn

tn

Problem zmian ilościi rozkładu przestrzennego danych

195

6

195

7

195

8

195

9

196

0

196

1

196

2

196

3

196

4

196

5

196

6

196

7

196

8

1969

1970

1971

1972

1973

1974

1975

1976

1977

1978

1979

1980

Rok – Year

1600

1800

2000

2200

2400

2600

2800

Og

óln

a ilo

ść d

anyc

h –

To

tal n

um

ber

of

dat

a

M iesiące – Months

a

b

c

d

20

30

40

50

60

70

Dan

e n

iem

ieckie – Ge

rman

data

A

1956

1957

1958

1959

1960

1961

1962

1963

1964

1965

1966

1967

1968

1969

1970

1971

1972

1973

1974

1975

1976

1977

1978

1979

1980

Rok - Year

4000

6000

8000

Od

leg

łość

- [

m]

- D

ista

nce

0

0,4

0,8

Sk

oś

no

ść

- Sk

ew

ne

ss

0,9

1

1,1

1,2 Ws

ka

źnik

- Cla

rk and

Eva

ns - In

de

x

1956

1957

1958

1959

1960

1961

1962

1963

1964

1965

1966

1967

1968

1969

1970

1971

1972

1973

1974

1975

1976

1977

1978

1979

1980

Rok - Year

4000

6000

8000

Od

leg

łoś

ć -

[m]

- D

ista

nc

e

0

0,4

0,8S

ko

śn

oś

ć - S

kew

ness

(a)

(b)

(c)

(d)

0,9

1

1,1

1,2 Ws

ka

źnik

- Cla

rk and

Eva

ns - In

de

x

B

Zestawienie ilości pomiarów MSDO w Polsce i w Niemczech, które wykorzystano w niniejszym opracowaniu: a – dane miesięczne z Roczników Opadowych PIHM/IMGW, b – dane roczne z Roczników Opadowych PIHM/IMGW, c – miesięczne dane z przygranicznej strefy na obszarze Niemiec, d – roczne dane z przygranicznej strefy na obszarze Niemiec

Statystyki odległości najbliższego sąsiada i losowości rozkładu przestrzennego punktów

pomiarowych, dla których analizowano MSDO opadów, w kolejnych miesiącach (A) i latach (B) wielolecia 1956-80. Objaśnienia: (a) – średnia odległość do

najbliższego sąsiada, (b) – odchylenie standardowe odległości do najbliższego sąsiada, (c) – skośność odległości do najbliższego

sąsiada, (d) – wskaźnik Clarka i Evansa losowości rozkładu przestrzennego.

Problem zmian ilościi rozkładu przestrzennego danych – ocena za pomocą kroswalidacji

0

1

2

3

4

5

6

7

8

9

10

1 10 19 28 37 46 55 64 73 82 91 100 109 118 127 136 145 154 163 172 181 190 199 208 217 226 235 244 253 262 271 280 289 298

Miesiące

MA

E (

mm

) i M

SS

R

-0.3

-0.25

-0.2

-0.15

-0.1

-0.05

0

0.05

ME

(mm

)

MAE

MSSR

ME

Problem zmian ilościi rozkładu przestrzennego danych – ocena za pomocą kroswalidacji

0.92

0.93

0.94

0.95

0.96

0.97

0.98

0.99

1

1 11 21 31 41 51 61 71 81 91 101 111 121 131 141 151 161 171 181 191 201 211 221 231 241 251 261 271 281 291

Miesiące w latach 1956-80

GI

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

PI-s

w

G

PI-sw

Problem optymalizacji parametrów obliczeń

Ilość punktów danych używanych do estymacji wartości każdego węzła siatki – optymalizacja za pomocą kroswalidacji

4 8 12 16 20 24Ilość punktów w sąsiedztw ie

9.4

9.6

9.8

10

10.2

Śre

dni

błą

d a

bso

lutn

y (M

AE

)

08 -56

06-57

10-61

05-65

07-65

05-67

02-721

1.2

1.4

1.6

1.8

2

2.2

5.2

5.6

6

6.4

Problem optymalizacji parametrów obliczeń:

Ilość punktów danych używanych do estymacji wartości każdego węzła siatki – optymalizacja za pomocą kroswalidacji


0.8

0.84

0.88

0.92

0.96

1

Do

kła

dno

ść (

GI)

08 -56

06-57

10-61

05-65

07-65

05-67

02-72


0.6

0.8

1

1.2

1.4

Sze

roko

ść p

asm

a (P

I-w

idth

)

08 -56

06-57

10-61

05-65

07-65

05-67

02-72

0.38

0.4

0.42

0.44

Wybrane przykłady z opracowanej wieloletniej bazy danych

200000 300000 400000 500000 600000 700000 800000

W spółrzędna - X (m) - Coordinate

200000

300000

400000

500000

600000

700000

Wsp

ółr

zęd

na

- Y

(m

) -

Co

ord

inat

e

5.56.06.57.07.58.08.59.09.510.010.511.011.512.012.513.013.5

200000 300000 400000 500000 600000 700000 800000


200000

300000

400000

500000

600000

700000

Wsp

ółr

zęd

na

- Y

(m

) -

Co

ord

inat

e

16.0

18.0

20.0

22.0

24.0

26.0

28.0

30.0

32.0

34.0

36.0

38.0

40.0

Średnia oczekiwana wartość MSDO (mm)

Styczeń Lipiec


Odchylenie standardowe wartości oczekiwanej (mm)

Styczeń Lipiec

200000 300000 400000 500000 600000 700000 800000


200000

300000

400000

500000

600000

700000

Wsp

ółr

zęd

na

- Y

(m

) -

Co

ord

inat

e

5.05.56.06.57.07.58.08.59.09.510.010.511.011.512.012.513.013.514.014.5

200000 300000 400000 500000 600000 700000 800000


200000

300000

400000

500000

600000

700000

Wsp

ółr

zęd

na

- Y

(m

) -

Co

ord

inat

e

16

18

20

22

24

26

28

30

32

34

36

38

40

42

44


Oczekiwana suma opaduo prawdopodobieństwie 0,1 (mm)

Styczeń Lipiec

200000 300000 400000 500000 600000 700000 800000


200000

300000

400000

500000

600000

700000

Wsp

ółr

zęd

na

- Y

(m

) -

Co

ord

inat

e

1213141516171819202122232425262728293031323334

200000 300000 400000 500000 600000 700000 800000


200000

300000

400000

500000

600000

700000

Wsp

ółr

zęd

na

- Y

(m

) -

Co

ord

inat

e

35

40

45

50

55

60

65

70

75

80

85

90

95

100

105


Oczekiwana suma opaduo prawdopodobieństwie 0,01 (mm)

Styczeń Lipiec

200000 300000 400000 500000 600000 700000 800000


200000

300000

400000

500000

600000

700000

Wsp

ółr

zęd

na

- Y

(m

) -

Co

ord

ina

te

202224262830323436384042444648505254

200000 300000 400000 500000 600000 700000 800000


200000

300000

400000

500000

600000

700000

Wsp

ółr

zęd

na

- Y

(m

) -

Co

ord

inat

e

65707580859095100105110115120125130135140145150155


Pole prawdopodobieństwa rocznych MSDO

Wartość oczekiwana (mm) Odchylenie standardowewartości oczekiwanej (mm)

200000 300000 400000 500000 600000 700000 800000


200000

300000

400000

500000

600000

700000

Wsp

ółr

zęd

na

- Y

(m

) -

Co

ord

inat

e

283032343638404244464850525456586062

200000 300000 400000 500000 600000 700000 800000


200000

300000

400000

500000

600000

700000

Wsp

ółr

zęd

na

- Y

(m

) -

Co

ord

inat

e

182022242628303234363840424446485052

Stare i nowe:podobieństwa i różnice

200000 300000 400000 500000 600000 700000 800000


200000

300000

400000

500000

600000

700000

Wsp

ółr

zęd

na

- Y

(m

) -

Co

ord

inat

e

859095100105110115120125130135140145150155160165170

Podsumowanie - metodyka Źródłem na podstawie którego wykonano opracowanie było

747 486 wartości maksymalnych opadów dobowych w poszczególnych miesiącach wielolecia 1956-80 (średnio ok. 2492) i 61 940 sum maksymalnych rocznych opadów dobowych (średnio ok. 2478)

Do opracowania rastrowej bazy danych prawdopodobieństwa MSDO wykorzystano metodę krigingu wartości kodowanych dla 13 wartości progowych (1, 5, 10, 20 …, 90, 95 i 99% percentyl). Przed wykonaniem obliczeń przygotowano 4225 modeli struktury przestrzennej (325 zbiorów danych 13 wartości progowych). Parametry obliczeń optymalizowano za pomocą kroswalidacji.

Na podstawie nieprzestrzennych i przestrzennych cech źródłowego zbioru danych stwierdzono, że optymalna rozdzielczość tworzonych modeli rastrowych powinna wynosić 1 1 km.

Stwierdzono, że zmiany ilości i rozkładu przestrzennego punktów pomiarowych zachodzące w analizowanym wieloleciu nie miały wpływu na jakość uzyskanych wyników

Docelowa siatka interpolacyjna miała 319 114 węzłów obejmując całe terytorium lądowe Polski, Zalew Szczeciński, część polską Zalewu Wiślanego, Zatokę Pucką, a także strefę o szerokości 2 km poza granicami

Podsumowanie - efekty

Etapowym wynikiem obliczeń są rastrowe modele prawdopodobieństwa MSDO dla każdego z 325 źródłowych zbiorów danych (325 319 114 węzłów 13 progów = 1 348 256 650 wartości)

Końcowym efektem są średnie wieloletnie pola prawdopodobieństwa MSDO dla poszczególnych miesięcy i całego roku (13 319 114 węzłów 13 progów = 53 930 266 wartości)

Z uzyskanych rozkładów prawdopodobieństwa MSDO dla każdego węzła siatki interpolacyjnej można prosto obliczyć:

wartość oczekiwaną opadu (średnią rozkładu), odchylenie standardowe (wariancję warunkową), sumę opadu dobowego o zadanym prawdopodobieństwie

wystąpienia, prawdopodobieństwo opadu o podanej sumie dobowej, inne statystyki, na przykład przedziałowe.

Baza jest przeznaczona przede wszystkim do ocen punktowych. Do analiz obszarowych bardziej nadają się dane symulowane. Wersja 2 bazy – w przygotowaniu - będzie miała taki charakter

Podsumowanie – stare/nowe

Stwierdzono, że uzyskane modele wieloletnie, oprócz znacznie większej rozdzielczości przestrzennej, od poprzednich „analogowych” danych różnią się istotnie wielkością prognozowanych rocznych MSDO o prawdopodobieństwie 1% na Niżu nie ma obszarów o opadach poniżej 80 mm dla większość obszaru niżowego maksymalny opad

dobowy o prawdopodobieństwie 0,01 wynosi od 120 do 150 mm (poprzednio 80 – 100 mm)

najwyższe „stuletnie” opady dobowe są prognozowane w tych samych lokalizacjach, lecz ich sumy są znacząco niższe – około 175 mm, zamiast jak poprzednio ponad 200 mm

DZIĘKUJĘ ZA UWAGĘ

alfred stach instytut paleogeografii i geoekologii uam

Documents