alfred stach instytut paleogeografii i geoekologii uam
DESCRIPTION
Baza danych prawdopodobieństwa maksymalnych miesięcznych i rocznych sum dobowych opadów z terenu Polski – wersja 1. Alfred Stach Instytut Paleogeografii i Geoekologii UAM. Prawdopodobieństwo maksymalnych okresowych sum dobowych opadów Atlas hydrologiczny … 1986. - PowerPoint PPT PresentationTRANSCRIPT
Baza danychprawdopodobieństwamaksymalnych miesięcznychi rocznych sum dobowych opadówz terenu Polski – wersja 1
Alfred StachInstytut Paleogeografii i Geoekologii UAM
Prawdopodobieństwo maksymalnych okresowych sum dobowych opadów Atlas hydrologiczny … 1986
Wykorzystano dane z 301 stacji i posterunków z lat 1951 – 1975
Do określenia prawdopodobieństwa maksymalnych sum dobowych zastosowano rozkład Pearsona III typu i metodę kwantyli do szacowania jego parametrów
„Zmienność maksymalnych sum dobowych w skali kraju jest niewielka, natomiast rozrzut wyników obliczeń dla jednakowych prawdopodobieństw występowania jest znaczny na obszarach o zbliżonych warunkach fizyczno-geograficznych” (Ciepielowski, Dąbkowski 2006)
„W związku z rozwojem metod empirycznych oceny maksymalnych przepływów prawdopodobnych pochodzenia deszczowego w zlewniach niekontrolowanych hydrologicznie, przydatność tej charakterystyki (tj. maksymalnych sum dobowych) jest duża, …” (Ciepielowski, Dąbkowski 2006)
Atlas hydrologiczny … 1986
Metodyka opracowania nowej bazy
Użyto wszystkie dostępne dane MSDO z okresu 1956 – 1980 (opublikowane w Rocznikach Opadowych i pozyskane z przygranicznej strefy na terenie Niemiec).
Zastosowano metodę przestrzenną – uwzględniającą autokorelację MSDO
Z dostępnych metod - kriging multigaussowski (ang. multigaussian kriging), kriging dysjunktywny (ang. disjunctive kriging) oraz kriging wartości kodowanych (ang. indicator kriging – IK) – wybrano ostatni z wymienionych
Metodykę IK przedstawiono 2 lata temu; kompletne opisy znajdują się w szeregu podręczników (między innymi Chilès, Delfiner 1999, Deutsch, Journel 1998, Goovaerts 1997, Webster, Oliver 2001)
Kryteria wyboru metodykrigingu wartości kodowanych (IK)
Wady: utrata części informacji ze względu dyskredytyzację ciągłej dystrybuanty
empirycznej, pracochłonność – konieczność czasochłonnego budowania modelu
semiwariancji dla każdej wartości progowej; często występujące trudności w określeniu modeli dla wartości bardzo niskich i bardzo wysokich zmuszają do subiektywnych decyzji, a te rodzą wątpliwości co do optymalności uzyskanych estymacji,
wykraczanie estymowanych prawdopodobieństw poza dopuszczalny zakres (0, 1), oraz błędy w ich relacjach porządkowych,
arbitralnie przyjmowana metoda interpolacji/ekstrapolacji uzyskanej warunkowej dystrybuanty.
Zalety: potwierdzona w dziesiątkach zastosowań i testów metodycznych
skuteczność, brak trudnych do weryfikacji założeń dotyczących rozkładu statystycznego
populacji (metoda nieparametryczna), żadna z alternatywnych metod nie jest wyraźnie lepsza, alternatywne metody są bardziej skomplikowane = bardziej „podatne” na
błędy metodyczne, łatwa możliwość uwzględnienia danych uzupełniających („twardych” i
„miękkich”). powszechna dostępność oprogramowania (Deutsch, Journel 1998, Mao,
Journel 1998, Pardo-Igúzquiza, Dowd 2005, Richmond 2002.
Problem rozdzielczościrastrowej bazy danych
Analizy GIS których efektem są rastrowe modele zmienności przestrzennej wymagają na etapie planowania metodyki podjęcia decyzji o ich rozdzielczości, czyli inaczej mówiąc o wymiarach oczka siatki.
Najważniejsze kryteria brane pod uwagę dotyczą zbioru danych na podstawie którego budowany jest model:
typ próbkowania (punktowe bądź obszarowe; losowe, regularne, preferencyjne, profilowe itp.),
zagęszczenie danych (ilość na jednostkę powierzchni), charakterystyki zmienności przestrzennej analizowanej cechy:
statystyki lokalne, parametry autokorelacji,
rozkład statystyczny błędów zarówno samych pomiarów, jak i określenia lokalizacji stanowisk pomiarowych.
Kryteria uzupełniające: docelowa skala modelu (mapy), przeznaczenie modelu, ograniczenia odnośnie mocy obliczeniowej i pamięci
komputera.
Problem rozdzielczościrastrowej bazy danych
Wykorzystano zalecenia Hengla (2006) Kryteria:
docelowa skala modelu (ok. 1 : 6 000 000): zakres rozdzielczości optymalnych od 600 do 15 000 m; rozdzielczość optymalna – 3 000 m,
ilość (zagęszczenie danych): zakres rozdzielczości optymalnych - od 567 do 1134 m; rozdzielczość optymalna – 900 m,
typ rozkładu przestrzennego danych źródłowych: zakres rozdzielczości optymalnych - od 1300 m do 3900 m; rozdzielczość optymalna – 2 800 m,
zasięg autokorelacji danych: zakres rozdzielczości optymalnych - od 1560 do 7750 m; rozdzielczość optymalna – 750 m,
Błąd określenia położenia stanowiska pomiarowego: od 600 do 900 m
Przyjęta ostatecznie rozdzielczość modelu: 1000 m
Problem zmian ilościi rozkładu przestrzennego danych
Dane pomiarowe
Kompletność serii pomiarowych
Równomierność pokrycia
Uzupełnianie serii pomiarowych
Analiza serii czasowych
Analiza przestrzenna (interpolacja)
Eliminacjadanych
Eliminacjadanych
Dane pomiarowe
Analiza przestrzenna
(interpolacja) dla t1
t1 t2 t4
Analiza statystyczna (w tym serii czasowych)
Analiza przestrzenna
(interpolacja) dla t2
Analiza przestrzenna
(interpolacja) dla t3
Analiza przestrzenna
(interpolacja) dla t4
t3 t5
Analiza przestrzenna
(interpolacja) dla t...
Analiza przestrzenna
(interpolacja) dla tn-2
... tn-2
Analiza przestrzenna
(interpolacja) dla tn-1
tn-1
Analiza przestrzenna
(interpolacja) dla tn
tn
Problem zmian ilościi rozkładu przestrzennego danych
195
6
195
7
195
8
195
9
196
0
196
1
196
2
196
3
196
4
196
5
196
6
196
7
196
8
1969
1970
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
Rok – Year
1600
1800
2000
2200
2400
2600
2800
Og
óln
a ilo
ść d
anyc
h –
To
tal n
um
ber
of
dat
a
M iesiące – Months
a
b
c
d
20
30
40
50
60
70
Dan
e n
iem
ieckie – Ge
rman
data
A
1956
1957
1958
1959
1960
1961
1962
1963
1964
1965
1966
1967
1968
1969
1970
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
Rok - Year
4000
6000
8000
Od
leg
łość
- [
m]
- D
ista
nce
0
0,4
0,8
Sk
oś
no
ść
- Sk
ew
ne
ss
0,9
1
1,1
1,2 Ws
ka
źnik
- Cla
rk and
Eva
ns - In
de
x
1956
1957
1958
1959
1960
1961
1962
1963
1964
1965
1966
1967
1968
1969
1970
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
Rok - Year
4000
6000
8000
Od
leg
łoś
ć -
[m]
- D
ista
nc
e
0
0,4
0,8S
ko
śn
oś
ć - S
kew
ness
(a)
(b)
(c)
(d)
0,9
1
1,1
1,2 Ws
ka
źnik
- Cla
rk and
Eva
ns - In
de
x
B
Zestawienie ilości pomiarów MSDO w Polsce i w Niemczech, które wykorzystano w niniejszym opracowaniu: a – dane miesięczne z Roczników Opadowych PIHM/IMGW, b – dane roczne z Roczników Opadowych PIHM/IMGW, c – miesięczne dane z przygranicznej strefy na obszarze Niemiec, d – roczne dane z przygranicznej strefy na obszarze Niemiec
Statystyki odległości najbliższego sąsiada i losowości rozkładu przestrzennego punktów
pomiarowych, dla których analizowano MSDO opadów, w kolejnych miesiącach (A) i latach (B) wielolecia 1956-80. Objaśnienia: (a) – średnia odległość do
najbliższego sąsiada, (b) – odchylenie standardowe odległości do najbliższego sąsiada, (c) – skośność odległości do najbliższego
sąsiada, (d) – wskaźnik Clarka i Evansa losowości rozkładu przestrzennego.
Problem zmian ilościi rozkładu przestrzennego danych – ocena za pomocą kroswalidacji
0
1
2
3
4
5
6
7
8
9
10
1 10 19 28 37 46 55 64 73 82 91 100 109 118 127 136 145 154 163 172 181 190 199 208 217 226 235 244 253 262 271 280 289 298
Miesiące
MA
E (
mm
) i M
SS
R
-0.3
-0.25
-0.2
-0.15
-0.1
-0.05
0
0.05
ME
(mm
)
MAE
MSSR
ME
Problem zmian ilościi rozkładu przestrzennego danych – ocena za pomocą kroswalidacji
0.92
0.93
0.94
0.95
0.96
0.97
0.98
0.99
1
1 11 21 31 41 51 61 71 81 91 101 111 121 131 141 151 161 171 181 191 201 211 221 231 241 251 261 271 281 291
Miesiące w latach 1956-80
GI
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
PI-s
w
G
PI-sw
Problem optymalizacji parametrów obliczeń
Ilość punktów danych używanych do estymacji wartości każdego węzła siatki – optymalizacja za pomocą kroswalidacji
4 8 12 16 20 24Ilość punktów w sąsiedztw ie
9.4
9.6
9.8
10
10.2
Śre
dni
błą
d a
bso
lutn
y (M
AE
)
08 -56
06-57
10-61
05-65
07-65
05-67
02-721
1.2
1.4
1.6
1.8
2
2.2
5.2
5.6
6
6.4
Problem optymalizacji parametrów obliczeń:
Ilość punktów danych używanych do estymacji wartości każdego węzła siatki – optymalizacja za pomocą kroswalidacji
4 8 12 16 20 24Ilość punktów w sąsiedztw ie
0.8
0.84
0.88
0.92
0.96
1
Do
kła
dno
ść (
GI)
08 -56
06-57
10-61
05-65
07-65
05-67
02-72
4 8 12 16 20 24Ilość punktów w sąsiedztw ie
0.6
0.8
1
1.2
1.4
Sze
roko
ść p
asm
a (P
I-w
idth
)
08 -56
06-57
10-61
05-65
07-65
05-67
02-72
0.38
0.4
0.42
0.44
Wybrane przykłady z opracowanej wieloletniej bazy danych
200000 300000 400000 500000 600000 700000 800000
W spółrzędna - X (m) - Coordinate
200000
300000
400000
500000
600000
700000
Wsp
ółr
zęd
na
- Y
(m
) -
Co
ord
inat
e
5.56.06.57.07.58.08.59.09.510.010.511.011.512.012.513.013.5
200000 300000 400000 500000 600000 700000 800000
W spółrzędna - X (m) - Coordinate
200000
300000
400000
500000
600000
700000
Wsp
ółr
zęd
na
- Y
(m
) -
Co
ord
inat
e
16.0
18.0
20.0
22.0
24.0
26.0
28.0
30.0
32.0
34.0
36.0
38.0
40.0
Średnia oczekiwana wartość MSDO (mm)
Styczeń Lipiec
Wybrane przykłady z opracowanej wieloletniej bazy danych
Odchylenie standardowe wartości oczekiwanej (mm)
Styczeń Lipiec
200000 300000 400000 500000 600000 700000 800000
W spółrzędna - X (m) - Coordinate
200000
300000
400000
500000
600000
700000
Wsp
ółr
zęd
na
- Y
(m
) -
Co
ord
inat
e
5.05.56.06.57.07.58.08.59.09.510.010.511.011.512.012.513.013.514.014.5
200000 300000 400000 500000 600000 700000 800000
W spółrzędna - X (m) - Coordinate
200000
300000
400000
500000
600000
700000
Wsp
ółr
zęd
na
- Y
(m
) -
Co
ord
inat
e
16
18
20
22
24
26
28
30
32
34
36
38
40
42
44
Wybrane przykłady z opracowanej wieloletniej bazy danych
Oczekiwana suma opaduo prawdopodobieństwie 0,1 (mm)
Styczeń Lipiec
200000 300000 400000 500000 600000 700000 800000
W spółrzędna - X (m) - Coordinate
200000
300000
400000
500000
600000
700000
Wsp
ółr
zęd
na
- Y
(m
) -
Co
ord
inat
e
1213141516171819202122232425262728293031323334
200000 300000 400000 500000 600000 700000 800000
W spółrzędna - X (m) - Coordinate
200000
300000
400000
500000
600000
700000
Wsp
ółr
zęd
na
- Y
(m
) -
Co
ord
inat
e
35
40
45
50
55
60
65
70
75
80
85
90
95
100
105
Wybrane przykłady z opracowanej wieloletniej bazy danych
Oczekiwana suma opaduo prawdopodobieństwie 0,01 (mm)
Styczeń Lipiec
200000 300000 400000 500000 600000 700000 800000
W spółrzędna - X (m) - Coordinate
200000
300000
400000
500000
600000
700000
Wsp
ółr
zęd
na
- Y
(m
) -
Co
ord
ina
te
202224262830323436384042444648505254
200000 300000 400000 500000 600000 700000 800000
W spółrzędna - X (m) - Coordinate
200000
300000
400000
500000
600000
700000
Wsp
ółr
zęd
na
- Y
(m
) -
Co
ord
inat
e
65707580859095100105110115120125130135140145150155
Wybrane przykłady z opracowanej wieloletniej bazy danych
Pole prawdopodobieństwa rocznych MSDO
Wartość oczekiwana (mm) Odchylenie standardowewartości oczekiwanej (mm)
200000 300000 400000 500000 600000 700000 800000
W spółrzędna - X (m) - Coordinate
200000
300000
400000
500000
600000
700000
Wsp
ółr
zęd
na
- Y
(m
) -
Co
ord
inat
e
283032343638404244464850525456586062
200000 300000 400000 500000 600000 700000 800000
W spółrzędna - X (m) - Coordinate
200000
300000
400000
500000
600000
700000
Wsp
ółr
zęd
na
- Y
(m
) -
Co
ord
inat
e
182022242628303234363840424446485052
Stare i nowe:podobieństwa i różnice
200000 300000 400000 500000 600000 700000 800000
W spółrzędna - X (m) - Coordinate
200000
300000
400000
500000
600000
700000
Wsp
ółr
zęd
na
- Y
(m
) -
Co
ord
inat
e
859095100105110115120125130135140145150155160165170
Podsumowanie - metodyka Źródłem na podstawie którego wykonano opracowanie było
747 486 wartości maksymalnych opadów dobowych w poszczególnych miesiącach wielolecia 1956-80 (średnio ok. 2492) i 61 940 sum maksymalnych rocznych opadów dobowych (średnio ok. 2478)
Do opracowania rastrowej bazy danych prawdopodobieństwa MSDO wykorzystano metodę krigingu wartości kodowanych dla 13 wartości progowych (1, 5, 10, 20 …, 90, 95 i 99% percentyl). Przed wykonaniem obliczeń przygotowano 4225 modeli struktury przestrzennej (325 zbiorów danych 13 wartości progowych). Parametry obliczeń optymalizowano za pomocą kroswalidacji.
Na podstawie nieprzestrzennych i przestrzennych cech źródłowego zbioru danych stwierdzono, że optymalna rozdzielczość tworzonych modeli rastrowych powinna wynosić 1 1 km.
Stwierdzono, że zmiany ilości i rozkładu przestrzennego punktów pomiarowych zachodzące w analizowanym wieloleciu nie miały wpływu na jakość uzyskanych wyników
Docelowa siatka interpolacyjna miała 319 114 węzłów obejmując całe terytorium lądowe Polski, Zalew Szczeciński, część polską Zalewu Wiślanego, Zatokę Pucką, a także strefę o szerokości 2 km poza granicami
Podsumowanie - efekty
Etapowym wynikiem obliczeń są rastrowe modele prawdopodobieństwa MSDO dla każdego z 325 źródłowych zbiorów danych (325 319 114 węzłów 13 progów = 1 348 256 650 wartości)
Końcowym efektem są średnie wieloletnie pola prawdopodobieństwa MSDO dla poszczególnych miesięcy i całego roku (13 319 114 węzłów 13 progów = 53 930 266 wartości)
Z uzyskanych rozkładów prawdopodobieństwa MSDO dla każdego węzła siatki interpolacyjnej można prosto obliczyć:
wartość oczekiwaną opadu (średnią rozkładu), odchylenie standardowe (wariancję warunkową), sumę opadu dobowego o zadanym prawdopodobieństwie
wystąpienia, prawdopodobieństwo opadu o podanej sumie dobowej, inne statystyki, na przykład przedziałowe.
Baza jest przeznaczona przede wszystkim do ocen punktowych. Do analiz obszarowych bardziej nadają się dane symulowane. Wersja 2 bazy – w przygotowaniu - będzie miała taki charakter
Podsumowanie – stare/nowe
Stwierdzono, że uzyskane modele wieloletnie, oprócz znacznie większej rozdzielczości przestrzennej, od poprzednich „analogowych” danych różnią się istotnie wielkością prognozowanych rocznych MSDO o prawdopodobieństwie 1% na Niżu nie ma obszarów o opadach poniżej 80 mm dla większość obszaru niżowego maksymalny opad
dobowy o prawdopodobieństwie 0,01 wynosi od 120 do 150 mm (poprzednio 80 – 100 mm)
najwyższe „stuletnie” opady dobowe są prognozowane w tych samych lokalizacjach, lecz ich sumy są znacząco niższe – około 175 mm, zamiast jak poprzednio ponad 200 mm
DZIĘKUJĘ ZA UWAGĘ