sulyán tímea poisson eloszlás és alkalmazásai · köszönetnyilvánítás ezúton szeretném...
TRANSCRIPT
Eötvös Loránd Tudományegyetem
Természettudományi Kar
Sulyán Tímea
Poisson eloszlás és alkalmazásai
BSc Elemz® Matematikus Szakdolgozat
Témavezet®:
Csiszár Vill®
Valószín¶ségelméleti és Statisztika Tanszék
Budapest, 2016
Köszönetnyilvánítás
Ezúton szeretném megköszönni témavezet®mnek, Csiszár Vill®nek a hasznos taná-
csokat, észrevételeket, mellyel segítette a dolgozatom elkészítését. Hálás vagyok a
konzultációkért valamint a türelméért és megértéséért. Köszönettel tartozom a csa-
ládomnak és barátaimnak, hogy megteremtették a légkört az íráshoz valamint tá-
mogattak a szakdolgozat létrejöttében.
2
Tartalomjegyzék
Bevezetés 3
1. Poisson-eloszlás fajtái 5
1.1. Az egyszer¶ Poisson-eloszlás . . . . . . . . . . . . . . . . . . . . . . . 5
1.2. Az összetett Poisson-eloszlás . . . . . . . . . . . . . . . . . . . . . . . 9
1.3. A keverék Poisson-eloszlás . . . . . . . . . . . . . . . . . . . . . . . . 13
1.3.1. Paraméter becslés . . . . . . . . . . . . . . . . . . . . . . . . . 15
2. Az eloszlás használata közelítésre 18
2.1. A binomiális eloszlás közelítése
Poisson-eloszlással . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.2. Poisson-közelítés párosítással . . . . . . . . . . . . . . . . . . . . . . . 24
3. Folyamatok 27
3.1. A Poisson-folyamat . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.1.1. Homogén Poisson-folyamat . . . . . . . . . . . . . . . . . . . . 27
3.1.2. Inhomogén Poisson-folyamat . . . . . . . . . . . . . . . . . . . 30
3.2. Az összetett Poisson-folyamat . . . . . . . . . . . . . . . . . . . . . . 36
Összefoglalás 37
3
Bevezetés
Siméon Denis Poisson (1781−1840) francia matematikus, �zikus, statisztikus. Élete
során rengeteg ma is használatos eredményt ért el az alkalmazott matematika és
a matematikai �zika területén is. Élete során körülbelül 300-400 matematikai érte-
kezést publikált. Meglep® lehet ekkora mennyiség ismeretében, hogy egyszerre csak
egy dologgal foglalkozott. A Poisson-eloszlás, 1837-ben t¶nt fel el®ször az írásaiban.
A valószín¶ségszámításban egyik leggyakrabban alkalmazott eloszlás a Poisson-
eloszlás, melyet véletlenszer¶ id®pontokban bekövetkez® események számának meg-
határozására használunk egy adott id®intervallumban. Ilyen esemény például az
adatbázis szerverekhez beérkez® lekérdezések, üzletbe érkez® vev®k, sajtóhibák meny-
nyisége egy könyvben, forgalmas keresztez®désben történ® balesetek, valamint a ter-
mészeti katasztrófák száma is.
Szakdolgozatomban ennek az eloszlásnak a sokszín¶ségét vizsgálom. Az 1. feje-
zetben de�niálom a Poisson eloszlás különböz® változatait és a velük kapcsolatos
mértékeket és példákat. A 2. fejezetben módszereket láthatunk arra, hogy hogyan
használjuk más eloszlás közelítésére. A 3. fejezet a Poisson-eloszlás egy még érdeke-
sebb felhasználását mutatja majd be a Poisson-folyamatokon keresztül, ahol az id®
függvényében vizsgáljuk a modelljeinket.
4
1. fejezet
Poisson-eloszlás fajtái
1.1. Az egyszer¶ Poisson-eloszlás
Azt a különleges diszkrét eloszlást fogom bemutatni, melyben a változó megszám-
lálhatóan végtelen sok értéket vehet fel.
1.1. De�níció. (Poisson-eloszlás) A ξ valószín¶ségi változót Poisson-eloszlásúnak
nevezzük, ha lehetséges értékei: 0,1,. . . és
p(k, λ) = P (ξ = k) =λk
k!· e−λ, (1.1)
ahol λ > 0 rögzített és k ∈ N.
Az 1.1-beli mennyiségeket k=0,1,. . . esetére összegezve és eλ Taylor-sorát alkalmazva:
∞∑k=0
p(k, λ) =∞∑k=0
λk
k!· e−λ = e−λ ·
∞∑k=0
λk
k!= e−λ · eλ = 1.
Tehát (1.1)-ben a pozitív számok eloszlást alkotnak, ezért elképzelhet® egy olyan
kísérlet, melynek során annak a valószín¶sége, hogy pontosan k-szor következik be
egy meg�gyelt esemény, éppen p(k, λ).
5
1.2. Tétel. Ha a ξ valószín¶ségi változó Poisson-eloszlású, akkor várható értéke
E(ξ) = λ. (1.2)
Bizonyítás.
E(ξ) =∞∑k=0
xk · p(k, λ) =∞∑k=0
kλk
k!e−λ =
∞∑k=1
kλk
k!e−λ =
=∞∑k=1
λk
(k − 1)!e−λ = λe−λ
∞∑k=1
λk−1
(k − 1)!= λe−λ · eλ = λ.
Tehát valóban λ a várható értéke. �
1.3. Tétel. Ha a ξ valószín¶ségi változó Poisson-eloszlású, akkor szórása
D2(ξ) = λ. (1.3)
Bizonyítás.
E(ξ2) =∞∑k=0
k2λk
k!e−λ =
∞∑k=1
k2λk
k!e−λ =
∞∑k=1
kλk
(k − 1)!e−λ =
=∞∑k=1
[(k − 1) + 1]λk
(k − 1)!e−λ =
∞∑k=2
(k − 1)λk
(k − 1)!e−λ +
∞∑k=1
λk
(k − 1)!e−λ =
= λ2e−λ∞∑k=2
λk−2
(k − 2)!+ λe−λ
∞∑k=1
λk−1
(k − 1)!= λ2 + λ.
A szórásnégyzet:
D2(ξ) = E(ξ2)− E2(ξ) = (λ2 + λ)− λ2 = λ,
amit kapni is akartunk eredményül. �
1.4. De�níció. (Generátorfüggvény) Legyen (a0, a1, . . .) nemnegatív valós szá-
mok olyan sorozata, hogy∑∞
k=0 ak ≤ 1. Ekkor a sorozat generátorfüggvénye
G(z) =∞∑k=0
akzk.
6
Néhány tulajdonsága:
1. G′ξ(1) = E(ξ)
2. Gξ(z) = E(zξ)
3. G′′ξ (1) = E(ξ2)− E(ξ)
1.5. De�níció. (Valószín¶ségi változó generátorfüggvénye) Ha pk jelöli a
P (ξ = k) valószín¶séget, akkor a ξ valószín¶ségi változóhoz tartozó generátorfügg-
vény
Gξ(z) =∞∑k=0
pkzk.
1.6. De�níció. A λ paraméter¶ Poisson-eloszlás generátorfüggvénye:
Gξ(z) =∞∑k=0
λk
k!e−λzk = e−λ
∞∑k=0
(λz)k
k!= e−λeλz = eλ·(z−1).
A generátorfüggvénynek az 1. és 3. tulajdonságát felhasználva, a Poisson-eloszlás
várható értéke és szórása könnyebben meghatározható:
G′ξ(z) = (e−λeλz)′ = λ · e−λeλz
E(ξ) = G′ξ(1) = λ · e−λeλ·1 = λ.
D2(ξ) = G′′ξ (1) +G′ξ(1)−[G′ξ(1)
]2= λ2eλ(1−1) + λeλ(1−1) −
(λeλ(1−1)
)2=
= λ2 + λ− λ2 = λ.
A Poisson-eloszlás fontos tulajdonsága, hogy ha ξ1 és ξ2 független, Poisson-
eloszlású valószín¶ségi változók λ1 és λ2 paraméterekkel, akkor a ξ1 + ξ2 összeg
is Poisson-eloszlású λ1 + λ2 paraméterrel.
A következ®kben megnézünk a valószín¶ségszámítással foglalkozó könyvek pél-
dáihoz hasonló feladatot.
1.7. Feladat. Egy 500 oldalas könyvben várhatóan 200 sajtóhiba található. Mek-
kora annak a valószín¶sége, hogy 10 véletlenszer¶en kiválasztott lapon nem lesz
sajtóhiba, ha feltételezzük, hogy a sajtóhibák száma Poisson-eloszlású?
7
Megoldás. Az egy lapra jutó sajtóhibák száma 200500
, tíz lapra 25· 10 = 4 = λ.
P(10 lapon 0 hiba) =40
0!e−4 = 0, 0183
A könyvb®l 1, 83% eséllyel tudunk kiválasztani véletlenszer¶en 10 lapot, amely
hibátlan.
1.8. Feladat. Az elmúlt évben Nógrád megyében a Központi Statisztikai Hivatal
adatai szerint 649 baleset történt. Mennyi a valószín¶sége, hogy két napon, hétf®n
és pénteken is 3 baleset történik?
Megoldás. A balesetek átlagos száma egy napon λ = 649365
= 1, 78.
Független eseményekr®l van szó, mert a balesetek bekövetkezése nem függ egy-
mástól így az sem, hogy melyik nap hány baleset történik. Éppen ezért
P(hétf®n is és pénteken is 3 baleset) =1, 783
3!e−1,78 · 1, 783
3!e−1,78 = 0, 0251
Tehát annak a valószín¶sége, hogy a két legforgalmasabb nap mindegyikén 3
baleset történjen 2, 5%.
8
1.2. Az összetett Poisson-eloszlás
A független valószín¶ségi változók összegének jelent®s szerepe van. Ezen belül külö-
nösen annak, hogy az összeg tagjainak száma is valószín¶ségi változó.
1.9. De�níció. (Összetett Poisson-eloszlás) Az SN = X1 + . . . + XN véletlen
tagszámú összegben, ha N Poisson-eloszlású, λ várható érték¶, és Xj, j = 1, 2, . . .
független, azonos eloszlású, nemnegatív egész érték¶ valószín¶ségi változókból áll,
melyek függetlenek N-t®l is, akkor SN eloszlása
QS = e−λ∞∑k=0
λk
k!Q∗k, (1.4)
ahol Q = QX-t az összeg tagjaiban szerepl® Xj eloszlások konvolúciójának nevezzük,
melynek jele, Q∗k.
Az összetett Poisson-eloszlás várható értékét és szórásnégyzetét a következ®kép-
pen kapjuk. A teljes várható érték tételét felhasználva kapjuk a várható értéket
E(SN) = E(N) · E(X) = λE(X)
A szórásnégyzet a teljes szórásnégyzet tételéb®l
D2(SN) = E(N)D2(X) +D2(N)E(X)2 = E(N)E(X2) = λE(X2).
1.10. Tétel. Jelölje gX az X1, X2, . . ., GS az SN , GN az N valószín¶ségi változók
generátorfüggvényét. Ekkor
GS = GN ◦GX .
1.11. De�níció. Egy Q = (q0, q1, . . .) valószín¶ségeloszlás korlátlanul osztható, ha
minden n = 1, 2, . . . esetén létezik olyan Pn = (pn,0, pn,1, . . .) eloszlás, amelynek
n-edik konvolúcióhatványa Q-val egyenl®: Q = Pn ∗Pn ∗ · · · ∗Pn. Azaz, ha Q gene-
rátorfüggvényre teljesül, hogy minden n-re n√G(z) is valószín¶ségi generátorfüggvény
a [0, 1] intervallumon.
9
Ilyen például a Poisson-eloszlás. A λ paraméter¶ Poisson-eloszlás a λ/n paraméter¶
Poisson eloszlás n-edik konvolúcióhatványa.
Az 1.10 tétel szerint az összetett Poisson-eloszlás generátorfüggvénye
GS(z) = e−λ+λ·GX(z).
Ebb®l látszik, hogy korlátlanul osztható:
n√GS(z) = e
λn
(GX(z)−1)
szintén összetett Poisson-eloszlás generátorfüggvénye.
1.12. Tétel. (A generátorfüggvények folytonossági tétele) Legyen
n = 1, 2, . . . esetén az (an,0, an,1, . . .) számsorozat generátorfüggvénye Gn(z).
(a) Tegyük fel, hogy minden k = 0, 1, . . . esetén ∃ limn→∞ an,k =: ak. Ekkor
limn→∞Gn(z) = G(z), |z| < 1, ahol G(z) az (a0, a1, . . .) sorozat generátor-
függvénye. S®t, a konvergencia egyenletes a (−1, 1) intervallum minden zárt
részintervallumán.
(b) Tegyük fel, hogy Gn(z) konvergens minden z ∈ (0, 1) pontban. Ekkor minden
k = 0, 1, . . . esetén ∃ limn→∞ an,k =: ak, és Gn(z) az (a0, a1, . . .) sorozat G(z)
generátorfüggvényéhez tart minden z ∈ (−1, 1) pontban.
1.13. Tétel. A diszkrét korlátlanul osztható eloszlások éppen az összetett Poisson-
eloszlások.
Bizonyítás. Legyen H(z) egy korlátlanul osztható eloszlás generátorfüggvénye. Az
azonosan 0 valószín¶ségi változó eloszlása korlátlanul osztható és összetett Poisson
is, feltehetjük tehát, hogy H(0) < 1. Ha H(0) = 0 lenne, akkor n√H(0) = 0, és
mivel n√H(z) is generátorfüggvény, kiemelhet® lenne bel®le z, de akkor H(z)-b®l
már zn, méghozzá bármilyen nagy n-re, ami nyilvánvalóan nem lehetséges. Tehát
0 < H(0) < 1.
Tudjuk, hogy ha G(z) generátorfüggvény, akkor G(z) = G(z)−G(0)1−G(0)
is az: azé az
eloszlásé, amelyet úgy kapunk, hogy a G-hez tartozó eloszlás 0 index¶ tagja helyére
0-t írunk, a többi tagot pedig úgy szorozzuk fel, hogy az összeg ismét 1 legyen. Más
10
szóval, ha G(z) = Gξ(z) = E(zξ), akkor G(z) = E(zξ | ξ > 0), a ξ változó ξ > 0
feltétel melletti feltételes eloszlásának a generátorfüggvénye. Ezért minden n pozitív
egészren√H(z)− n
√H(0)
1− n√H(0)
is generátorfüggvény. Ha a > 0, akkor
n√a = e
1n
log a = 1 +1
n(log a+ o(1)) ,
amint n→∞, ezért
n√H(z)− n
√H(0)
1− n√H(0)
→ logH(z)− logH(0)
− logH(0), 0 < z < 1.
Az 1.12 tétel (b) része szerint a határérték is generátorfüggvény, de azt nem mondja
ki, hogy valószín¶ségeloszlásé: tehát az együtthatók összege lehet, hogy kisebb, mint
1. A limeszfüggvény baloldali határértékét kiszámítva a z = 1 helyen ellen®rizhetjük
ezt. Jelen esetben H folytonossága és logH(1) = 0 miatt ez 1, vagyis
g(z) :=logH(z)− logH(0)
− logH(0)
is valószín¶ségeloszlás generátorfüggvénye.
Tehát a H(z) = eλ(G(z)−1), ahol λ = − logH(0) > 0. �
Az összetett Poisson-eloszlás alkalmazási területei:
A gyakorlatban azon belül az ökológiában széles körben alkalmazzák a következ®-
képpen. Egy adott területen az állatcsaládok számát Poisson-eloszlású valószín¶ségi
változónak tekintik. Az egyes almokban született állatok száma legyen egyforma F
eloszlású, és az állatcsaládokat függetlennek feltételezik. Ekkor a területen született
állatok száma összetett Poisson-eloszlású lesz.
A kockázati modellekben az egyes biztosítóintézetek m¶ködésénél három elemét
különböztetjük meg a pénzforgalomnak
- egyes károk esetén a ki�zetett összeg, más néven összkár,
- biztosítottak be�zetése és a
- kezdeti t®ke.
11
Az összetett kockázati modellek esetén a teljes veszteség mértékét szeretnénk meg-
határozni. Minden egyedhez (kötvény, biztosítás) több káresemény tartozhat. Az
egyedekhez tartozó káresemények száma N , mely λ paraméter¶ Poisson-eloszlást
követ. A teljes kárki�zetés nagyságának eloszlását azonosnak vesszük. Feltesszük,
hogy a kárki�zetések nagyságát megadó Xi, i = 1, 2, . . . sorozat független az össze-
adandók számát megadó valószín¶ségi változótól, azaz N -t®l, valamint a sorozat
tagjai egymástól is függetlenek. Ha az Xi változók azonos eloszlásúak, véges várható
értékkel, N várható értékér®l tudjuk, hogy véges ezért
S =N∑i=1
Xi.
A következ® tétel biztosítja, hogyha a kárigényeket nagyság szerint rendezzük és
az egyes csoportokon belül külön tekintve az összkár értékét, ismét összetett Poisson-
eloszlásokat kapunk.
1.14. Tétel. (Összetett Poisson-eloszlás szétválasztása) Tekintsünk olyan
Z1, Z2, . . . valószín¶ségi változókat, melyek függetlenek, azonos Q eloszlásúak, továb-
bá függetlenek az N λ paraméter¶ Poisson-eloszlású változótól. Legyenek az
A1, . . . Am ⊂ R halmazok diszjunktak. Tegyük fel, hogy Q(Aj) > 0, j = 1, . . . ,m.
Ekkor az
Nk =N∑j=1
χ{Zj∈Ak}, k = 1, . . . ,m
valószín¶ségi változók független, λQ(Ak) paraméter¶ Poisson-eloszlású változók. To-
vábbá az
Sk =N∑j=1
Zjχ{Zj∈Ak} , k = 1, . . . ,m
változók egymástól független, összetett Poisson-eloszlásúak.
Ezt még fel fogjuk használni a kés®bbiekben az összetett Poisson-folyamat során.
12
1.3. A keverék Poisson-eloszlás
A keverék eloszlásokra azért lehet szükségünk, hogy pontosabb modellt tudjunk
készíteni. Ezt egy példán keresztül fogjuk megnézni.
1.15. De�níció. (Keverék eloszlás) Jelölje ξ1, . . . , ξk a k darab független diszkrét
vagy folytonos valószín¶ségi változót. A k komponens¶ kevert eloszlás s¶r¶ségfügg-
vénye
fξ(x) =k∑j=1
δjfj(x).
A δj jelöli, hogy mekkora súlyokkal vesszük be az egyes változókat az új eloszlásba és
teljesül rájuk, hogy 0 < δj < 1, valamint∑k
j=1 δj = 1. Diszkrét eloszlások keveréké-
b®l diszkrét keverék eloszlást, folytonos eloszlások keverékéb®l pedig folytonos keverék
eloszlást kapunk.
Tekintsük az alábbi táblázatban szerepl® adatokat, melyek 1900 − 2006 között
történt 7-es vagy annál nagyobb er®sség¶ földrengések évenkénti számát adják meg.
13 14 8 10 16 26 32 27 18 32 36 24 22 23 22 18 25 21
21 14 8 11 14 23 18 17 19 20 22 19 13 26 13 14 22 24
21 22 26 21 23 24 27 41 31 27 35 26 28 36 39 21 17 22
17 19 15 34 10 15 22 18 15 20 15 22 19 16 30 27 29 23
20 16 21 21 25 16 18 15 18 14 10 15 8 15 6 11 8 7
18 16 13 12 13 20 15 16 12 18 15 16 13 15 16 11 11
Els®ként azt feltételeznénk, hogy az adatok Poisson-eloszlást követnek, melynek
valószín¶ségfüggvénye
p(k, λ) = e−λλk
k!.
Ekkor a minta várható értékének és a szórásnégyzetének nagyjából meg kellene
egyeznie, azonban a példában a minta szórásnégyzete D2 ≈ 52, a várható értéke
pedig E ≈ 19. Ez elég nagy eltérés, ezért alkalmazzuk a keverék eloszlást.
13
Az el®z® táblázatbeli adatokat ábrázolva is láthatjuk.
1.1. ábra. Földrengések száma (1900-2006)
1.16. De�níció. (Poisson-eloszlások keveréke) Tekintsük a ξ1, . . . , ξk egymás-
tól független, Poisson eloszlású valószín¶ségi változókat λi, i = 1, . . . , k várható ér-
tékekkel. Az 1.15 de�níció alapján jelölje δ1, . . . , δk a súlyokat és p1, . . . , pk a való-
szín¶ségfüggvényüket. Legyen X eloszlása keverék eloszlás, mivel Poisson-eloszlások
keverékéb®l áll össze, ezért X keverék Poisson-eloszlású lesz, melynek valószín¶ség-
függvénye
P (X = x) =k∑i=1
P (X = x|C = i)P (C = i) =k∑i=1
δipi(x).
Az X tehát k darab komponensb®l tev®dik össze, ahol C értéke (1.5)-ben található.
komponens 1 2 . . . k
valószín¶ségfüggvény p1(x) p2(x) . . . pk(x)
C =
1, δ1 valószín¶séggel
2, δ2 valószín¶séggel...
k, δk valószín¶séggel.
(1.5)
14
A keverék eloszlás várható értéke a komponens eloszlások várható értékének li-
neáris kombinációja:
E(X) =k∑i=1
P (C = i)E(X|C = i) =k∑i=1
δiE(ξi).
1.17. Tétel. (Teljes szórásnégyzet tétel) A tétel általánosan
D2(X) =k∑i=1
δiD2(ξi) +
k∑i=1
δiE(ξi)2 −
(k∑i=1
δiE(ξi)
)2
=
=k∑i=1
δiE(ξ2i )−
(k∑i=1
δiE(ξi)
)2
.
A szórásnégyzet a két komponens¶ esetre még könnyen meghatározható analitikusan
is az el®z® tétel alapján
D2(X) = δ1D2(ξ1) + δ2D
2(ξ2) + δ1δ2 (E(ξ1)− E(ξ2))2 .
1.3.1. Paraméter becslés
Azokban az esetekben, amikor azt feltételezzük, hogy az adataink keverék Poisson-
eloszlásból származnak, becsülnünk kell a λi és δi paramétereket. A paraméter becs-
lést leggyakrabban maximum likelihood becsléssel végezzük el.
1.18. De�níció. (Maximum-likelihood módszer) Tegyük fel, hogy
x1, x2, . . . , xn az adott minta, amelynek segítségével az ismeretlen a paramétert akar-
juk becsülni. Ha az ismeretlen a paramétert®l függ® eloszlás mintaelemeinek közös
s¶r¶ségfüggvénye f(x, a), akkor a független mintaelemek együttes s¶r¶ségfüggvénye
f(x1, a) · . . . · f(xn, a) =n∏i=1
f(xi, a),
ahol x1, . . . , xn számok a mintaelemeknek a kísérlet során mért értékei. Ekkor a
maximum likelihood-módszer szerint az a paraméter becslésének az x1, . . . , xn min-
taelemeknek azt az a = a(x1, x2, . . . , xn) függvényét nevezzük, melyre a∏n
i=1 f(xi, a)
szorzat a lehet® legnagyobb értéket veszi fel, feltéve, hogy a maximum létezik és egy-
értelm¶.
15
Általában a k komponens¶ keverék eloszlás likelihood függvénye adott
L(θ1, . . . , θk, δ1, . . . , δk|x1, . . . , xn) =n∏j=1
k∑i=1
δipi(xj, θi), (1.6)
ahol θ1, . . . , θk a komponens eloszlások paraméterei, a δi, i = 1, . . . , k a súlyok, me-
lyek összege 1. Az xi-k pedig a meg�gyelések. Ennek vesszük a logaritmusát, majd ezt
követ®en a maximumát. A maximum likelihood becslést analitikusan végig számolni
elég bonyolult, ezért numerikus módszerrel szokás elvégezni, amelyre található egy
hasznosR-beli, �exmix csomag. A példánkra ezt alkalmazva, behelyettesítünk az 1.6
képletbe, majd maximalizáljuk a loglikelihood függvényt egy R-beli függvénnyel, az
nlm-el.
A δi ≥ 0 és λi ≥ 0, (i = 1, . . . , k) paramétereket el®ször át kell paraméterezni,
hogy használni tudjuk az optimalizálás során. Az átparaméterezésre azért van szük-
ségünk, mert az nlm függvény a valós számok teljes halmazán keresi a loglikelihood
függvény maximum értékét, viszont a δi és λi értékekre van megszorítás. Legyenek
ηi = log λi, (i = 1, . . . , k)
τi = log
(δi
1−∑k
j=2 δj
), (i = 2, . . . , k).
Így az ηi, τi ∈ R tetsz®legesek.
Az eredeti paramétereket a következ®képpen fejezhetjük ki:
λi = eηi , (i = 1, . . . , k),
δi =eτi
1 +∑k
j=2 eτi, (i = 2, . . . , k) és
δ1 = 1−k∑j=2
δi.
Ezeket a változókat már tudjuk használni az nlm során.
16
modell i δi λi − logL várható érték szórásnégyzet
k = 1 1 1,000 19,364 391,9189 19,364 19,364
k = 2 1 0,676 15,777 360,3690 19,364 46,182
2 0,324 26,840
k = 3 1 0,278 12,736 356,8489 19,364 51,170
2 0,593 19,785
3 0,130 31,629
k = 4 1 0,093 10,584 356,7337 19,364 51,638
2 0,354 15,528
3 0,437 20,969
4 0,116 32,079
meg�gyelés 19,364 51,573
1.2. ábra. Poisson eloszlások keveréke a földrengés modellben.
Az 1.2 táblázatban találhatjuk a különböz® esetekre, milyen értékeket kapunk.
Látható, hogy k = 3 és k = 4 esetekben a keverék eloszlás jól közelíti a szórásnégy-
zetet. Azonban a − logL értéke k = 4 esetnél már nem változik jelent®sen, valamint
van egy változónk 0,09 súllyal, ami szintén nem annyira mérvadó. Így a négy vál-
tozós eset már nem hoz annyival jobb eredményt, hogy megérje azt választanunk.
Ez azt jelenti, hogy három egymástól független, 12,736; 19,785; 31,629 paraméte-
r¶ Poisson-eloszlású valószín¶ségi változók keverékét kell használnunk 0,278; 0,593;
0,130 súlyokkal, hogy jól modellezhet® legyen a probléma.
17
2. fejezet
Az eloszlás használata közelítésre
2.1. A binomiális eloszlás közelítése
Poisson-eloszlással
A binomiális eloszlást szeretnénk úgy közelíteni, hogy az eltérés a lehet® legkisebb le-
gyen, azaz a binomiális és a másik eloszlás hányadosára 1 körüli értéket kapjunk. Erre
a Poisson eloszlást szokás használni. Ez azért is célszer¶ mert a Poisson-eloszlásnak
egyetlen paramétere van, míg a binomiális eloszlásnak az n és a p.
2.1. De�níció. (Binomiális eloszlás) Legyen az n kísérletb®l álló Bernoulli-kísér-
letsorozatban p a jó és q a rossz eset valószín¶sége, és b(k;n, p) jelölje annak a va-
lószín¶ségét, hogy a kísérletek során k jó és n− k rossz eset következik be. Ekkor
b(k;n, p) = P (ξ = k) =
(n
k
)pkqn−k, (2.1)
ahol 0 < p < 1, q = 1− p és k = 0, . . . n.
Sokszor olyan Bernoulli-kísérletsorozattal foglalkozunk, ahol egymáshoz viszo-
nyítva n nagy, p kicsi, és a
λ = np
szorzat nem túl nagy és nem is túl kicsi. Ezekben az esetekben b(k;n, p) Poissontól
származó becslését szokás használni.
18
2.2. Tétel. Ha n→∞ esetén p→ 0 úgy, hogy közben n · p szorzat állandó marad,
np = λ > 0, akkor q = 1− p jelöléssel
limn→∞
(n
k
)pkqn−k =
λk
k!e−λ.
Bizonyítás. Ha k = 0, akkor
b(0;n, p) = (1− p)n =
(1− λ
n
)n.
Mindkét oldal logaritmusát véve és Taylor-sorba fejtve,
ln(b(0;n, p)) = n · ln(
1− λ
n
)= −λ+
λ2
2n− . . . .
Tehát, ha n elég nagy, akkor
b(0;n, p) ≈ e−λ.
Továbbá, hogy ha n elég nagy, akkor bármely rögzített k-ra
b(k;n, p)
b(k − 1;n, p)=λ− (k − 1)p
kq≈ λ
k.
Ezek alapján
b(1;n, p) ≈ λ · b(0;n, p) ≈ λe−λ,
b(2;n, p) ≈ 1
2λ · b(1;n, p) ≈ 1
2λ2e−λ,
és általánosságban � amint teljes indukcióval belátható �
b(k;n, p) ≈ λk
k!e−λ. (2.2)
Ez a binomiális eloszlás klasszikus közelítése a Poisson-eloszlással. �
2.3. Feladat. Tegyük fel, hogy az emberek egy százaléka balkezes. Becsüljük meg
annak valószín¶ségét, hogy 200 emberb®l legalább 4 balkezes!
Megoldás. Tudjuk, hogy 1% balkezes, tehát 200 emberb®l várhatóan 2 balkezes
⇒ λ = 2.
P(legalább 4 ember balkezes)=1-P(legfeljebb 3 ember balkezes)=
=1-(P(0 balkezes)+P(1 balkezes)+P(2 balkezes)+P(3 balkezes))=
= 1− (20
0!e−2 + 21
1!e−2 + 22
2!e−2 + 23
3!e−2) = 0, 143
19
Annak a valószín¶sége, hogy 200 emberb®l legalább 4 balkezes, körülbelül 14, 3%.
A következ®kben a binomiális eloszlás Poisson-féle közelítését használjuk, vala-
mint együttes viselkedésüket vizsgáljuk, tehát λ = np.
2.4. Állítás. Ha k monoton növekedve 0-tól végtelenhez tart, akkor az
ak =b(k;n, p)
p(k;λ)(2.3)
hányados el®ször n®, majd csökken, és maximumát a legnagyobb olyan k egész számra
éri el, mely (λ+ 1)-nél nem nagyobb.
Bizonyítás. Tekintsük az akak−1
hányadost:
b(k;n, p)
p(k;λ)· p(k − 1;λ)
b(k − 1;n, p)=
(nk
)pkqn−k
e−λ λk
k!
·e−λ λk−1
(k−1)!(nk−1
)pk−1qn−k+1
=
=
n!k!·(n−k)!
pkqn−k
e−λ λk
k!
·e−λ λk−1
(k−1)!
n!(k−1)!(n−k+1)!
pk−1qn−k+1=
pkλk−1
λk·qk·(n−k+1)
=pλk−1
λk·qn−k+1
=
= p · λk−1 · n− k + 1
q · λk=p(n− k + 1)
q· λ−1 =
pn− pk + p
qλ
Ha ennek a törtnek a számlálója nagyobb a nevez®jénél,
pn− pk + p > λq = λ(1− p)
λ− pk + p > λ− λp
−pk + p+ λp > 0
p(1 + λ) > pk
1 + λ > k,
akkor (2.3) hányados addig n®, amíg k < 1 + λ. �
20
2.5. Állítás. Ha k n®, akkor b(k;n, p) el®ször kisebb, majd nagyobb, majd ismét
kisebb, mint p(k;λ).
Bizonyítás. Mindkét eloszlás tagjainak összege külön-külön 1, ezért nem lehetsé-
ges, hogy az egyik eloszlás mindig kisebb, mint a másik, mert akkor az összeg kisebb
lenne 1-nél.
b(0;n, p) =
(n
0
)p0qn = qn =
(1− λ
n
)np(0, λ) = e−λ · λ
0
0!= e−λ = e−np
Felhasználva, hogy 1 + x < ex, ha x 6= 0,
1− p < e−p,
(1− p)n < e−np
egyenl®tlenséget kapjuk. Azaz b(0;n, p) < p(0, λ), ugyanakkor b(k;n, p) = 0, ha
k > n, így elég nagy k-ra is b(k;n, p) < p(k, λ). �
A binomiális-eloszlást szeretnénk úgy alulról és felülr®l becsülni, hogy az egyen-
l®tlenséget tovább alakítva majd felhasználva, a Poisson-eloszlás segítségével kap-
junk egy újabb közelítést.
2.6. Állítás.
λk
k!
(1− λ
n
)n−k≥ b(k;n, p) ≥ λk
k!
(1− k
n
)k (1− λ
n
)n−k. (2.4)
Bizonyítás. Átírva az egyenl®tlenség közepét azt kapjuk, hogy
λk
k!
(1− λ
n
)n−k≥(n
k
)(λ
n
)k (1− λ
n
)n−k≥ λk
k!
(1− k
n
)k (1− λ
n
)n−kEzt leegyszer¶sítve:
1 ≥ n · . . . · (n− k + 1)
nk≥(
1− k
n
)k=
(n− kn
)kA baloldali egyenl®tlenségben a tört számlálójában egy k tényez®s szorzat áll. Ennek,
ha minden tényez®jét n-nel felülr®l becsüljük, az egyenl®tlenség teljesül.
21
A jobb oldalon álló egyenl®tlenségben pedig a tört számlálójában minden tényez®t
(n− k)-val alulról becsülve kapjuk a végeredményt. �
A 2.3 feladatban becsültük a balkezesek számát, ennek a becslésnek a pontosságát
láthatjuk a következ® táblázatban a 2.6 egyenl®tlenség alapján.
k 2k
k!
(1− 2
200
)200−kb(k; 200; 0, 01) 2k
k!
(1− k
200
)k (1− 2
200
)200−k
0 0,134 0,1340 0,1340
1 0,2707 0,2707 0,2693
2 0,2734 0,2720 0,2680
3 0,1841 0,1814 0,1759
4 0,0930 0,0902 0,0858
5 0,0376 0,0357 0,0331
6 0,0126 0,0117 0,0105
7 0,0037 0,0033 0,0028
8 9, 2189 · 10−4 8, 0002 · 10−4 6, 6504 · 10−4
9 2, 0693 · 10−4 1, 7239 · 10−4 1, 3673 · 10−4
10 4, 1805 · 10−5 3, 3260 · 10−5 2, 5030 · 10−5
2.7. Állítás. A 2.6 állítás felhasználásával következik, hogy
p(k;λ)ek·λn ≥ b(k;n, p) ≥ p(k;λ)e
−k2n−k−
λ2
n−λ . (2.5)
Bizonyítás. Els®ként tekintsük a bal oldali egyenl®tlenséget. Az el®z® feladatból
tudjuk, hogyλk
k!
(1− λ
n
)n−k≥ b(k;n, p). (2.6)
Azt kell belátnunk, hogy
λk
k!e−λek
λn ≥ λk
k!
(1− λ
n
)n−k,
ekkor a 2.5 bal oldala biztosan teljesül. Átrendezve kell, hogy
e−nλ+kλ
n ≥(
1− λ
n
)n−k.
22
Felhasználva, hogy 1− t ≤ e−t
1− λ
n≤ e−
λn ,(
1− λ
n
)n−k≤(e−
λn
)n−k= e
−nλ+kλn .
Ezzel a bal oldalt beláttuk.
A jobb oldalon ugyanezt a technikát alkalmazva akarjuk belátni, hogy
λk
k!
(1− k
n
)k (1− λ
n
)n−k≥ λk
k!e−λe
−k2n−k−
λ2
n−λ ,
(1− k
n
)k (1− λ
n
)n−k≥ e−λe
−k2n−k−
λ2
n−λ . (2.7)
Itt azt az egyenl®tlenséget használjuk a 2.7 egyenl®tlenség bal oldalán lév® ténye-
z®kre külön�külön, hogy 1− t ≥ e−t1−t(
1− k
n
)k≥(e−k/n
1−(k/n)
)k= e
−k2/n1−(k/n) = e
−k2n−k ,
(1− λ
n
)n−k≥(e−λ/n
1−(λ/n)
)n−k=(e−λn−λ
)n−k= e
−λ(n−k)n−λ .
Azonban az (1− λ
n
)n−k≥ e−λe
−λ2n−λ = e
−λ(n−λ)−λ2n−λ = e
−λnn−λ
egyenl®tlenséget szeretnénk kapni. Tehát szeretnénk, ha
e−λ(n−k)n−λ ≥ e
−λnn−λ .
egyenl®tlenség teljesülne. Az eλkn−λ hatványban a kitev® pozitív, tehát az egész hat-
vány egynél nagyobb. Ezt kihasználva:
e−nλn−λ+ λk
n−λ = e−nλn−λ · e
λkn−λ ≥ e
−λnn−λ .
Azaz a 2.5 egyenl®tlenség mindkét oldalát igazoltuk. �
Ebben az egyenl®tlenségben már megjelenik a Poisson-eloszlás, ahogy azt szeret-
tük volna.
A 2.3 feladat adataira vizsgáljuk a becslés pontosságát, mégpedig úgy, hogy
az állítás bal valamint jobb oldalán szerepl® kifejezésekkel leosztjuk a binomiális
eloszlást. Annál jobb a becslésünk minél közelebb van a hányados értéke 1-hez.
23
k b(k;200;0,01)
p(k;2)ek2
200
b(k;200;0,01)
p(k;2)e−k2
200−k−22
200−2
0 0,9900 1,0102
1 0,9900 1,0255
2 0,9851 1,0465
3 0,9753 1,0735
4 0,9607 1,1072
5 0,9416 1,1482
6 0,9181 1,1976
7 0,8906 1,2564
8 0,8595 1,3259
9 0,8251 1,4079
10 0,7880 1,5043
2.2. Poisson-közelítés párosítással
2.8. De�níció. Legyenek Pn = (pn,0, pn,1, . . .), n = 1, 2, . . ., és Q = (q0, q1, . . .)
diszkrét valószín¶ségeloszlások. Azt mondjuk, hogy Pn gyengén konvergál Q-hoz
(Pnw→ Q), ha minden k = 0, 1, . . . esetén limn→∞ pn,k = qk.
2.9. De�níció. Legyen P = (p0, p1, . . .) és Q = (q0, q1, . . .) két diszkrét valószín¶-
ségeloszlás. Ekkor a variációs távolságuk
||P−Q|| =∞∑k=0
|pk − qk| (ez a két számsorozat l1 -távolsága).
Azt mondjuk, hogy a Pn diszkrét valószín¶ségeloszlások teljes variációban konvergál-
nak Q-hoz, ha ||Pn −Q|| → 0.
2.10. Lemma. Pnw→ Q ⇔ ||Pn − Q|| → 0, azaz az el®bbi két konvergenciafajta
ekvivalens.
2.11. Lemma. Legyen ξ és η nemnegatív egész érték¶. Ekkor az eloszlásaik variá-
ciós távolságára∞∑k=0
|P (ξ = k)− P (η = k)| ≤ 2 · P (ξ 6= η).
24
Nézzük a bizonyítását, amit egy kés®bbi tétel során felhasználunk.
Bizonyítás. A szumma tagjaiban mindkét valószín¶ségb®l vonjuk ki P (ξ = k, η =
k)-t.
∞∑k=0
|P (ξ = k)− P (η = k)| =∞∑k=0
|P (ξ = k, η 6= k)− P (η = k, ξ 6= k)| ≤
≤∞∑k=0
P (ξ = k, η 6= ξ) +∞∑k=0
P (η = k, ξ 6= η) = 2P (ξ 6= η).
Amit eredményül akartunk kapni. �
Ezzel a lemmával már úgy adhatunk jó becslést két diszkrét eloszlás variációs
távolságára, hogy keresünk hozzájuk olyan valószín¶ségi változókat, amelyek elosz-
lása éppen a két megadott, és amelyek minél nagyobb valószín¶séggel megegyeznek
egymással. Ezt az eljárást párosításnak nevezik.
Legyenek A1, A2, . . . , An független események. Legyen P (Ai) = pi, és jelölje N
azon események számát, amelyek teljesülnek: N = I(A1) + I(A2) + · · · + I(An).
E(N) = p1 + · · ·+ pn, legyen ez λ. Ekkor N eloszlása a következ® mértékben köze-
líthet® a λ paraméter¶ Poisson-eloszlással.
2.12. Tétel. (Le Cam)
∞∑k=0
∣∣∣∣P (N = k)− λk
k!e−λ∣∣∣∣ ≤ 2 ·
n∑i=1
pi2.
Bizonyítás. A 2.10 lemmát alkalmazzuk. Egy-egy Poisson-eloszlású valószín¶ségi
változót párosítunk külön-külön az I(Ai) indikátorokhoz.
Legyenek ξ1, ξ2, . . . , ξn független valószín¶ségi változók, amelyek a {−1, 0, 1, . . .}értékeket vehetik fel. Legyen továbbá ηi = I(ξi ≥ 0) és ζi = ξ+
i . Ekkor η1, η2, . . . , ηn
független indikátorok. A ζ1, ζ2, . . . , ζn is függetlenek és ζi, pi paraméter¶ Poisson-
eloszlásúak. A P (ξi = k), P (ηi = k), P (ζi = k) valószín¶ségeket az alábbi táblázat-
ban találjuk.
25
k P(ξi = k) P(ηi = k) P(ζi = k)
-1 1− pi 0 0
0 e−pi − 1 + pi 1− pi e−pi
1 pi1
1!e−pi pi
pi1
1!e−pi
k > 1 pik
k!e−pi 0 pi
k
k!e−pi
Tudjuk, hogy η1 + η2 + · · ·+ ηn ugyanolyan eloszlású, mint N , ζ1 + ζ2 + · · ·+ ζn
pedig λ paraméter¶ Poisson-eloszlású, ezen felül
P (ηi 6= ζi) = 1− P (ηi = ζi) = 1− P (ηi = ζi = 0)− P (ηi = ζi = 1) =
1− P (ξi = −1)− P (ξi = 1) = 1− (1− pi)− e−pi · pi = pi(1− e−pi) ≤ pi2
Itt megint azt az egyenl®tlenséget használtuk, hogy ex ≥ 1 + x, x = −pi-re.Tehát a
∞∑k=0
∣∣∣∣P (N = k)− λk
k!e−λ∣∣∣∣ ≤ 2P
(n∑i=1
ηi 6=n∑i=1
ζi
)≤ 2
n∑i=1
P (ηi 6= ζi) ≤ 2n∑i=1
pi2
közelítéssel meg tudtunk adni két olyan diszkrét eloszlást melyekre a feltételek tel-
jesülnek és a becslés jól m¶ködik. �
Ennél a közelítésnél, ha a mindegyik pi-t p-nek választjuk, akkor a binomiális
eloszlás és a Poisson-eloszlás variációs távolságát kapjuk. Azaz p = λnesetén
∞∑k=0
∣∣∣∣(nk)pkqn−k − λk
k!e−λ∣∣∣∣ ≤ 2 ·
n∑1
p2 = 2n
(λ
n
)2
= 2 · λ2
n
26
3. fejezet
Folyamatok
Általában, ha folyamatokról beszélünk, az id®vel valamilyen kapcsolatba hozzuk a
történéseket. Mint például, mennyi ideig tartott egy vizsgált cselekvés? Valamennyi
eltelt id® alatt hányszor következett be a meg�gyelt esemény? Ebben a fejezetben
ez utóbbi kérdésre választ adó modellekkel foglalkozunk.
3.1. A Poisson-folyamat
A folyamatot Siméon-Denis Poisson francia matematikusról nevezték el, amely egy
véletlenszer¶ (sztochasztikus) folyamat és az id®ben véletlenszer¶en bekövetkez®
eseményeket modellezi. Ilyen például az áruházba beérkez® vev®k száma, telefon-
központba beérkez® hívások mennyisége, radioaktív bomlás stb. Ezt a folyamatot
szokták pontfolyamatnak is nevezni, mert minden bekövetkezést az id®tengely egy
pontjának feleltetünk meg.
A Poisson-folyamaton belül megkülönböztetünk homogén és inhomogén változatot.
3.1.1. Homogén Poisson-folyamat
Azt vizsgáljuk, hogy tetsz®leges t hosszúságú intervallumban mennyi az összes be-
következések N(t) száma. Feltételezzük, hogy egy esemény bekövetkezésének való-
szín¶sége bármely t hosszúságú intervallumban mindig ugyanannyi és független a
múltbeli eseményekt®l.
Tegyük fel, hogy N(t) monoton növ® számláló folyamat, azaz egy természetes
szám minden t-re. Továbbá az N(ti) − N(ti−1) valószín¶ségi változók függetlenek
27
minden t0 < t1 < · · · < tn-re, tehát a folyamat független növekmény¶.
Vizsgáljuk meg a valószín¶ségét annak, hogy bizonyos id®n belül 0; 1 vagy egynél
több esemény következik be. Jelölje
Pn(t) = P (N(t) = n).
Azt mondjuk, hogy a folyamat az En állapotban van, ha 0 és t id®pillanat között n
darab esemény következett be.
Vegyük az egység hosszú id®intervallum ekvidisztáns felosztását, ekkor h = 1n.
Azon részintervallumok várható száma melyben van ugrás, azaz bekövetkezett ese-
mény
n · (1− P0(h)) =1
h· (1− P0(h)).
A h→ 0 esetén az várható el, hogy ez az egységnyi hosszúságú intervallumon bekö-
vetkez® események várható értékéhez fog konvergálni, azaz feltehetjük, hogy
1
h· (1− P0(h))→ λ.
Tehát annak a valószín¶sége, hogy egy részintervallumon nem következik be esemény,
P0(h) = 1− hλ+ o(h), (3.1)
ahol o(h) egy h-nál kisebb mennyiséget jelent. A t-edik id®pillanatig bekövetkezett
események számát jelölje St. Innen csak a �szomszédos� St+1 pontba tudunk ugrani a
�zikai háttérb®l adódóan. Azaz egy részintervallumon egynél több ugrást tartalmazó
h hosszúságú részintervallumok számának várható értéke 0-hoz kell, hogy tartson,
tehát
n · (1− P0(h)− P1(h))→ 0.
Ebb®l már megkapjuk azt is, hogy mennyi a valószín¶sége, hogy egy esemény bekö-
vetkezik h-n1
h(1− 1− hλ+ o(h)− P1(h))→ 0
P1(h) = hλ+ o(h) (3.2)
Egynél több bekövetkezés valószín¶sége pedig
o(h). (3.3)
28
Ezek ismeretében már megmutatható, hogy
Pn(t) =(λt)n
n!e−λt. (3.4)
Tegyük fel, hogy n ≥ 1 és a t+ h id®pillanatban n esemény következett be, ennek a
valószín¶sége Pn(t+ h). Ez háromféleképpen következhet be:
a) A t-edik pillanatban már bekövetkezett n esemény, ekkor [t, t+ h]-n már nem
fog bekövetkezni egyetlen esemény sem. Ennek valószín¶sége:
Pn(t)P0(h) = Pn(t)(1− λh) + o(h)
b) A t-edik pillanatban n − 1 darab esemény következett be eddig és [t, t + h]-n
bekövetkezik még egy, aminek a valószín¶sége
Pn−1(t)P1(h) = Pn−1(t)λh+O(h)
c) Ha ezeken kívül bármilyen más eset fordul el®, akkor [t, t + h]-n legalább két
eseménynek kell teljesülnie, aminek a valószín¶sége igen csak kicsi, az el®bbiek
alapján o(h).
Így Pn(t+ h)-t ennek a három független eseménynek az összegéb®l kapjuk
Pn(t+h) = Pn(t)(1−λh) +Pn−1(t)λh+ o(h) = Pn(t)−Pn(t)λh+Pn−1(t)λh+ o(h),
amelyet átalakítva
Pn(t+ h)− Pn(t)
h= −Pn(t)λ+ Pn−1(t)λ+
o(h)
h.
Amennyiben h 0-hoz tart akkor az utolsó tag is 0-hoz tart, így
P ′n(t) = −Pn(t)λ+ Pn−1(t)λ n ≥ 1.
Az a) esetben lehetséges csak, hogy n = 0, ekkor
P0(t+ h) = P0(t)(1− λh) + o(h) = P0(t)− P0(t)λh+ o(h).
P ′0(t) = −λP0(t).
Ennek és a P0(0) = 1 segítségével láthatjuk, hogy P0(t) = e−λt, valamint P1(0) = 0
miatt P1(t) = λte−λt.
Ezek ismeretében már a Possion-folyamat teljes de�nícióját is bevezethetjük.
29
3.1. De�níció. Az N(t) (t ≥ 0) Poisson-folyamat, ha
• N(t) számláló folyamat, N(t) természetes szám minden minden t-re és N(t)
monoton növ®.
• Ha a t0 = 0 < t1 < · · · < tn esetén az N(ti) − N(ti−1) valószín¶ségi változók
függetlenek, tehát a folyamat független növekmény¶.
• Ha a [ti−1, ti], i = 0, . . . n id® intervallumok azonos nagyságúak, akkor az
N(ti) − N(ti−1) valószín¶ségi változók, Poisson-eloszlásúak λt (t = ti − ti−1)
várható értékkel.
Például, ha t = 1.6; 2.7; 3.1; 3.7; 4.3; 5.2 id®pontokat, akkor az N(5, 2) − N(3, 1)
és az N(2, 7)−N(1, 6) növekmények függetlenek, de az N(5, 2)−N(3, 1) és N(4, 3)−N(3, 7) növekmények már nem, mert az id®intervallumok nem diszjunktak. Azonban,
ha két intervallum végpontja megegyezik azokat függetlennek tekintjük.
A Poisson-folyamat tehát egy számláló folyamat, melyben két bekövetkezés id®-
pontja között eltelt id® exponenciális eloszlású valószín¶ségi változó 1λvárható ér-
tékkel. Ez látható abból is, amikor azt vizsgáljuk, hogy egy intervallumon 0 esemény
következik be. A másik jellege a folyamatnak, hogy (3.1) � (3.3) valószín¶ségek nem
függenek a korábbi, N(t) állapottól.
3.1.2. Inhomogén Poisson-folyamat
Az el®z® részben (3.1) � (3.3) esetekben a λ egy konstans, t-t®l nem függ® mennyiség
volt. Azoknak az eseményeknek a modellezésekor, melyeknek az intenzitása változik
id®ben, azoknál célszer¶ λ-t az id®t®l függ®vé tenni.
Tegyük fel továbbra is, hogy N(t) számláló folyamat. Az inhomogén folyama-
tot hasonlóan de�niáljuk mint a homogén esetben de nem ugyanazok a jellemz®k
rá. Az egymást nem átfed® intervallumok továbbra is függetlenek. A homogén eset-
ben ugyanolyan nagyságú intervallumok ugyanolyan paraméter¶ eloszlást követtek,
itt nem mondható el ugyanez. Az intenzitás id®t®l függ, ezért egy intervallumon
bekövetkez® események várható értékét az alábbiak szerint számoljuk
Λ(ti; ti+1) =
∫ ti+1
ti
λ(x)dx.
30
3.2. Példa. Tegyük fel, hogy N egy Poisson-folyamat egy adott λ(t) = 2t inten-
zitásfüggvénnyel. Továbbá azt, hogy 100 esemény következett be t = 1, 2-ig, azaz
N(1, 2) = 100. Az M = N(1, 2) = N(1, 2)−N(0) egy Poisson-eloszlású valószín¶sé-
gi változó, Λ =∫ 1,2
02zdz = 1, 44 várható értékkel. Ezt a meg�gyelést használjuk föl
ahhoz, hogy meghatározzuk az N(2, 6) eloszlását.
Azt már ismerjük, hogy a [0; 1, 2] intervallumon mi történt, így már csak az [1, 2; 2, 6]
intervallumot kell vizsgálnunk.
N(2, 6) = [N(2, 6)−N(1, 2)] + [N(1, 2)−N(0)].
Az els® zárójelben lév® valószín¶ségi változó várható értékét a de�níció alapján
számolva kapjuk, hogy
Λ =
∫ 2,6
1,2
2zdz = 5, 32.
Ezzel együtt már ismerünk mindent az N(2, 6) meghatározásához, mégpedig
[N(2, 6)|N(1, 2) = 100] ≈ N + 100.
Ez megkönnyíti N(2, 6) várható értékének meghatározását
E[N(2, 6)|N(1, 2) = 100] = E[M + 100] = E[M ] + 100 = 5, 32 + 100 = 105, 32
A szórásnégyzete pedig
D2[N(2, 6)|N(1, 2) = 100] = D2[M + 100] = D2[M ] = 5, 32.
A valószín¶séget ezek után már még könnyebb számolni. Számoljuk ki annak a
valószín¶ségét, hogy t = 2, 6 id®pontig 115 esemény következik be.
P [N(2, 6) = 115|N(1, 2) = 100] =
= P [M + 100 = 115] = P [M = 15] =e−5,325, 3215
15!= 2, 8955 · 10−4.
3.3. Példa. Ahogy azt az el®z® példában is feltettük, legyenN egy Poisson-folyamat,
λ(t) = 2t intenzitásfüggvénnyel.
Feladatunk, hogy meghatározzuk P [T3 > 1, 2]-t, azaz mennyi a valószín¶sége annak,
hogy a harmadik esemény bekövetkezése t = 1, 2 után történt.
A harmadik esemény t = 1, 2 után történt ezért 1,2 id®pontig legfeljebb 2 esemény
31
következett be, azaz N(1, 2) ≤ 2. Ez ekvivalens azzal, hogy T3 > 1, 2, ezért a való-
szín¶ségük is megegyezik. Az el®z® példa alapján N(1, 2) egy Poisson-eloszlású M
valószín¶ségi változó 1,44 várható értékkel. Így
P [T3 > 1, 2] = P [N(1, 2) ≤ 2] = P [M ≤ 2] =
= P [M = 0] + P [M = 1] + P [M = 2] =
= e−1,44 + e−1,44 1, 441
1!+ e−1,44 1, 442
2!= 0, 82375.
Tehát 82%-os valószín¶séggel az 1,2 id®pont után fog bekövetkezni a harmadik ese-
mény.
A homogén folyamatot sok esetben használjuk, azonban az inhomogén folya-
mat modellezésével pontosabb eredményt kapunk. A valóságban ilyen folyamattal
modellezünk például:
• telefonközpontba beérkez® hívásokat, ahol a hívások száma reggel 8 óra és
délután 6 óra között gyakoribb, mint a nap többi id®szakában,
• autópályáról érkez® kocsik száma a f®városba, reggel 8 óra körül megn® az
intenzitás, aztán megint csökken,
• adatbázis rendszerben a tranzakciós folyamatokat,
• vendégek érkezése a gyorsétterembe különböz® napszakokban s¶r¶södik.
Sok módja van az inhomogén Poisson-folyamat generálásának, amiket röviden
áttekintünk.
1. Az els®, hogy a λ = 1 paraméter¶ homogén Poisson-folyamat id®intervallumát
átskálázzuk. Ha az E1, E2, . . . a bekövetkezett események id®pontja a homo-
gén folyamatban, akkor Λ−1(E1),Λ−1(E2), . . . pontok az inhomogén folyamat
pontjait jelöli Λ(t) intenzitásfüggvénnyel. Ezt láthatjuk a 3.1 ábrán. Tekint-
sünk egy id®intervallumot, � legyen ez a [ti−1, ti] � melyben található esemény,
az intervallum átskálázását az ábráról leolvasva könny¶ meghatározni.
32
A ti−1; ti id®pontokat a Λ(t) tengelyre vetítve azok, azt a Λ(ti−1) és Λ(ti)
pontokban metszik. Innen
N(ti)−N(ti−1) = N(Λ(ti))− N(Λ(ti−1))
valószín¶ségi változók Poisson-eloszlásúak Λ(ti)−Λ(ti−1) =∫ titi−1
λ(x)dx para-
méterrel.
3.1. ábra. Homogén folyamat transzformációja
2. A második módszer csak említés szintjén: inhomogén folyamat el®állítására
a pontok közötti intervallumok egyenként való generálása. Adottak az X1 =
x1, X2 = x2, . . . , Xi = xi pontok és x1 < x2 < . . . < xi. Az Xi+1 − Xi
intervallumok függetlenek minden i-re és az eloszlásfüggvényük
F (x) = 1− e−[Λ(xi+x)−Λ(xi)].
33
Intenzitás függvény becslése:
Tekintsük azt a példát, amikor a gyorsétteremben vásárlók érkezését �gyeljük
meg egy adott napon, ezt láthatjuk a 3.2 ábrán.
3.2. ábra. Fogyasztók érkezése egy nap
Vegyük egy vizsgált nap ekvidisztáns felosztását, ahol óránként meg�gyeljük a
folyamatunkat. A λ(t) intenzitás függvényt úgy becsüljük, hogy szakaszonként kons-
tans értéket vegyen föl. Ezzel a módszerrel a 3.3 ábrán látható becslését kapjuk a
λ(t)-nek.
3.3. ábra.
34
A Λ(t) intenzitás függvény becslésére azt alkalmazzuk, hogy nem a meg�gyelések
szerepelnek az id®intervallumon, hanem maguk a bekövetkezések id®pontjai. Két
bekövetkezés id®pontja között az intenzitás függvényt egy szakaszonként változó
lineáris függvénnyel becsüljük.
Λ(t) =i · n
(n+ 1)+
[n(t− ti)
(n+ 1)(ti+1 − ti)
]ti < t ≤ ti+1 és i = 0, 1, . . . , n.
Minél közelebb van egymáshoz két bekövetkezés annál meredekebb lesz azon az
intervallumon a lineáris függvény.
3.4. ábra.
35
3.2. Az összetett Poisson-folyamat
Az összetett Poisson-folyamatot például a kockázati folyamatok modellezése során
alkalmazzák, ezért most ezen keresztül vizsgáljuk. A már korábban tárgyalt összetett
Poisson-eloszlás példái között szerepelt az összetett kockázati modell, ahol az S-el
jelölt teljes kár eloszlása összetett Poisson-eloszlás volt. Az összkár értékét azonban
gyakran az id® függvényében vizsgálják, ekkor a kárszámot megadó N változó az
id® függvénye. Jelölje ezt N(t), t ≥ 0. Ezt hívják kárigény folyamatnak. Ekkor az
összkár is az id®t®l függ®
S(t) =
N(t)∑i=1
Zi.
A kár ki�zetéséhez szükséges tartalék leírásának másik két eleme a díjbevételt meg-
adó Pt folyamat a [0, t] intervallumban, valamint a kezdeti t®ke értéke u. Így kapjuk
a rizikófolyamatot
U(t) = u+ P (t)− S(t).
Klasszikus rizikófolyamatról beszélünk akkor, ha
P (t) = c · t, ahol c állandó
N(t), λ paraméter¶ Poisson-folyamat
Zi, i = 1, 2, . . . függetlenek és azonos eloszlásúak.
Ekkor az S(t) folyamat, amely tehát a független, azonos eloszlású Zj valószín¶ségi
változók Poisson-tagszámú összege úgynevezett összetett Poisson-folyamat.
3.4. De�níció. Egy folyamatot sztochasztikusan folytonosnak nevezünk, ha bármely
ε > 0 esetén P (|N(s)−N(t)| > ε)→ 0, ha s→ t, minden rögzített t ≥ 0 mellett.
3.5. Tétel. Ha az S(t), t ≥ 0 folyamat sztochasztikusan folytonos, független növek-
mény¶, az ugyanolyan növekmény¶ id®intervallumokhoz tartozó növekmények azo-
nos eloszlásúak, S(0) = 0, akkor a folyamat összetett Posson-folyamat.
A homogén Poisson-folyamattól abban tér el, hogy egyszerre több esemény is be-
következhet, azaz az ugrások száma nem feltétlenül 1. A növekmények eloszlása az
id®tartamtól függ.
36
Az 1.14 tételt általánosabban, Poisson-folyamatokra is alkalmazhatjuk. Tekint-
sük az S(t) =∑N(t)
j=1 Zj, t ≥ 0összetett folyamatot. Tetsz®leges A ⊂ R esetén néz-
hetjük, hogy melyek azok a [0, t] id®intervallumon bekövetkezett káresemények, me-
lyekben a kár értéke az A halmazba esett. Azaz legyen
S(t)A =
N(t)∑k=1
Zkχ{Zk∈A}.
Ez az S(t) folyamat ritkítása, ami szintén összetett Poisson-folyamat. Diszjunkt
A halmazok esetén a kapott SA(t) folyamatok egymástól függetlenek. Tehát, ha
a kárigény nagysága szerint csoportosítjuk az összetett Poisson-folyamat ugrásait,
egymástól független összetett Poisson-folyamatokat kapunk.
37
Összefoglalás
Láthattuk, hogy a Poisson-eloszlás széleskör¶en alkalmazható a mindennapokban is
és a hasznosságának csak egy kicsi hányadát olvashattuk. Az eloszlás bemutatott
változatai különböz® területen használatosak és adnak pontos értékeket.
A binomiális eloszlás közelítésére meglep®en jó becsléseket kaptunk. Ezeket cél-
szer¶ alkalmazni, hogy megkönnyítsük a számolásunkat, hiszen kevesebb paramétert
kell felhasználni és az eltérés nem jelent®s. A Poisson-eloszlást is szokták közelíteni,
mégpedig a normális eloszlással.
Az utolsó fejezetben vált érdekesebbé a Poisson-eloszlás alkalmazása, amikor a
folyamat során az id®t®l függ®vé tettük paraméterünket. Ez mondható a leghaszno-
sabb alkalmazásának, ugyanis, ha valamilyen mindennapos véletlenszer¶ eseménye-
ket szeretnénk meg�gyelni, arra modellt építeni, az id® haladásával a bekövetkezések
s¶r¶sége változik.
A szakdolgozatomban a balesetekr®l szóló adatok a www.ksh.hu, Siméon Denis
Poisson életrajzi érdekességei a www.hu.wikipedia.org oldalról származnak.
38
Irodalomjegyzék
[1] Arató Miklós, Prokaj Vilmos, Zempléni András Bevezetés a valószín¶ségszámí-
tásba és alkalmazásaiba: Példákkal, szimulációkkal, 2013
[2] Csernyák László, Valószín¶ségszámítás, Nemzeti tankönyvkiadó, 2007
[3] D.J. Daley, D.Vere-Jones, An Introduction to the Theory of Point Proesses:
Volume I, Springer, 2003
[4] D.R. Cox, Valerie Isham, Point Processes, Chapmann & Hall/CRC, 2000
[5] Denkinger Géza, Valószín¶ségszámítási gyakorlatok, Nemzeti tankönyvkiadó,
1999
[6] James W. Daniel, Poisson Processes and mixture distibutions, 2008
[7] Larry Leemis, Estimating and Simulating Nonhomogeneous Poisson Processes,
2003
[8] Michaletzky György, Kockázati folyamatok jegyzet, 2001
[9] Móri Tamás, Generátorfüggvények jegyzet, 2007
[10] Móri Tamás, Poisson-approximáció párosítással jegyzet, 2007
[11] Obádovics J. Gyula, Valószín¶ségszámítás és matematikai statisztika, Scolar
Kiadó, 2001
[12] P.A.W. Lewis, G.S. Shedler, Simulation of Nonhomogeneous Poisson Processes
by thinning, 1978
[13] Sz¶cs Gábor, Kockázati folyamatok jegyzet, 2015
39
[14] Walter Zucchini,Iain L. MacDonald, Hidden Markov Models for Time Series:
An Introduction Using R, CRC Press, 2009
[15] William Feller, Bevezetés a valószín¶ségszámításba és alkalmazásaiba, M¶szaki
könyvkiadó, 1978
40