modelovanje i predviđanje vremenskih serija -...
TRANSCRIPT
Modelovanje i predviđanje vremenskih serija
Master rad
Mentor: Kandidat:
Prof. Dr Mirko Savić Tanja Armenski
Novi Sad, 2018.
Univerzitetski centar za primenjenu statistiku
Univerzitet u Novom Sadu
Master rad Tanja Armenski
1
Univerzitet u Novom Sadu
UCPS - Univerzitetski centar za primenjenu statistiku
Ključna dokumentacijska informacija
Redni broj:
RBR
Identifikacioni broj:
IBR
Tip dokumentacije:
TD
Monografska dokumentacija
Tip zapisa:
TZ
Tekstualni štampani materijal
Vrsta rada (dipl., mag., dokt.):
VR
Master rad
Ime i prezime autora:
AU
Tanja Armenski
Mentor (titula, ime, prezime,
zvanje):
MN
Prof. dr Mirko Savić
Naslov rada:
NR
Modelovanje i predviđanje vremenskih serija
Jezik publikacije:
JP
Srpski
Jezik izvoda:
JI
Srpski / engleski
Zemlja publikovanja:
ZP
Srbija
Uže geografsko područje:
UGP
Vojvodina
Godina: 2018
Master rad Tanja Armenski
2
GO
Izdavač:
IZ
autorski reprint
Mesto i adresa:
MA
Novi Sad, Trg Dositeja Obradovića 5
Fizički opis rada:
FO
broj poglavlja 9/ stranica 67/ tabela 5 /
grafikona 13 / reference 42
Naučna oblast:
NO
Primenjena statistika
Naučna disciplina:
ND
Ekonometrija
Predmetna odrednica, ključne reči:
PO
predikcije, vremenske serije, ARIMA, SARIMA, avio
saobraćaj
UDK
Čuva se:
ČU
Biblioteka
Važna napomena:
VN
Izvod:
IZ
Cilj master rad je procena preciznosti vremenskih serija u
prognozi kapaciteta međunarodnog avio saobraćaja. U
radu su analizirani različiti modeli vremenskih serija: Holt-
Vinters eksponencijalno izravnavanje, autoregresivni
procesi pokretnih proseka (ARMA), regresije sa
autoregresivno integrisanim pokretnim prosecima
(ARIMA) i sezonska regresije sa autoregresivno
integrisanim pokretnim prosecima (SARIMA). Kroz
nekoliko primera na podacima međunarodnog avio
saobraćaja Kanade i Srbije objašnjen je način izbora
odgovarajućih modela u praksi.
Master rad Tanja Armenski
3
Podaci o broju putnika u avio saobraćaju u periodu od
januara 2007. do decembra 2017. godine, prikupljeni su od
strane Kanadske agencije za granične usluge i Statistike
Kanade. Podatke o broja putnika u avio saobraćaju Srbije,
prikuplja Republički zavod za statistiku Srbije i publikuje
arhiva Aerodroma Nikola Tesla, Beograd.
Rezultati su pokazali da u većini ispitivanih slučajeva
modeli klase ARIMA postižu najpreciznije prognoze, dok
je Holt-Winterov metod eksponencijalnog izravnavanja
dao najpreciznije prognoze za seriju avio saobraćaja iz
Kanade za USA. Svi parametri MAPE i RMSPE su ispod
preporučene vrednosti od 10% što generalno ukazuje na
dobre performanse prognoza.
Datum prihvatanja teme od strane
NN veća:
DP
13.06. 2018.
Datum odbrane:
DO
Članovi komisije:
(ime i prezime / titula / zvanje
/naziv organizacije / status)
KO
Predsednik: Zorana Lužanin, doktor nauka,
Prirodno-matematički fakultet, Univerzitet u Novom Sadu,
redovni profesor
Član: Dejan Brcanov, doktor nauka, Ekonomski fakultet,
Univerzitet u Novom Sadu, docent
Član: Mirko Savić, doktor nauka, Ekonomski fakultet,
Univerzitet u Novom Sadu, redovni profesor
Master rad Tanja Armenski
4
University of Novi Sad
UCAS- University Centre for Applied Statistics
Key word documentation
Accession number:
ANO
Identification number:
INO
Document type:
DT
Monograph documentation
Type of record:
TR
Textual printed material
Contents code:
CC
Author:
AU
Tanja Armenski
Mentor:
MN
PhD Mirko Savić
Title:
TI
Time Series Modelling and Forecasting
Language of text:
LT
Serbian
Language of abstract:
LA
Serbian/English
Country of publication:
CP
Serbia
Locality of publication:
LP
Vojvodina
Publication year:
PY
2018
Master rad Tanja Armenski
5
Publisher:
PU
Author reprint
Publication place:
PP
Novi Sad
Physical description:
PD
9 chapters/ 67 pages/ 5 tables / 13 figures/ 42 references
Scientific field
SF
Applied statistic
Scientific discipline
SD
Econometric
Subject, Key words
SKW
Forecasting, Time series, ARIMA, SARIMA, air traffic
UC
Holding data:
HD
Note:
N
Abstract:
AB
This thesis evaluates various time series models and
their efficiency in forecasting the passengers air traffic.
Various time series models were analyzed such as Holt-
Winters exponential smoothing, autoregressive and
moving average processes (ARMA), autoregressive-
integrated-moving average (ARIMA) and seasonal
autoregressive-integrated-moving average regressions
(SARIMA). To demonstrate time series modeling and
appropriate forecasting in practice, a few empirical
models of passenger air traffic in Canada and Serbia are
exercised and presented in the thesis.
Master rad Tanja Armenski
6
Time series of air passengers in Canada between
January 2007 and December 2017 are produced by the
Canadian border services agency (CBSA) and Statistics
Canada. Data of air traffic in Serbia is collected by
Statistical Office of the Republic of Serbia and
published by Aerodrom Nikola Tesla, Belgrade.
The results shows that in most cases ARIMA models
provided most accurate forecasts, while Holt-Winter's
exponential smoothing method outperformed other
models on the air traffic from Canada to the United
States. With MAPE and RMSPE scores below 10% on
average, all models provided accurate forecasts.
Accepted on Scientific Board on:
AS
13.06. 2018.
Defended:
DE
Thesis Defend Board:
DB
President: Zorana Lužanin, PhD,
Faculty of Economics, University of Novi Sad, full-
time professor
Member: Dejan Brcanov, PhD,
Faculty of Economics, University of Novi Sad,
assistenat professor
Member: Mirko Savić, PhD, Faculty of Economics,
University of Novi Sad, full-time professor
Master rad Tanja Armenski
7
Rezime
U radu se procenjuje preciznost vremenskih serija u prognozi kapaciteta međunarodnog avio
saobraćaja na primeru Kanade i Srbije. Cilj rada je da se primenom različitih modela
vremenskih serija, kao što su Holt-Vinters eksponencijalno izravnavanje, autoregresivni procesi
pokretnih proseka (ARMA), autoregresivni integrisani procesi pokretnih proseka (ARIMA) i
sezonski model sa autoregresivno integrisanim prosecima (SARIMA), utvrdi koji model je
najprecizniji u predviđanju broja putnika u međunarodnom avio saobraćaju na primeru Kanade
i Srbije. Podaci o broju putnika u avio saobraćaju u periodu od januara 2007. do decembra 2017.
godine, prikupljeni su od strane Kanadske agencije za granične usluge i Statistike Kanade.
Podatke o broja putnika u avio saobraćaju Srbije prikuplja Republički zavod za statistiku Srbije
i publikuje arhiva Aerodroma Nikola Tesla, Beograd.
Rezultati su pokazali da u većini ispitivanih slučajeva modeli klase ARIMA postižu najpreciznije
prognoze. Holt-Winter-ov metod eksponencijalnog izravnavanja je dao najpreciznije prognoze
za seriju avio saobraćaja iz Kanade za USA. Svi parametri MAPE i RMSPE su ispod
preporučene vrednosti od 10% što generalno ukazuje na dobre performanse prognoza.
Ključne reči: eksponencijalno izravnavanja, ARIMA, SARIMA, avio saobraćaj, Srbija, Kanada
Master rad Tanja Armenski
8
Abstract
This thesis evaluates various time series models and their efficiency in forecasting the
passengers air traffic. Various time series models are analyzed such as Holt-Winters exponential
smoothing, autoregressive and moving average processes (ARMA), autoregressive-integrated-
moving average (ARIMA) and seasonal autoregressive-integrated-moving average regressions
(SARIMA). To explain how to select the most appropriate model in practice, a few examples of
passenger air traffic in Canada and Serbia are presented.
Time series of air passengers in Canada between January 2007 and December 2017 are
produced by the Canadian border services agency (CBSA) and Statistics Canada. Data of air
traffic in Serbia is collected by the Statistical Office of the Republic of Serbia and published by
Aerodrom Nikola Tesla, Belgrade.
The results shows that in most cases ARIMA models provided most accurate forecasts, while
Holt-Winter's exponential smoothing method outperformed other models on the air traffic from
Canada to the United States. With MAPE and RMSPE scores below 10% on average, all models
provided accurate forecasts.
Key words: Exponential Smoothing, ARIMA, SARIMA, Air Traffic, Serbia, Canada
Master rad Tanja Armenski
9
SADRŽAJ
1. Uvod .................................................................................................................11
1.1. Predmet istraživanja ..................................................................................................................... 11
1.2. Ciljevi istraživanja ....................................................................................................................... 12
2. Pregled literature ............................................................................................15
3. Stohastički procesi i vremenske serije ..........................................................18
3.1. Stohastički procesi ...................................................................................................................... 18
3.2. Autokovarijansa i autokorelaciona funkcija stacionarnog stohastičkog procesa ........................ 22
3.3. Vremenske serije ......................................................................................................................... 22
3.4. Osnovne komponente vremenskih serija ..................................................................................... 24
4. Strukturni modeli vremenskih serija ...........................................................26
4.1. Holt-Winter-ov metod eksponencijalnog izravnavanja ............................................................... 26
5. Linearni procesi i linearne vremenske serije ...............................................29
5.1. Linearni procesi ........................................................................................................................... 29
5.2. Operatori u analizi vremenskih serija .......................................................................................... 32
5.3. Autoregresivni procesi AR (p) .................................................................................................... 33
5.3.1. Parcijalna autokorelacijona funkcija .................................................................................... 36
5.4. Procesi pokretnih proseka MA (q) .............................................................................................. 38
5.5. Autoregresivni procesi pokretnih proseka ARMA (p,q) ............................................................. 41
6. Modeli nestacionarnih vremenskih serija ....................................................43
6.1. Tipovi nestacionarnih vremenskih serija ..................................................................................... 43
6.2. Autoregresivni integrisani procesi pokretnih proseka ARIMA (p,d,q) ....................................... 44
6.3. Sezonski autoregresivni integrisani procesi pokretnih proseka SARIMA (p,d,q) (P,D,Q)s ........ 45
6.4. Stabilizacija varijanse .................................................................................................................. 47
6.5. Testovi jediničnih korena ............................................................................................................ 47
6.6. Opšta strategija izgradnje ARIMA modela ................................................................................. 49
6.7. Kriterijumi performansi predviđanja ........................................................................................... 51
7. Metodologija istraživanja ..............................................................................52
8. Rezultati istraživanja .....................................................................................53
8.1. Deskriptivna statistika ................................................................................................................. 53
8.2. Holt-Winter-ov metod eksponencijalnog izravnavanja ............................................................... 55
8.3. Univarijantni modeli vremenskih serija ...................................................................................... 56
Master rad Tanja Armenski
10
9. Zaključak i diskusija ......................................................................................60
Literatura ............................................................................................................64
Master rad Tanja Armenski
11
1. Uvod
1.1. Predmet istraživanja
Vremenska serija je uređeni niz opservacija, gde se uređivanje vrši u odnosu na vreme, najčešće,
u jednakim vremenskim intervalima. Vremenske serije i njihova analiza su pogodno sredstvo
za predviđanjem parametara čije vrednosti zavise od vremenskog poredka. U ovom kontekstu
predviđanje podrazumeva analizu istorijskih podataka, na osnovu kojih prognoziramo buduće
opservacije uz upotrebu odgovarajućeg matematičkih modela. Analiza vremenskih serija je
našla široku primenu u oblasti turizma i transporta.
Predmet istraživanja ovog master rada je analiza predviđanja kapaciteta međunarodnog avio
saobraćaja na primeru Kanade i Srbije. Osnovni cilj rada je procena preciznosti najčešće
primenjivanih vremenskih modela u kratkoročnoj i srednjoročnoj prognozi kapaciteta
prekograničnog avio saobraćaja. Evaluacija vremenskih serija je primenjena na podacima o
broju putnika u prekograničnom avio saobraćaju u periodu od januara 2007. do decembra 2017.
godine.
U radu, avio saobraćaj dolazećeg i odlazećeg saobraćajnog toka analiziran je u okviru dva
segmenta, međunarodni avio saobraćaj koji čine letovi između Kanade i USA1 i letovi između
Kanade i drugih inostranih tržišta. Na primeru Srbije, analiziran je broj putnika u dolazećem i
odlazećem međunarodnom avio saobraćaju.
Područje istraživanja je međunarodni avio saobraćaj na primeru Kanade i Srbije. Međunarodni
avio saobraćaj je prepoznat kao značajan faktor ekonomskog razvoja ovih zemalja. Primera
radi, broj putnika u međunarodnom vazdušnom saobraćaju Kanade je značajno porastao od
2007. godine, sa 21,4 miliona na 32,8 miliona u 2017. godini (Statistics Canada, 2017a). Avio
saobraćaj je ostvario 2% doprinosa u ukupnom bruto domaćem proizvodu (BDP) u iznosu od
9,4 milijardi dolara u 2017. godini (Statistics Canada, 2017b; Statistics Canada, 2017c). Broj
1 Sjedinjene Američke Države (USA) preuzeta skraćenica iz engleskg jezika ‘the United States of America“.
Master rad Tanja Armenski
12
zaposlenih u avio sektoru iznosio je 217,1 hiljada u 2017, odnosno 63% od ukupnog broja
zaposlenih u saobraćajnom sektoru (Statistics Canada, 2017c).
Broj putnika u međunarodnom avio saobraćaju u Srbiji je porastao sa 2,5 miliona u 2007. godini
na 6,0 miliona putnika na odlaznim i dolaznim letovima u 2017. godini. Iste godine, delatnosti
saobraćaja i skladištenja2 su doprinele 4% u ukupnom bruto nacionalnom proizvodu u iznosu
od 179.530,1 miliona RSD dinara. U sektoru saobraćaja zaposleno je 132,0 hiljade lica, odnosno
5% od ukupnog broja zaposlenih u 2017. godini (Statistički godišnjak, 2017).
1.2. Ciljevi istraživanja
Ovaj rad ima cilj da prognozira kapacitet putnika u međunarodnom avio saobraćaju evaluacijom
različitih modela vremenskih serija. S obzirom da je avio saobraćaj povezan sa ekonomijom,
očekuje se da će serija podataka pokazivati ciklične obrasce ili sezonsko varijacije.
Pored toga, pošto je svaka ekonomija podložna uticajima iz okruženja različite prirode kao što
su politički, klimatski, itd. očekuje se da će serije vremenskih podataka sadržati nestandardne
opservacije koje predstavljaju izvore varijacija u podacima. Primera radi, politički događaji kao
što su inicijative Vlade USA za povećanje bezbednosti i sigurnosti granica sa Kanadom nakom
terorističkog napada 2001. godine i kasnije ekonomska recesija u Kanadi 2008/2009. godine su
značajno uticali na smanjenje broja putnika u međunarodnom saobraćaju (Baggs i sar., 2015).
Slično, Srbiju nakon 2007. godine karakteriše promenljiva politička i tržišna situacija. Kuljanin
i Kalić (2015) sugerišu da je bolja politička situacija, delimično otvaranje avio tržišta, ulazak
nisko-budžetnih avio kompanija na srpsko avio tržište uticala na pozitivni trend broja putnika u
međunarodnom avio saobraćaju.
2 Delatnosti saobraćaja i skladištenja obuhvataju: kopneni saobraćaj i cevovodni transport, vodeni saobraćaj,
vazdušni saobraćaj, skladištenje i prateće aktivnosti u saobraćaju, kao i poštanske aktivnosti. Bruto dodata vrednost
po delatnostima u tekućim cenama (mil RSD) dostupna je u tabeli “Bruto dodata vrednost po delatnostima i bruto
domaći proizvod”, Statistički godišnjak, Republički zavod za statistiku R. Srbije, 2017.
Master rad Tanja Armenski
13
Za predviđanje broja putnika u međunarodnom avio saobraćaju u literaturi se najčešće
primenjuju modeli vremenskih serija zasnovani na Box-Jenkis metodi u klasi ARIMA modela
(Gunter, Onder, 2015). Međutim, ove studije pokazuju da performanse predviđanja različitih
modela variraju u zavisnosti od frekvencije podataka (dnevni, mesečni, kvartalni, godišnji),
porekla zemlje putnika, zemlje destinacije putnika, dužine prognoze (kratkoročne, dugoročne
prognoze) itd. (Chu, 2009). Takođe, nijedan metodološki pristup nije pokazao stabilne i
precizne performanse u smislu prognoziranja izvan ispitivanog uzorka (Shen i sar., 2011).
Poslednjih godina, predviđanje kapaciteta saobraćaja naprednim tehnikama kao što su mašinsko
učenje i veštačka inteligencija postaje popularno u oblasti turizma, ali su ove tehnike još u
eksperimentalnoj fazi učenja i nadgledanja u učenju (Claveria i sar., 2016; Ganga i sar., 2018).
U ovom radu će biti analizirani različiti modeli vremenskih serija, kao što su Holt-Vinters
eksponencijalno izravnavanje, autoregresivne procese pokretnih proseka (ARMA)3,
autoregresivne integrisane procese pokretnih proseka (ARIMA)4 i sezonske autoregresivne
integrisane procese pokretnih proseka (SARIMA)5 sa ciljem da se utvrdi koja metoda je
najpreciznija u predviđanju broja putnika u međunarodnom avio saobraćaju na primeru Kanade
i Srbije.
Cilj master rada je da odgovi na sledeća istraživačka pitanja:
1) Da li serije međunarodnog avio saobraćaja na primeru Kanade i Srbije imaju slične
statističke osobine, odnosno trend, ciklične obrasce, stacionarnost i varijabilitet ili se
ove karakteristike znatno razlikuju?
2) Koji faktori iz geopolitičkog, ekonomskog okruženja su značajno modifikovali ili
varirali ispitivane serije podataka u periodu 2007-2017. godine?
3) Koji modeli vremenskih serija su najprecizniji u prognozi kapaciteta dolazećeg i
odlazećeg međunarodnog avio saobraćaja na primerima Kanade i Srbije?
3 Straćenica za autoregresivne procese pokretnih proseka (ARMA) preuzeta je iz engleskog jezika “Autoregressive
moving average“. 4 Straćenica za autoregresivne integrisane procese pokretnih proseka (ARIMA) preuzeta je iz engleskog jezika
“Autoregressive integrated moving average“. 5 Straćenica za sezonske autoregresivne integrisane procese pokretnih proseka (SARIMA) preuzeta je iz engleskog
jezika “Seasonal autoregressive integrated moving average“.
Master rad Tanja Armenski
14
Rad je organizovan po sledećim poglavljima. U prvom delu rada predstavljen je problem
istraživanja, postavljeni su ciljevi istraživanja i istraživačka pitanja. U drugom delu rada
prikazani su rezultati sličnih relevantnih istraživanja i predstavljene su teorijske osnove modela
vremenskih serija analiziranih u radu. Metodologija istraživanja predstavljena je u trećem
poglavlju. U četvrtom delu rada, uz korišćenje teorijskih pojmova obrađenih u prethodnim
poglavljima, objašnjen je način izbora odgovarajućih modela u praksi na primerima vazdušnog
putničkog saobraćaja u Kanadi i Srbiji. Zaključci i diskusija istraživanja, kao i ograničenja
analiziranih modela vremenskih serija u prognozi kapaciteta međunarodnog avio saobraćaja,
predstavljeni su u petom delu rad.
Master rad Tanja Armenski
15
2. Pregled literature
Postoji veliki broj studija koje se fokusiraju na predviđanje broja putnika u međunarodnom
saobraćaju. Radovi iz oblasti turizma se uglavnom fokusiraju na procenu i prognozu
međunarodnih turističkih dolazaka u Evropu (Hassani i sar., 2017; Yılmaz, 2015; Gunter, U.,
Önder, 2015), Aziju (Kumar, Šarma, 2016; Nai i sar, 2017) i u Severnu Ameriku (Gil-Alana,
Barros, Assaf, 2012; Bao, Xiong, Hu, 2012).
Na primeru Kanade, urađene je nekoliko studija evaluacije performansi vremenskih serija i
preciznosti predviđanja broja putnika u avio saobraćaju (Bougas, 2013; Rodríguez, 2003).
Autor Bougas (2013) je ispitivao preciznost različitih modela vremenskih serija u kratkoročnim
i srednjoročnim prognozama broja putnika u avionskom saobraćaju u Kanadi u periodu od
januara 1988 do decembra 2008. Autor je analizirao nekoliko osnovnih modela vremenskih
serija kao što su harmonična regresija, Holt-Vinters eksponencijalno izravnavanje, ARIMA,
SARIMA i kombinovanih tehnika na tri tipa podataka: broju putnika u domaćem avio saobraćaju,
prekograničnom avio saobraćaju sa USA-om i na međunarodnim letovima. Za procenu
preciznosti prognoza korišćeni su parametri: srednja apsolutna greška u procentima (MAPE)6 i
koren srednje kvadratne greške u procentima (RMSPE)7.
Rezultati studije pokazuju da su modeli ARIMA i SARIMA precizniji od harmonične regresije
na sva tri tipa ispitivanih podataka. ARIMA, SARIMA i harmonična regresija su davali preciznije
estimacije od Holt-Vinters eksponencijalnog izravnavanja. Kombinacije osnovnih modela sa
tehnikama jednostavnog uprošćavanja i varijansno-kovarijansnim opterećenjima u optimaziciji
vremenskih serija pokazuju bolje predikcione sposobnosti na sva tri tipa ispitivanih podataka i
u slučaju svih ispitivanih modela vremenskih serija. ARIMA je pokazala dobre performanse u
kratkoročnim prognozama do jednog tromesečja, a kombinovani modeli su davali preciznije
mere u dugoročnim prognozama.
6 Skraćenica za apsolutnu grešku reziduala u procentima (MAPE) preuzeta je iz engleskog jezika “Mean absolute
percentage error”. 7 Skraćenica za koren srednje kvadratne greške u procentima (RMSPE) preuzeta je iz engleskog jezika “Root Mean
Square Percentage Error”.
Master rad Tanja Armenski
16
Studija Kulendran i Witt (2003) pokazuju da je ARIMA model precizniji od modela
jednostavnog eksponenciajlnog izravnavanja8 u srednjoročnim prognozama od četiri do šest
kvartala unapred. Kulendran i Witt (2003) su došli do ovog zaključka na kvartalnim podacima
međunarodnih dolazaka avionom iz Japana, Novog Zelanda, Velike Britanije i USA-a u
Australiju u periodu 1998-2002. Slične rezultate, odnosno bolje prediktivne sposobnosti ARIMA
modela u kratkoročnim predikcijama u odnosu na model jednostavnog eksponenciajlnog
izravnavanja i naivni model9 sugerisali su autori Kulendran i Shan (2002) koji su sproveli
istraživanje na mesečnim podacima turističkih dolazaka u Kinu u periodu 1995-2005. Du Preez
i Witt (2003) su takođe došli do rezultata da su univarijantni modeli klase ARIMA davali
preciznije prognoze u odnosu na druge modele tipa BSM na podacima broja turističkih dolazaka
na Sejšele na mesečnim podacima u periodu 1995-2003.
Na primeru Srbije, postoji mali broj studija koje se bave ocenama performansi modela
vremenskih serija u predviđanju broja putnika u međunarodnom saobraćaju. Značajna
istraživanja su obavili autori Milenković i sar. (2015), ali na vremenskim serijama broja putnika
u železničkom saobraćaju. Ovi autori su primenili sezonski model eksponencijalnog
izravnavanja (SES) i SARIMA model na mesečnim podacima putnika u železničkom sabraćaju
od januara 2004 do juna 2014. Autori su došli do zaključka da je SARIMA tipa (0,1,0)(0,1,1)12
davala najpreciznije predikcije (u daljem tekstu je objašnjena notacija ovog modela).
Kalić, Dožic, Babić (2011) su se bavili predikcijom broja inostranih avio dolazaka u avio
saobraćaju u Srbiju, ali samo primenom multivarijantne linearne regresije sa regresorima GDP
i ukupnog broja putnika registrovanih na aerodromu Nikola Tesla, Beograd u period od 2001.
do 2010. godine. Serija podataka nije tretirana modelima vremenskih serija.
8 Kod modela jednostavnog eksponencijalnog izravnavanje prognozirana vrednost za period 𝑡(𝑡) je ponderisani
prosek tekuće vrednosti serije za period 𝑡(𝑋𝑡) i prognozirane vrednosti za period 𝑡 − 1 (𝑡−1). Ako je ponder 𝛼
broj iz intervala (0,1), koji se naziva konstanta izravnavanja, tada je: 𝑡 = 𝛼𝑋𝑡 + (1 − 𝛼)𝑡−1. Jednostavno
eksponencijalno izravnavanje pokazuje dobre rezultate kada se koristi kod vremenskih serija koje nemaju trend ni
komponente sezonskih ili cikličnih fluktuacija (više informacija kod Mladenović i Nojković (2012)). 9 Naivni modeli je najjednostavniji model prognoze koji pretpostavlja da je vrednost prognoze za period 𝑡(𝑡)
jednak stvarnoj vrednosti poslednjeg perioda 𝑡 − 1(𝑋𝑡−1): 𝑡=𝑋𝑡−1 Ovaj model se obično koristi kao osnovni
model za poređenje sa drugim kompleksnijim modelima (više informacija kod Mladenović i Nojković (2012)).
Master rad Tanja Armenski
17
Na primeru Makedonije, zemlje iz neposrednog okruženja, Petrovska (2017) je analizirala
preciznost nekoliko modela vremenskih serija koji se zasnivaju na Box–Jenkins metodologiji,
iz kategorije ARIMA modela na godišnjim podacima broja međunarodnih dolazaka u avio
saobraćaju Makedonije u periodu 1956–2013. Rezultati su pokazali da 𝐴𝑅𝐼𝑀𝐴 (1,1,1) model
daje najpreciznije prognoze (u daljem tekstu je objašnjena notacija modela).
Studije novijeg datuma, kao što je studija Hassani i sar. (2017) je procenjivao devet alternativnih
parametarskih i neparametrijskih modela na podacima međunarodnih dolazaka putnika
avionom u devet evropskih zemalja, Nemačka, Grčka, Španija, Kipar, Holandija, Austrija,
Portugal, Švedska i Velika Britanija, u periodu od januara 2000. do decembra 2013. godine. Ovi
autori si došli do rezultata da je ARIMA najpogodniji model za estimaciju i predikciju
međunarodnih dolazaka u avio saobraćaju ispitivanih Evropskih zemalja. Kumar i Šarma (2016)
uspešno su prognozirali dolaske turista u Singapur prema modelu SARIMA na mesečnim
podacima od januara 2003 do decembra 2013. Autor, Yılmaz (2015) je takođe na primeru
međunarodnih putničkih dolazaka u Tursku na mesečnim podacima u periodu januara 2002. do
decembra 2013. godine sugerisao da je SARIMA davala najpreciznije estimacije i imala uspešan
učinak u prognozi ukupnih putničkih dolazaka.
Master rad Tanja Armenski
18
3. Stohastički procesi i vremenske serije
3.1. Stohastički procesi
Vremenska serija predstavlja niz slučajnih veličina koje su uređene u odnosu na vreme. Slučajna
promenljiva je statistički pojam, dok je u analizi vremenskih serija upravo od interesa opisati
promene slučajnih promenljivih u vremenu. Do pojma slučajnog procesa dolazi se
proširivanjem pojma slučajnog elementa. Slučajni element je funkcija koja kao rezultat daje
moguće ishode slučajnog eksperimenta. Ako se slučajni element posmatra u zavisnosti od
vremena onda on postaje i funkcija vremena.
U opštem slučaju, slučajni element ne zavisi od vremena. Međutim, mnoge pojave i događaji
čiji su ishodi neizvesni, a koji se odvijaju u vremenu zahtevaju da se pojam slučajnog elementa
uopšti tako da se uključi i vremenska komponenta 𝑡. Posmatrajući familiju slučajnih elemenata
koji zavise od vremena dolazi se do definicije stohastičkog ili slučajnog procesa (Rajter-Ćirić,
2009; Mladenović, Nojković, 2012):
Definicija: Neka je (Ω, Ƒ, 𝑃) prostor verovatnoće, preslikavanje 𝑋: Ω → ℝ se zove slučajna
promenljiva ako važi 𝑋(−1)(𝐵) ∈ Ƒ10. Familija slučajnih promenljivih 𝑋𝑡(ω): 𝑡 ∈ 𝑇, ω ∈ Ω
definisanih nad istim prostorom verovatnoće (Ω, Ƒ, 𝑃 ) se zove stohastički (slučajni) proces sa
indeksnim skupom 𝑇.
Stohastički proces zavisi od dve promenljive 𝑡 i ω. Za fiksirano 𝑡0 ∈ 𝑇, funkcija 𝑋𝑡0 (ω) je
jedna slučajna promenljiva koja se naziva zasek. Za fiksirano ω0 ∈ Ω, funkcija 𝑋𝑡(ω0) je
funkcija definisana na skupu 𝑇 koja se naziva realizacija ili trajektorija slučajnog procesa.
Za fiksirane obe vrednosti 𝑡0 ∈ 𝑇 i ω0 ∈ Ω, funkcija 𝑋𝑡0(ω0) predstavlja realan broj ili jednu
realizaciju stohastičkog procesa. U tom kontekstu, vremenska serija (𝑡) je realizacija familije
slučajnih promenljivih koja se zove stohastički proces, u kraćem zapisu 𝑋𝑡: 𝑡 ∈ 𝑇.
10 gde je 𝐵 Borelova 𝛿-algebra za 𝑋 tada kažemo da je Ƒ merljivo (više u knjizi Rajter-Ćirić, 2009)
Master rad Tanja Armenski
19
Skup 𝑇 iz prethodne definicije određuje tip slučajnog procesa. Ako je skup 𝑇 neki interval iz
skupa ℝ, onda se parametar 𝑡 ∈ 𝑇 najčešće interpretira kao vreme, pa je slučajan proces 𝑋𝑡, 𝑡 ∈
𝑇 slučajan proces sa neprekidnim vremenom. Ako je skup 𝑇 neki podskup skupa celih brojeva
ℤ, onda je slučajan proces 𝑋𝑡, 𝑡 ∈ 𝑇 slučajan proces sa diskretnim vremenom ili slučajni niz.
U ovom radu razmatraće se diskretni slučajni procesi.
Struktura zavisnosti stohostičkog procesa može se opisati formiranjem funkcije raspodele
stohastičkog procesa.
𝐹𝑡(𝑥) = 𝑃𝑋𝑡 ≤ 𝑥 = 𝑃𝜔 ∊ Ω: 𝑋𝑡(𝜔) < 𝑥
U opštem slučaju neophodno je znati i raspodele višedimenzionalnih slučajnih promenljivih.
Neka je fiksirano 𝑛 vremenskih trenutaka 𝑡1, 𝑡2, . . . , 𝑡𝑛. Svakom od tih trenutaka odgovara po
jedna slučajna promenljiva. Tako se dobija 𝑛 slučajnih promenljivih 𝑋𝑡1, 𝑋𝑡2, . . . , 𝑋𝑡𝑛 koje se
mogu posmatrati kao koordinate nekog konačno-dimenzionalnog slučajnog vektora
(𝑋𝑡1, 𝑋𝑡2, . . . , 𝑋𝑡𝑛). Raspodelu konačno-dimenzionalnog vektora definiše naredna definicija.
Definicija: Za svaki prirodan broj 𝑛 i proizvoljne elemente 𝑡1, 𝑡2, . . . , 𝑡𝑛 ∈ 𝑇, t1 < t2 < ⋯ <
tn, familija konačno-dimenzionalnih raspodela slučajnog vektora (𝑋𝑡1, 𝑋𝑡2, . . . , 𝑋𝑡𝑛) je familija
funkcija raspodela definisanih sa:
𝐹𝑡(𝑥)𝑃 = 𝑋𝑡1 ≤ 𝑥1, 𝑋𝑡2 ≤ 𝑥2, … , 𝑋𝑡𝑛 ≤ 𝑥𝑛, (𝑥1, 𝑥2, . . . , 𝑥𝑛) ∈ ℝ𝑛,
Sistem funkcija raspodele zadovoljava uslove simetrije i saglasnosti ako:
Uslov simetrije: ako je 𝑖1, 𝑖2, . . . , 𝑖𝑛 jedna permutacija brojeva od 1 do 𝑛, tada važi:
𝐹𝑡𝑖1 ,...,𝑡𝑖𝑛(𝑥𝑖1
, . . . , 𝑥𝑖𝑛) = 𝐹𝑡1,...,𝑡𝑛
(𝑥1, . . . , 𝑥𝑛)
Uslov saglasnosti: ako je 𝑚 < 𝑛 za proizvoljne 𝑡𝑚+1, . . . , 𝑡𝑛 ∈ 𝑇, tada važi:
𝐹𝑡1,...,𝑡𝑚, 𝑡𝑚+1..., 𝑡𝑛(𝑥1, . . . , 𝑥𝑚, ∞. . . , ∞) = 𝐹𝑡1,...,𝑡𝑚
(𝑥1, . . . , 𝑥𝑚)
Znači da je na osnovu konačnog skupa slučajnih promenljivih 𝑋𝑡1, … , 𝑋𝑡𝑛
dobijenih iz
stohastičkog procesa 𝑋𝑡, 𝑡 ∈ 𝑇 moguće potpuno opisati strukturu zavisnosti na osnovu
Master rad Tanja Armenski
20
funkcije raspodele, u kraćem zapisu F(𝑋𝑡1, … . , 𝑋𝑡𝑛). Zavisnost ove funkcije raspodele i njenih
parametara od vremena nazivamo vremenskom heterogenošću. Ona stvara poteškoće u
modelovanju realnih pojava, jer za svako 𝑡 obično postoji samo jedna observacija, stoga se u
radu ograničavamo na klasu stacionarnih procesa koju karakteriše vremenska homogenost.
Teorema: (Kolmogorova) Za svaku familiju funkcija raspodele koje zadovoljavaju uslove
simetrije i kompatibilnosti postoji prostor verovatnoća (Ω, Ƒ, 𝑃 ) i stohastički proces 𝑋𝑡, ∈ 𝑇
definisan na njemu koji ima date raspodele kao svoje konačno – dimenzionalne raspodele. Tada
za 𝑋𝑡, ∈ 𝑇 stohastički proces važi:
1. Srednja vrednost slučajnog procesa: 𝐸(𝑋𝑡) = 𝜇𝑡, 𝑡 ∈ 𝑇
2. Varijansa slučajnog procesa: Var(𝑋𝑡) = 𝜎𝑡2 = E(𝑋𝑡 − 𝜇𝑡)2, t ∈ T
3. Kovarijansa slučajnog procesa: 𝛾(𝑟,𝑠) = 𝑐𝑜𝑣(𝑋𝑟 , 𝑋𝑠) = 𝐸((𝑋𝑟 − 𝐸(𝑋𝑟))(𝑋𝑠 −
𝐸(𝑋𝑠))), 𝑟, 𝑠 ∈ 𝑇
4. Korelacija slučajnog procesa između 𝑋𝑟 i 𝑋𝑠: 𝜌((𝑟,𝑠)) =𝐶𝑜𝑣(𝑋𝑟𝑋𝑠)
√𝑉𝑎𝑟(𝑋𝑟)𝑉𝑎𝑟(𝑋𝑠), 𝑟, 𝑠 ∈ 𝑇.
Još jedna važna osobina slučajnih procesa jeste njihova stacionarnost.
Definicija: Slučajni proces 𝑋𝑡, 𝑡 ∈ 𝑇 je strogo stacionaran (neizmenjen) ako su njegove
konačno-dimenzionirane funkcije raspodele invarijantne u odnosu na 𝑡, odnosno ako za 𝑡𝑖, 𝑡𝑖 +
𝑡 ∈ 𝑇, 𝑖 = 1,2, . ..
𝐹𝑡1,…,𝑡𝑛(𝑥1, … , 𝑥𝑛) = 𝐹𝑡1+𝑡,…,𝑡𝑛+𝑡
(𝑥1, … , 𝑥𝑛)
Znači da je konačno-dimenzionirana funkcija raspodele slučajnog procesa invarijantna u
odnosu na translaciju u vremenu za proizvoljno 𝑡. Ako je 𝑋𝑡, 𝑡 ∈ 𝑇 strogo stacionaran slučajni
proces sa 𝐸(|𝑋𝑡|) < ∞, tada je očekivana vrednost od 𝑋𝑡 konstantna za svako 𝑡 ∈ 𝑇 pošto je
funkcija raspodele ista za svako 𝑡 ∈ 𝑇. Slično, ako je 𝐸(𝑋𝑡) < ∞, tada je varijansa od 𝑋𝑡
konstanta za svako 𝑡 ∈ 𝑇.
Stroga stacionarnost nekog slučajnog procesa podrazumeva da raspodela verovatnoća
proizvoljno izabranog slučajnog vektora sa određenim brojem komponenata ne zavisi od
Master rad Tanja Armenski
21
pomeranja na vremenskoj osi. Taj uslov je prilično strog i teško se ispituje, pa se pri analizi
slučajnih procesa ispituje samo slaba stacionarnost. U nastavku će se koristiti termin
stacionarnost kada se govori o slaboj stacionarnosti:
Definicija: Slaba stacionarnost 𝑋𝑡, 𝑡 ∈ 𝑇 je stacionarnost 𝑚-tog reda ako za ma koji podskup
(𝑡1, 𝑡2 … . , 𝑡𝑛) ∈ 𝑇 i ma koje 𝑘 ∈ 𝑇, funkcija F(𝑋𝑡1, … . , 𝑋𝑡𝑛) je 𝑚-tog reda i momenti združenih
promenljivih 𝑋𝑡1+𝑘, … , 𝑋𝑡𝑛+𝑘 , tada važi:
𝐸 = [(𝑋𝑡1)
𝑚1 (𝑋𝑡2
)𝑚2
, … , (𝑋𝑡𝑛)
𝑚𝑛] = 𝐸[(𝑋𝑡1+𝑘
)𝑚1
(𝑋𝑡2+𝑘)
𝑚2, … , (𝑋𝑡𝑛+𝑘
)𝑚𝑛
]
gde je 𝑚1 + 𝑚2, … , + 𝑚𝑛 ≤ 𝑚.
Proces je stacionaran 𝑚-tog reda ako postoje svi njegovi momenti 𝑚-tog reda koji ne zavise od
početnog vremenskog trenutka. Primera radi, slaba stacionarnost drugog reda podrazumeva da
proces ima konstantnu sredinu i varijansu, a da su kovarijansna i korelaciona funkcija zavisne
od vremenskog intervala.
Slabo stacionaran stohastički proces 𝑋𝑡, 𝑡 ∈ 𝑇 ispunjava sledeće uslove:
𝐸(𝑋𝑡) = µ = 𝑐𝑜𝑛𝑡. ,⩝ 𝑡 ∈ 𝑇
𝐸(𝑋𝑡2) < ∞, ⩝ 𝑡 ∈ 𝑇
𝛾(𝑋𝑡,𝑋𝑠) = 𝛾(𝑋𝑡+𝑟𝑋𝑠+𝑟), ⩝ 𝑡, 𝑠, 𝑟 ∈ 𝑇.
Poslednji uslov podrazumeva da je kovarijansa slabo stacionarnog slučajnog procesa funkcija
vremenske udaljenosti slučajnih promenljivih, tj. ona ne zavisi od trenutka u kojem se
posmatraju slučajne veličine, već zavisi samo do njihovog međusobnog rastojanja u vremenu.
Još jedna važna klasa slučajnih procesa su normalni ili Gausovski procesi kod kojih je združen
zakon verovatnoće normalan. U ovom radu, ako drugačije nije navedeno, razmatraju se
normalni procesi.
Master rad Tanja Armenski
22
3.2. Autokovarijansa i autokorelaciona funkcija stacionarnog stohastičkog
procesa
Pri definisanju slabo stacionarnih slučajnih procesa ključne veličine za definisanje slučajnih
procesa su autokovarijansa i autokorelaciona funkcija. Kovarijansna i korelaciona funkcija
stohastičkog procesa 𝑋𝑡, 𝑡 ∈ T između dva trenutka 𝑋𝑡, 𝑋𝑡−𝑘 je definisana sa:
1. Kovarijansna funkcija: 𝛾𝑘 = 𝐶𝑜𝑣(𝑋𝑡 , 𝑋𝑡−𝑘) =E((Xt − 𝐸(𝑋𝑡))(𝑋𝑡−𝑘 − 𝐸(𝑋𝑡−𝑘))), t ∈ 𝑇,
k ∈ ℤ
2. Korelaciona funkcija: 𝜌𝑘 =𝐶𝑜𝑣(𝑋𝑡𝑋𝑡−𝑘)
√𝑉𝑎𝑟(𝑋𝑡)𝑉𝑎𝑟(𝑋𝑡−𝑘)=
𝛾𝑘
𝛾0, 𝑡 ∈ 𝑇, 𝑘 ∈ ℤ
gde je 𝑉𝑎𝑟(𝑋𝑡) = 𝑉𝑎𝑟(𝑋𝑡+𝑘) = 𝛾0
Ako su 𝛾𝑘 i 𝜌𝑘 za 𝑘 iz skupa celih brojeva (𝑘 ∈ ℤ) autokovarijansa i autokorelaciona funkcija
slabo stacionarnog procesa, tada važi:
1. 𝛾0 = 𝑉𝑎𝑟(𝑋𝑡) ≥ 0, 𝜌0 = 1
2. 𝛾𝑘 = 𝛾−𝑘, 𝜌𝑘 = 𝜌−𝑘
3. [𝛾𝑘]≤ 𝛾0, [𝜌𝑘]≤ 1
Drugi uslov proizilazi iz osobine simetrije pa su autokovarijansna i autokorelaciona funkcija
parne funkcije docnje 𝑘. Zbog ove simetrije, autokorelacione funkcije se izračunavaju i grafički
prikazuju samo za nenegativne docnje (Kovačić, 1995). Da bi neke funkcije bile
autokovarijansne i autokorelacione funkcije nekog stacionarnog slučajnog procesa one moraju
biti pozitivno semidefinisane.
3.3. Vremenske serije
Definicija:Vremenska serija je jedna realizacija stohastičkog procesa.
Neka je data jedna realizacija slučajnog procesa (X1, … , Xn,), odnosno vremenska serija. Da bi
se na osnovu jedne realizacije slučajnog procesa moglo zaključivati o karakteristikama tih
Master rad Tanja Armenski
23
procesa, kao što je srednja vrednost, varijansa i kovarijansa, potrebno je pored stacionarnosti
vremenske serije zadovoljiti još jedan zahtev u pogledu memorije procesa.
Zahtev da je vremenska serija ergodična znači da uzorački momenti koji su izračunati na osnovu
jedne realizacije srednje kvadratno konvergiraju ka odgovarajućim momentima populacije kada
𝑛 → ∞. U analizi vremenskih serija je od najvećeg značaja da momenti prvog i drugog reda za
jednu realizaciju procesa konvergiraju ka odgovarajućim prvim i drugim momentima populacije
stohastičkog procesa kada se obim uzorka povećava, odnosno da je ispunjeno:
lim𝑛→∞
𝐸 [(1
n∑ Xi − µ𝑛
𝑖=1 )2
] = 0,
lim𝑛→∞
𝐸 [(1
n∑(Xi − µ)2 − 𝜎2
𝑛
𝑖=1
)
2
] = 0
Ergodičnost se može posmatrati kao uslov koji osigurava da će memorija procesa merena
𝛾𝑘 slabiti uprošćavanjem tokom vremena. On je uveden da bi se omogućilo modelovanje
vremenske zavisne slučajnog procesa korišćenjem konačnog skupa parametara. U praksi, uslov
ergodičnosti je ispunjen u većini stacionarnih procesa. Uz uslov ergodičnosti vremenski prosek
je nepristrasna ocena populacione sredine i ocena kovarijacione funkcije je konzistentna ocena
populacione kovarijacione funkcije.
Uz zadovoljene pretpostavke stacionarnosti i ergodičnosti, na osnovu jedne realizacije
slučajnog procesa (X1, … , Xn,), mogu se odrediti sledeće uzoračke ocene:
1. =1
𝑛∑ 𝑋𝑡
𝑛𝑡=1
2. 𝑉𝑎(𝑋𝑡) =1
𝑛∑ (𝑋𝑡 − )2𝑛
𝑡=1
3. 𝛾𝑘 =1
𝑛∑ (𝑋𝑡 − )𝑛
𝑡=𝑘+1 (𝑋𝑡−𝑘 − )
4. 𝑘 =𝑘
0=
∑ (𝑋𝑡−)𝑛𝑡=𝑘+1 (𝑋𝑡−𝑘−)
∑ (𝑋𝑡−)2𝑛𝑡=𝑘+1
Master rad Tanja Armenski
24
Za uzoračke ocene 𝛾𝑘 i 𝑘 je zadovoljen uslov da su determinante njihovih matrica nenegativno
definisane. Box i Jenkins (1976) su predložili da se u praksi ne izračunava više od 𝑛
4
autokorelacionih koeficijenata, gde je 𝑛 obim uzorka, kada postoji mnogo parova (𝑋𝑡,𝑋𝑡−𝑘).
3.4. Osnovne komponente vremenskih serija
„Vremenska serija predstavlja uređeni niz vrednosti neke pojave, tj. niz vrednosti procesa koji
generiše neku pojavu u vremenu, a koje su složene u hronološkom redosledu u sukcesivnim,
jednakim vremenskim intervalima“ (Kovačić, 1998; Hassler i sar., 2013). Svaka vremenska
serija se može razložiti na njene osnovne komponente:
- Trend 𝑓(𝑡) predstavlja dugoročnu pravilnost u kretanju vremenske serije. U zavisnosti
od toga da li vrednosti vremenske serije tokom vremena sistematski opadaju ili rastu
trend može biti opadajući ili rastući“ (Kovačić, 1995)11. Takođe, trend može biti
deterministički ili stohastički, u zavisnosi od toga da li se promene serije tokom vremena
mogu predvideti ili ne, odnosno da li se promene serije mogu aproksimirati nekom
determinističkom funkcijom ili se one dešavaju slučajno (Montgomery i sar. 2008).
- Sezonska komponenta 𝑠(𝑡) predstavlja pravilnost u kretanju serije, koja se pojavljuje u
toku jedne kalendarske godine. Do sezonskih oscilacija dolazi usled promene u
različitim vremenskim uslovima, kao sto su klimatski (leto ili zima) ili kalendarski
faktori (državni praznici, broj vikenda u mesecu itd.).
- Ciklična komponenta 𝑐(𝑡) predstavlja pravilnost u kretanju serije koja se pojavljuje u
određenim cikličnim, često nejednakim, periodima većim od jedne kalendarske godine.
- Slučajne komponente 휀(𝑡) su promene u kretanju vremenske serije slučajnog karaktera.
Nestandardne opservacije u vremenskoj seriji se pojavljuju, na primer, usled obustave
avio saobraćaja zbog vremenskih nepogoda, saobraćajnih nezgoda koje bi usporile ili
prekinule saobraćajni avio tok itd.
11 Kovačić (1995) opisuje neke karakteristične tipove trenda: (1) serije sa jednokratnom intervencijom; (2) sa
stepenastom intervencijom; (3) serija sa rampom; (4) serija sa nestandardnom opservacijom. Za detaljniji pregled
tipova trendova pogledati Kovačić (1995) i Mladenović, Nojković (2012).
Master rad Tanja Armenski
25
U slučaju kada vremenska serija sadrži sve četiri osnovne komponente, postoje tri opšta modela
kojima se može opisati vremenska serija:
1. Aditivni model pretpostavlja da se sve komponente ponašaju nezavisno jedna od druge.
Odnosno, povećanje jedne od komponenti ne izaziva povećanje ili smanjenje neke druge
komponente. Aditivni model se koristi ako su sezonska, ciklična i slučajna komponenta
nezavisne od kretanja trenda:
𝑋𝑡 = 𝑓(𝑡) + 𝑠(𝑡) + 𝑐(𝑡) + ɛ(𝑡)
2. Multiplikativni model pretpostavlja da su sve komponente međusobno zavisne. Primera radi,
ako trend serije raste, varijansa izazvana sezonom, ciklusom ili slučajnim kretanjem će takođe
rasti:
𝑋𝑡 = 𝑓(𝑡) · 𝑠(𝑡) · 𝑐(𝑡) · ɛ(𝑡)
3. Mešoviti model predstavlja kombinaciju aditivnog i multiplikativnog modela. U njemu se
pretpostavlja da su sezonska i slučajna komponenta zavisne od ciklične komponente i trenda,
ali da su one međusobno nezavisne:
𝑋𝑡 = 𝑓(𝑡) · 𝑐(𝑡) · (𝑠(𝑡) + ɛ(𝑡) − 1)
Druga svojstva vremenskih serija se mogu opisati klasifikacijom vremenskih serija u odnosu na
različite kriterijume. U zavisnosti od toga kako se registruju vrednosti u vremenskim serijama
razlikuju se neprekidne i diskrente (prekidne) vremenske serije. Kod neprekidnih vremenskih
serija vrednosti se mogu registrovati u bilo kom vremenskom trenutku dok se kod diskretnih
serija vrednosti beleže u istim, jednakim vremenskim intervalima (sat, dan, nedelja, mesec,
godina, itd.). Vremenske serije se još mogu podeliti i na stacionarne i nestacionarne vremenske
serije u zavisnosti da li se prosečne vrednosti serija menjaju ili ne menjaju tokom vremena.
Stacionarna sredina procesa, odnosno konstantan prosečni nivo (𝜇𝑡) oko kog se kreću slučajne
fluktuacije, omogućava lakše i preciznije predviđanje budućih vrednosti vremenskih serija.
Najveći broj vremenskih serija ne zadovoljava uslov stacionarnosti, što dalje zahteva
transformaciju vremenskih serija u cilju njene stabilizacije. Takođe, postoje modeli kojima se
predviđaju nestacionarni linerni procesi među kojima je i ARIMA.
Master rad Tanja Armenski
26
4. Strukturni modeli vremenskih serija
U vremenskih serija obično su prisutna kolebanja individualnih vrednosti opservacija u seriji.
Ta kolebanja, frekvencije, znatno otežati uočavanje osnovnih tendencija razvoja posmatrane
serije stoga je potrebno kolebanja individualnih vrednosti serije svesti na što manju meru,
izravnavanjem serije. Vremenska serija se izravnava prilagođavanjem linije trenda svim
opservacijama serije i ta prilagođena linija trenda predstavlja ocenu glatkog kretanja serije, a
razlike između opservacija vremenske serije i ocenjenog trenda su reziduali.
U ovoj metodi polazi se od pretpostavke da je važnost podataka u seriji obrnuto proporcionalna
sa njihovom starošću stoga se seriji pridružuju vrednosti pondera koji opadaju po geometrijskoj
progresiji sa starošću. Prema karakteristikama vremenske serije koja se ispituje, kao što je
prisustvo i tip trenda i sezonski karakter, biraju se odgovarajući metode izravnavanja. Postoje
tri osnovna tipa eksponencijalnog izravnavanja: jednostavno izravnavanje, dvostruko
izravnavanje i trostruko eksponencijalno izravnavanje12. Ovaj rad se fokusira na Holt-Winter-
ovoj metodi trostrukog eksponencijalnog izravnavanja.
4.1. Holt-Winter-ov metod eksponencijalnog izravnavanja
Holt-Winter-ov metod trostrukog eksponencijalnog izravnavanja se koristi za modelovanje
vremenskih serija koje nemaju konstantan srednji nivo (𝜇𝑡) oko kog se kreću slučajne
fluktuacije, a imaju trend (𝑓𝑡), sezonu (𝑠𝑡) i slučajnu komponentu (휀𝑡) za koju važe sledeći
uslovi:
𝐸(ɛ𝑡) = 0, ⩝ 𝑡
𝑉𝑎𝑟 (ɛ𝑡) = 𝜎ɛ2, ⩝ 𝑡
𝐶𝑜𝑣(ɛ𝑡, ɛ𝑠) = 0, ⩝ 𝑡, ⩝ 𝑠, 𝑡 ≠ 𝑠.
12 Za više informacija o jednostrukom i dvostrukom metodu izravnavanja pogledati Mladenović i Nojković (2012).
Master rad Tanja Armenski
27
U zavisnosti od tipa sezonske komponente, aditivne ili multiplikativne, mogu se primeniti dve
procedure izravnavanja. Za vremenske serije sa aditivnom sezonskom komponentom 𝑠𝑡 koja
ima period k :
𝜇𝑡 = 𝛼(𝑋𝑡 − 𝑠𝑡−𝑘) + (1 − 𝛼)(𝜇𝑡−1 + 𝑓𝑡−1)
𝑓𝑡 = 𝛽(𝜇𝑡 − 𝜇𝑡−1) + (1 − 𝛽)𝑓𝑡−1
𝑠𝑡 = 𝛾(𝑋𝑡 − 𝜇𝑡) + (1 − 𝛾)𝑠𝑡−𝑘
gde su 𝛼, 𝛽, i 𝛾 ponderi za nivo, trend i sezonsku komponentu čijim se pridruživanjem vrši
izravnavanje vremenske serije. Prognozirana vrednost vremenske serije (𝑡), koja ima period
𝑘, za ℎ perioda unapred zasnovana na 𝑡 prethodnih raspoloživih opservacija je:
𝑡(ℎ) = 𝜇𝑡 + ℎ𝑓𝑡 + 𝑠𝑡−𝑘+ℎ
Za vremenske serije sa multiplikativnom sezonskom komponentom 𝑠𝑡 koja ima period 𝑘 važi:
𝜇𝑡 = 𝛼(𝑋𝑡
𝑠𝑡−𝑘) + (1 − 𝛼)(𝜇𝑡−1 + 𝑓𝑡−1)
𝑓𝑡 = 𝛽(𝜇𝑡 − 𝜇𝑡−1) + (1 − 𝛽)𝑓𝑡−1
𝑠𝑡 = 𝛾(𝑋𝑡
𝜇𝑡) + (1 − 𝛾)𝑠𝑡−𝑘
Prognozirana vrednost multiplikativne vremenske serije (𝑡), koja ima period 𝑘, za ℎ perioda
unapred, zasnovana na 𝑡 prethodnih raspoloživih opservacija iznositi:
𝑡(ℎ) = (𝜇𝑡 + ℎ𝑓𝑡) · 𝑠𝑡−𝑘+ℎ
Što se tiče izbora početnih vrednosti konstanti izravnavanja (𝛼, 𝛽, 𝛾) kod Holt-Winters-ovog
trosturkog eksponencijalnog izravnavanja preporučuju se vrednosti od 0.01 do 0.3 za sve tri
komponente koje se podležu izravnavanju (Montgomery i sar., 2008). Međutim, isti autori
kritikuju kompletno arbitraran izbor početnih vrednosti konstanti izravnavanja nezavisno od
karakteristika same vremenske serije i sugerišu da testiranjem različitih početnih vrednosti
konstantni može da se utvrde i izaberu vrednosti koje minimiziraju srednju kvadratnu grešku
prognoze, kao jednog od statističkih pokazatelja kvaliteta same prognoze.
Master rad Tanja Armenski
28
Sve tri konstante izravnavanja (𝛼, 𝛽, 𝛾) zadovoljavaju uslove da je njihova suma jednaka 1.
Kako se vrednosti parametara kreću u rasponu između 0 i 1, što je manja vrednost konstante
izravnavanja to će ocena nivoa sporije reagovati na promenu (glatko izravnavanje) i obrnuto,
ocene bliže 1 uzrokovaće da izravnate vrednosti brzo reaguju na promene nivoa i slučajnih
fluktuacija u seriji (Coshall, 2009).
Master rad Tanja Armenski
29
5. Linearni procesi i linearne vremenske serije
5.1. Linearni procesi
Pronalaženje odgovarajuće funkcionalne veze između određenih ulaznih (istorijskih podataka)
i izlaznih (prognoze) informacija u vremenskoj seriji je jedan od osnovnih zadataka statističkog
modelovanja. Najčešća pretpostavka je da je ta veza linearna. U analizi vremenskih serija
linearni filter je operator koji transformiše vremensku seriju 𝑋𝑡𝑡∈ℤ u vremensku seriju 𝑌𝑡𝑡∈ℤ.
Linearni filter može da se definiše:
𝑌𝑡 = 𝐿(𝑋𝑡) = ∑ 𝜔𝑗𝑋𝑡−𝑗
∞
𝑗=0
gde su 𝜔𝑗 koeficijenti vremenski invarijantni. Kako su u praksi, prilikom modelovanja
vremenske serije na raspolaganju istorijski podaci, definicija pretpostavlja da je 𝑗 ≥ 0.
Definicija implicira da će vrednosti 𝑌𝑡𝑡∈ℤ u trenutku 𝑡 zavisiti samo od sopstvenih prošlih
vrednosti.
Definicija Proces 𝑋𝑡, 𝑡 ∈ T je linearan ako može da se predstavi u obliku
𝑋𝑡 = µ𝑡 + ∑ 𝜃𝑗ɛ𝑡−𝑗
∞
𝑗=0
gde je µ𝑡 deterministička komponenta, ɛ𝑡 ɛ𝑡, 𝑡 ∈ T niz nekoreliranih slučajnih promenljivih i
𝜃1, 𝜃2,…. nepoznati parametri.
Osnovno odlika determinističke komponente je ta da ona može da se aproksimira nekom
matematičkom funkcijom. U slučaju prognoze vremenskih serija to znači da će izabrani tip
funkcije važiti i u budućem periodu.
Stohastička komponenta ∑ 𝜃𝑗ɛ𝑡−𝑗∞𝑗=0 procesa opisuje dejstvo slučajnih faktora u modelu.
Osnovna pretpostavka je da se stohastička komponenta može modelovati pomoću procesa belog
šuma ɛ𝑡, 𝑡 ∈ T.
Master rad Tanja Armenski
30
Beli šum formira niz slučajnih promenljivih međusobno nekoreliranih koje imaju jednaku
raspodelu 𝐸(ɛ𝑡) = 0 sa konstantnom 𝑉𝑎𝑟(ɛ𝑡)=𝜎2 i 𝛾𝑘 = 𝐶𝑜𝑣(ɛ𝑡, ɛ𝑡−𝑘) = 0, za svako 𝑘 ≠ 0.
Tada je proces belog šuma stacionaran proces čija je autokovarijansna i autokorelaciona
funkcija:
1. 𝛾𝑘 = 𝜎2, 𝑘 = 00, 𝑘 ≠ 0
2. 𝜌𝑘 = 1, 𝑘 = 0 0, 𝑘 ≠ 0
U analizi vremenskih serija, beli šum služi za izvođenje autokovarijansne i autokorelacione
funkcije koje se koriste kao reperne vrednosti za poređenje istih pokazatelja drugih procesa.
1. Očekivanje i varijansa linearnog procesa su: 𝐸(𝑋𝑡) = µ𝑡 i 𝑉𝑎𝑟(𝑋𝑡) = 𝜎2 ∑ 𝜃𝑗2∞
𝑗=0
2. Kovarijansna funkcija linearnog procesa 𝑘-toj docnji 𝛾𝑘 = 𝜎2 ∑ 𝜃𝑗∞𝑗=0 𝜃𝑗+𝑘
3. Korelaciona funkcija linearnog procesa je: 𝜌𝑘 =𝛾𝑘
𝛾0=
𝜎2 ∑ 𝜃𝑗∞𝑗=0 𝜃𝑗+𝑘
∑ 𝜃∞𝑗=0 𝑗
2
Ako su momenti prvog i drugog reda konačni, odnosno važi µ𝑡 ≡ µ = 𝑐𝑜𝑛𝑠𝑡. i zadovoljava
uslov stacionarnosti, ∑ 𝜃𝑗2 < ∞∞
𝑗=0 , tada kovarijansna funkcija zavisi samo od 𝑘, pa je linearni
proces slabo stacionaran.
Uz uslov µ𝑡 ≡ µ = 𝑐𝑜𝑛𝑠𝑡 onda linearni proces ekvivalentno može da se zapiše u obliku:
𝑋𝑡− µ𝑡 = 𝑋𝑡∗ ∑ 𝜃𝑗ɛ𝑡−𝑗
∞
𝑗=0
gde je 𝐸(𝑋𝑡∗) = 0.
Prema Woldov-oj teoremi razlaganja, koji je dokazao da je klasa linearnih procesa dovoljno
opšta da obuhvati sve slabo stacionarne vremenske serije, proces 𝑋𝑡, 𝑡 ∈ T može da se
Master rad Tanja Armenski
31
predstavi kao zbir dva međusobno nekorelirana procesa, jednog čisto determinističkog i jednog
nedeterminističkog.
Teorema (Woldova dekompozicija) Stohastička komponenta slabo stacionarne vremenske serije
𝑋𝑡, 𝑡 ∈ T može da se predstavi u formi linearnog procesa oblika:
𝑋𝑡 = ψ𝑡 + ∑ 𝑋𝑡ɛ𝑡−𝑗
∞
𝑗=1
gde su:
ψ𝑡 deterministička komponenta
ɛ𝑡, 𝑡 ∈ T proces belog šuma
∑ 𝑋𝑗2∞
𝑗=1 < ∞, 𝑋0 = 1
𝐸(ɛ𝑡, 𝑉𝑡) = 0
Definicija Linearan proces 𝑋𝑡, 𝑡 ∈ T za koji važi 𝐸( 𝑋𝑡) = 𝜇,⩝ 𝑡 ∊ 𝑇 da je je invertibilan ako
postoje takvi da je:
ɛ𝑡 = ∑ 𝜙𝑗(𝑋𝑡−𝑗
∞
𝑗=0
− 𝜇) = ∑ 𝜙𝑗𝑋∗𝑡−𝑗
∞
𝑗=0
gde je ∑ |𝜙𝑗|∞𝑗=0 < ∞. Linearna vremenska serija je jedna realizacija linearnog stohastičkog
procesa.
Na osnovu linernih procesa mogu da se definišu tri posebne klase procesa sa konačnim brojem
parametara za aproksimiranje slučajnih procesa kojima se bavimo u ovom radu:
1. Autoregresivni procesi reda 𝑝 (𝐴𝑅(𝑝))
2. Proces pokretnih proseka reda 𝑞 (𝑀𝐴(𝑞))
3. Proces 𝐴𝑅𝑀𝐴(𝑝, 𝑞) je kombinacija 𝐴𝑅(𝑝) i 𝑀𝐴(𝑞)
Master rad Tanja Armenski
32
5.2. Operatori u analizi vremenskih serija
U analizi vremenskih serija često se koristi operator docnje u oznaci 𝐵 (backshift). Neka je dat
proizvoljan proces 𝑋𝑡, 𝑡 ∊ 𝑇, operator 𝐵 transformiše proces iz sadašnjeg vremenskog
trenutka u isti proces u prethodnom vremenskom trenutku.
U opštem zapisu:
𝐵𝑋𝑡 = 𝑋𝑡−1
Dalje za proces 𝑋𝑡, 𝑡 ∊ 𝑇 važi:
𝑋𝑡−2 = 𝐵𝑋𝑡−1 = 𝐵𝐵𝑋𝑡 = 𝐵2𝑋𝑡
𝑋𝑡−3 = 𝐵𝑋𝑡−2 = 𝐵𝐵2𝑋𝑡 = 𝐵3𝑋𝑡
...
𝑋𝑡−𝑗 = 𝐵𝑋𝑡−(𝑗−1) = 𝐵𝐵𝑗−1𝑋𝑡 = 𝐵𝑗𝑋𝑡
Linearan proces može da se preko operatora docnje (𝐵) predstavi u obliku:
𝑋𝑡 = ∑ 𝜃𝑗
∞
𝑗=0
𝐵𝑗ɛ𝑡 = 𝜃(𝐵)ɛ𝑡
Ako je proces i invertibilan tada se koristeći operator 𝐵 dobija :
ɛ𝑡 = ∑ 𝜙𝑗
∞
𝑗=0
𝑋𝑡−𝑗 = ∑ 𝜙𝑗
∞
𝑗=0
𝐵𝑋𝑡 = 𝜙(𝐵)𝑋𝑡
Još jedan od operatora koji se često koristi u analizi vremenskih serija je operator diferenciranja
(∇). Operacija diferenciranja se vrši da bi se stabilizovala srednja vrednost vremenske serije (𝜇𝑡)
i time otklonila nestacionarnost vremenske serije, kalkulacijom odstupanja vrednosti vremenske
serije u trenutku 𝑡 od vrednosti iste serije u trenutku 𝑡 − 𝑘. Za diferencni operator prvog reda
važi:
∇𝑋𝑡 = 𝑋𝑡 − 𝑋𝑡−1 = 𝑋𝑡 − 𝐵𝑋𝑡 = (1 − 𝐵)𝑋𝑡,
a drugog reda:
𝛻2𝑋𝑡 = 𝛻(𝛻𝑋𝑡) = 𝛻(𝑋𝑡 − 𝑋𝑡−1) = (𝑋𝑡 − 𝑋𝑡−1) − (𝑋𝑡−1 − 𝑋𝑡−2)
= (𝑋𝑡 − 2𝑋𝑡−1 + 𝑋𝑡−2) = 𝑋𝑡 − 2𝐵𝑋𝑡 + 𝐵2𝑋𝑡
= (1 − 2𝐵 + 𝐵2)𝑋𝑡 = (1 − 𝐵)2𝑋𝑡
Master rad Tanja Armenski
33
odnosno u opštem slučaju diferencni operator 𝑑 −tog reda važi:
𝛻𝑑𝑋𝑡 = 𝛻(𝛻𝑑−1) 𝑋𝑡 =. . . = (1 − 𝐵)𝑑𝑋𝑡
U analizi vremenskih serija od posebnog značaja je operator sezonske diference kod kojeg je
vrednost d jednaka broju perioda sezona (𝑠) u vremenskim podacima. Na primer, u vremenskoj
seriji sa mesečnim podacima postoji 12 perioda sezona i stoga važi 𝑑 = 12, važi:
𝛻12𝑋𝑡 = (1 − B)12𝑋𝑡 = 𝑋𝑡 − 𝑋𝑡−12.
5.3. Autoregresivni procesi 𝑨𝑹(𝒑)
Autoregresivni proces 𝐴𝑅(𝑝) impicira regresiju na sopstvene vrednosti, gde je zavisna
promenljiva član vremenske serije u trenutku 𝑡, a skup nezavisnih promenljivih članovi iste
vremenske serje u trenucima 𝑡 − 1, 𝑡 − 2, . . . , 𝑡 − 𝑝.
Definicija: 𝑋𝑡, 𝑡 ∈ T je autoregresivan proces reda 𝑝, ako može da se predstavi u obliku:
𝑋𝑡 = µ + ∑ 𝜙𝑗𝑋𝑡−𝑗 + ɛ𝑡
𝑝
𝑗=1
gde je µ konstanta, ɛ𝑡, 𝑡 ∈ T proces belog šuma i 𝜙𝑗 nepoznati parameter 𝐴𝑅(𝑝).
Znači da je tekuća vrednost procesa linearna kombinacija 𝑝 sopstvenih prošlih vrednosti i
vrednosti slučajnih poremećaja. Kako je ∑ |𝜙𝑗 < ∞|𝑝𝑗=1 proces je uvek invertibilan. Koristeći 𝐵
operator 𝐴𝑅 (𝑝) u kraćem zapisu glasi:
𝜙(𝐵)𝑋𝑡 = ɛ𝑡
gde je 𝜙(𝐵) = 1 − 𝜙1𝐵 − 𝜙2𝐵2 − ⋯ − 𝜙𝑝𝐵𝑝 karakteristični polinom 𝐴𝑅(𝑝) procesa.
Jednačina 𝜙(z) = 0, z ∈ ℂ je karakteristična jednačina 𝐴𝑅(𝑝) procesa. Rešenja karakteristične
jednačine su karakteristični koreni 𝐴𝑅(𝑝) procesa.
Master rad Tanja Armenski
34
Ako je dat 𝐴𝑅(1) proces, zamenom 𝑝 = 1 u izrazu opšteg 𝐴𝑅(𝑝) procesa tada važi:
𝑋𝑡 = 𝜙1𝑋𝑡−1 + ɛ𝑡
Odnosno u zapisu sa operatorom docnje (𝐵) važi:
(1 − 𝜙1𝐵)𝑦𝑡 = ɛ𝑡, odatle dobijamo:
𝑋𝑡 = (1 − 𝜙1𝐵)−1ɛ𝑡 = (1 − 𝜙1𝐵 + 𝜙12𝐵2 + ⋯ )ɛ𝑡 = ɛ𝑡 + 𝜙1ɛ𝑡−1 + 𝜙1
2ɛ𝑡−2 + ⋯
Odnosno uz zadovoljen uslov stacionarnosti |𝜙1| < 1 u opštem zapisu važi:
(1 − 𝜙1𝐵)−1 =1
1 − 𝜙𝐵= ∑(𝜙𝐵)𝑖
∞
𝑖=1
Onda je karakteristična jednačina AR (1) procesa 1 − 𝜙𝑧 = 0, a njen karakteristični koren:
𝑧 =1
𝜙= 𝜙−1
Kako je |𝑧| =1
|𝜙| u slučaju kada je |𝜙| < 1 onda je |𝑧| > 1 odnosno važi: |𝜙| < 1 ⇔ |𝑧| > 1.
Ako za svako z𝑖 ∈ ℂ važi |𝑧𝑖| < 1, 𝑖 = 1,2, . . . , 𝑝 onda je 𝐴𝑅(𝑝) proces slabo stacionaran.
Odnosno, na osnovu prethodnog iskaza proizilazi da je 𝐴𝑅(𝑝) proces slabo stacionaran ako je
|𝜙𝑖| < 1, za svako 𝑖 = 1,2, . . . , 𝑝 . U tom slučaju kada je 𝐴𝑅 (𝑝) proces slabo stacionaran mogu
se odrediti:
1. 𝐸(𝑋) = 𝐸(𝑋𝑡−𝑝) =1
1−∑ 𝜙𝑗𝑝𝑗=1
2. 𝛾𝑘 = 𝐶𝑜𝑣 (𝑋𝑡, 𝑋𝑡−𝑘) = ∑ 𝜙𝑖𝛾𝑘−𝑖𝑝𝑖=0 +
𝜎2, 𝑘 = 00, 𝑘 ≠ 0
3. 𝑉𝑎𝑟 (𝑋𝑡) = 𝛾0 =𝜎2
1−𝜙1𝜌1−⋯−𝜙𝑝𝜌𝑝 , za k=0 i k>0
4. 𝛾𝑘 = 𝜙1𝛾𝑘−1 + 𝜙2𝛾𝑘−2 + ⋯ + 𝜙𝑝𝛾𝑘−𝑝, ako k>0:
5. 𝜌𝑘 =𝛾𝑘
𝛾0= 𝜙1𝜌𝑘−1 + 𝜙2𝜌𝑘−2 + ⋯ + 𝜙𝑝𝜌𝑘−𝑝 , ako k>0
Master rad Tanja Armenski
35
Prvih 𝑝 jednačina rekurzivne relacije od 𝜌 glase:
𝜌1 = 𝜙1 + 𝜌1𝜙2 + ⋯ + 𝜌𝑝−1𝜙𝑝
𝜌2 = 𝜌1𝜙1 + ⋯ 𝜙2 + ⋯ + 𝜌𝑝−2𝜙𝑝
...
𝜌𝑝 = 𝜌𝑝−1𝜙1 + ⋯ 𝜌𝑝−2𝜙2 + ⋯ + 𝜙𝑝
i nazivaju se Yule-Walker-ove jednačine na osnovu kojih se uspostavlja relacija između 𝐴𝑅(𝑝)
procesa i 𝑝 autokorelacionih koeficijenata. Ukoliko se sistem jednačina koji određuju
kovarijansu i korelaciju autoregresivnog procesa zapišu u matričnom obliku dobija se:
𝑝 = 𝑃𝜙
gde su 𝑝′ = [𝑝1, 𝑝2, … , 𝑝𝑝] , 𝜙′ = [𝜙1, 𝜙2, … , 𝜙𝑝] i 𝑃 autokorelaciona matrica. Rešavanjem
matrične jednačine dobija se 𝜙 = 𝑃−1𝑝.
Ponašanje autokorelacione funkcije može se ispitati na osnovu rešenja diferentne jednačine po
𝜌𝑘 koja u opštem obliku glasi:
𝜌𝑘 = 𝐴1(𝑧1−1)𝑘+...+𝐴𝑝(𝑧𝑝
−1)𝑘
gde su 𝐴𝑗 konstante čije vrednosti zavise od početnih vrednosti 𝜌, a 𝑧1−1 je 𝑖-ti koren
karakteristične jednačine 𝑖 = 1, 2, . . . 𝑝 za [𝑧𝑖] < 1 ispunjava uslov stacionarnosti procesa.
U praktičnom modelovanju za reprezentaciju 𝐴𝑅(1) karakteristične jednačine, zamenom 𝑝 =
1 u izrazu opšteg 𝐴𝑅(𝑝) procesa, 𝑋𝑡 = 𝜙1𝑋𝑡−1+ ɛ𝑡, rešenjem diference jednačine
autokorelaciona funkcija(𝜌𝑘) sledi:
𝜌𝑘 = 𝜙1𝜌𝑘−1 = 𝜙12𝜌𝑘−2 = 𝜙1
𝑘−1𝜌1 = 𝜙1𝑘−1𝜌0 = 𝜙𝑘 za 𝑘 = 0,1,2, . ..
ako je 𝜙 > 0 vrednosti autokorelacione funkcije opadaju po eksponencijalnog krivi ka nuli, dok
za 𝜙 < 0 vrednosti autokorelacione funkcije alterniraju, opadaju ka nuli, odnosno predstavljaju
kombinaciju dve eksponencijalne krive. U oba slučaja opadanje je sporije ukoliko je 𝜙1 blisko
granicama nestacionarnosti: +1 ili -1.
Master rad Tanja Armenski
36
U slučaju AR reprezentacije drugog reda 𝐴𝑅(2), zamenom 𝑝 = 2 u izrazu opšteg 𝐴𝑅(𝑝)
procesa, karakteristična jednačina glasi 𝑋𝑡 = 𝜙1𝑋𝑡−1 + 𝜙2𝑋𝑡−2+ ɛ𝑡, odnosno u zapisu preko
operatora 𝐵 dobija se kvadratna jednačina:
(1 − 𝜙1𝐵 − 𝜙2𝐵2)𝑋𝑡 = ɛ𝑡
za koju rešavanjem 𝜌𝑘 = 𝜙1𝜌𝑘−1 + 𝜙2𝜌𝑘−2, 𝑘 ≥ 1 za 𝑘 = 1 i 𝑘 = 2 i uz uslove stacionarnosti
procesa drugog reda (𝜙1 + 𝜙2 < 1; 𝜙2 − 𝜙1 < 1; −1 < 𝜙2 < 1 ) dobijamo:
𝜌1 =𝜙1
1−𝜙2, 𝜌2 =
𝜙12
1−𝜙1+ 𝜙2
a preostale autokorelacijione funkcije dobijamo korišćenjem rekurzivne relacije Yule-Walker
jednačina. Kada su rešenja karakteristične jednačine realne funkcije (𝑧𝑖 realni broj, tada
𝐴𝑖(𝑧𝑖−1)𝑘 → 0 𝑘𝑎𝑑𝑎 𝑘 → ∞), tada su autokorelacione funkcije kombinacija dve prigušene
eksponencijalne krive, a za kompleksna rešenja (𝑧𝑖 , 𝑧𝑗) autokorelacione funkcije slede putanju
prigušene sinusne funkcije čija se amplituda smanjuje tokom vremena. Ponašanje korelacione
funkcije zavisi od karakterističnih korena i u oba slučaja kada se ona približava ka nuli njeno
ponašanje može da se okarakteriše kao lagano odumiranje ka nuli (Grafik 1 i 2).
5.3.1. Parcijalna autokorelacijona funkcija
U statistici je čest slučaj da je korelacija između dve promenljive u stvari rezultat njihove
koreliranosti sa trećom promenljivom u modelu. Zbog toga se uvodi pojam parcijalne korelacije
koja predstavlja korelaciju između dve promenljive uz eliminisan uticaj drugih promenljivih iz
modela.
U analizi vremenskih serija deo korelacije između 𝑋𝑡 i 𝑋𝑡−𝑘 može se prepisati njihovoj
korelaciji sa vrednostima serije na docnjama između vremenskih trenutaka 𝑡 i 𝑡 − 𝑘. Po
definiciji parcijalni koeficijent korelacije između 𝑋𝑡 i 𝑋𝑡−𝑘, u oznaci 𝜙𝑘𝑘 je 𝑘-ti regresioni
koeficijent u autoregresivnom procesu reda 𝑝 = 𝑘:
𝑋𝑡 = 𝜙𝑘1𝑋𝑡−1 + 𝜙𝑘2𝑋𝑡−2 + ⋯ + 𝜙𝑘𝑘𝑋𝑡−𝑘 + ɛ𝑡
Master rad Tanja Armenski
37
Ovaj model može da se predstavi u obliku Yule-Walkers-ovog sistema, tada se zapisuje:
[
𝜌1
⋮𝜌𝑘
] = [1 ⋯ 𝜌𝑘−1
⋮ ⋱ ⋮𝜌𝑘−1 ⋯ 1
] [𝜙𝑘1
⋮𝜙𝑘𝑘
]
a pomoću Kramerovog pravila može da se odredi 𝑘-ti parcijalni korelacioni koeficijent (Rajter-
Ćirić, 2009). Međutim, da bi se skratio postupak rešavanja pomoću Kramerovih jednačina,
Durbin je predložio efikasan metod za dobijanje rešenja sistema, a time i za dobijanje uzoračke
parcijalne korelacione funkcije. Durbin-ova rekurzivna formula je:
𝜙𝑘𝑘 =𝜌𝑘−∑ 𝜙𝑘−1,𝑗 𝜌𝑘−𝑗
𝑘−1𝑗=1
1−∑ 𝜙𝑘−1,𝑗𝜌𝑗𝑘−1𝑗=1
, 𝜙𝑘𝑗 = 𝜙𝑘−1,𝑗 − 𝜙𝑘𝑘𝜙𝑘−1,𝑘−𝑗, 𝑗 = 1, 2, . . . , 𝑘 − 1.
Parcijalne autokorelacije za koeficijente definisanih AR procesa glase (Grafici 1 i 2):
𝐴𝑅(1): 𝜙11=𝜌1=𝜙1, za 𝜙𝑘𝑘 = 0, za 𝑘 > 1
𝐴𝑅(2): 𝜙11 = 𝜌1 =𝜙1
1−𝜙2 , 𝜙22 =
𝜌2−𝜌12
1−𝜌12 = 𝜙2, za 𝜙𝑘𝑘 = 0, za 𝑘 > 2
𝐴𝑅(𝑝): 𝜙11=𝜌1, 𝜙22≠ 0,...., 𝜙𝑝𝑝≠ 0 za 𝜙𝑘𝑘 = 0, za 𝑘 > 𝑝.
Grafik 1. Autokorelacija i parcijalna autokorelacija prvog reda 𝐴𝑅(1)
Master rad Tanja Armenski
38
Grafik 2. Autokorelacija i parcijalna autokorelacija drugog reda 𝐴𝑅(2)
Ukoliko se oceni 𝑝 + 𝑚 parcijalnih korelacija, za 𝑚 > 0, √𝑛𝑘𝑘 će biti asimptotski normalno
raspoređeni parametri 𝑁(0,1), stoga se ±1.96/√𝑛 može koristiti kao 95% interval poverenja
populacionih parcijalnih autokorelacija. Pored toga, kako su parametri √𝑛𝑘𝑘 nekorelirani, u
velikim uzorcima će 𝑛 ∑ 𝑝+𝑗,𝑝+𝑗2𝑚
𝑗=1 imati asimptotsku 𝜒2 raspodelu sa 𝑚 stepeni slobode.
5.4. Procesi pokretnih proseka 𝑴𝑨 (𝒒)
Definicija: 𝑋𝑡, 𝑡 ∈ T je proces pokretnih proseka reda 𝑞, ako je
𝑋𝑡 = µ + ɛ𝑡 − ∑ 𝜃𝑗ɛ𝑡−𝑗
𝑞
𝑗=1
gde je µ konstanta, ɛ𝑡, 𝑡 ∈ T proces belog šuma i 𝜃𝑗 nepoznati parameter 𝑀𝐴(𝑞). U kraćem
zapisu:
𝑋𝑡 = 𝜃(𝐵)ɛ𝑡, za 𝜃(𝐵) = 1 − 𝜃1𝐵 − 𝜃2𝐵2 − ⋯ − 𝜃𝑞𝐵𝑞,
gde je 𝜃(𝐵) karakteristični polinom, a je 𝜃(z)=0, z ∈ ℂ je karakteristična jednačina 𝑀𝐴(𝑞)
procesa. Proces pokretnih proseka je koristan u modelovanju pojava kod kojih događaji
Master rad Tanja Armenski
39
uzrokuju kratkoročne efekte. Proces pokretnih proseka reda q je linearni proces sa konačnim
očekivanjem i konačnim brojem parametara sa osobinama:
1. 𝐸(𝑋𝑡) = µ
2. Var(𝑋𝑡) = 𝜎2(1 + 𝜃12 + ⋯ + 𝜃𝑞
2)
3. 𝛾0 = 𝜎2(1 + 𝜃12 + ⋯ + 𝜃𝑞
2)
4. 𝛾𝑘 = 0, 𝑘 > 𝑞
𝜎2 ∑ 𝜃𝑗𝜃𝑗+𝑘 ,1 ≤ 𝑘 ≤ 𝑞𝑞−𝑘𝑗=0
5. 𝜌𝑘 =𝛾𝑘
𝛾0
0, 𝑘 > 𝑞
∑ 𝜃𝑗𝜃𝑗+𝑘 𝑞−𝑘𝑗=0
∑ 𝜃𝑗2𝑞−𝑘
𝑗=0
, 1 ≤ 𝑘 ≤ 𝑞
Kako iz definicije pokretnih proseka važi, 𝐸(𝑋𝑡) < ∞ i Var(𝑋𝑡) < ∞ konačni proces pokretnih
proseka reda 𝑞 će uvek biti slabo stacionaran. Ukoliko je 𝑀𝐴(𝑞) proces invertibilan tada se
kaže da on ima 𝐴𝑅(𝑝) reprezentaciju: 𝜃(𝐵) = 𝜙(𝐵)−1.
Na osnovu ponašanja parcijalnih autokorelacija prvog i drugog reda 𝑀𝐴(1) i 𝑀𝐴(2) procesa
(Grafici 2. i 3.) može se sagledati ponašanje parcijalne autokorelacione funkcije opšteg procesa
MA reda 𝑞.
Grafik 3. Autokorelacija i parcijalna autokorelacija prvog reda 𝑀𝐴(1)
Master rad Tanja Armenski
40
Grafik 4. Autokorelacija i parcijalna autokorelacija drugog reda 𝑀𝐴(2)
Za proces 𝑀𝐴(1) prvog reda 𝑋𝑡 = (1 − 𝜃1𝐵)ɛ𝑡 važi, 𝜌𝑘 =−𝜃1
1+𝜃12 , 𝜌𝑘 = 0, 𝑘 > 1 odatle sledi da
je tekuća vrednost procesa korelirana samo sa prethodnom i narednom vrednošću što sugeriše
kratku memoriju procesa. Za 𝑀𝐴(1) proces vrednosti autokorelacione funkcije su ograničeni -
0.5 < 𝜌𝑘 < 0.5 za svako 𝑘 i vrednosti koeficijenata 𝜃1 i 1
𝜃1 imaju istu autokorelacinu funkciju.
Parcijalna autokorelacija se određuje Durbinovom rekurzivnm formulom koja za 𝑀𝐴(1) proces
prvog reda glasi:
𝜙𝑘𝑘 =−𝜃1
𝑘(1 − 𝜃12)
1 − 𝜃12(𝑘+1)
, 𝑘 ≥ 1
Nasuprot autokorelacionoj funkciji koja se prekida posle prve docnje, parcijalna
autokorelaciona funkcija za 𝑀𝐴(1) lagano odumire na dva načina u zavisnosti od predznaka θ1,
odnosno predznaka 𝜌1. Ako je vrednost 𝜃1 negativnog podznaka, vrednost parcijalne korelacije
na prvoj docnji je pozitivna da bi zatim alternirala. U suprotnom opada uzimajući samo
negativne vrednosti. Iz parcijalnog korelograma može se takođe uočiti da je |𝜙𝑘𝑘| < 0.5.
Za proces 𝑀𝐴(2) drugog reda 𝑋𝑡 = (1 − 𝜃1𝐵 − 𝜃2𝐵2)ɛ𝑡, važi:
𝜌1 =−𝜃1(1−𝜃2)
1+𝜃12+𝜃2
2 , 𝜌2 =−𝜃2
1+𝜃12+𝜃2
2 , 𝜌𝑘 = 0, 𝑘 > 2
Master rad Tanja Armenski
41
Model implicira da su opservacije međusobno nekorelirane ako su udaljene više od dva perioda
jedna od druge. 𝑀𝐴(2) proces je stacionaran, a da bi bio invertibilan mora da ispunjava uslove
koji su analogni uslovima stacionarnosti 𝐴𝑅(2) procesa (𝜃1 + 𝜃2 < 1; 𝜃2 − 𝜃1 < 1; −1 <
𝜃2 < 1 ). Korišćenjem izraza za 𝑀𝐴(2) i osobina 𝜌𝑘 = 0, 𝑧𝑎 𝑘 > 2 parcijalne autokorelacije
koeficijenata glase:
𝜙11 = 𝜌1, 𝜙22 =𝜌2 − 𝜌1
2
1 − 𝜌12 , 𝜙33 =
𝜌13 − 𝜌1𝜌2(2 − 𝜌2)
1 − 𝜌22 − 2𝜌1
2(1 − 𝜌2) , . ..
Vrednosti ovih funkcija eksponencijalno opadaju ili osciliraju sledeći prigušenu sinusoidu u
zavisnosti od predzaka i veličina koeficijenata 𝜃1 i 𝜃2.
5.5. Autoregresivni procesi pokretnih proseka 𝑨𝑹𝑴𝑨 (𝒑, 𝒒)
Definicija: Proces 𝑋𝑡, 𝑡 ∈ T je mešoviti autoregresivni proces pokretnih proseka, u notaciji
𝐴𝑅𝑀𝐴(𝑝, 𝑞), ako može da se predstavi kao:
𝑋𝑡 = ∑ 𝜙𝑗
𝑝
𝑗=1𝑋𝑡−𝑗 + ɛ𝑡 − ∑ 𝜃𝑖ɛ𝑡−𝑖
𝑞
𝑖=1
odnosno u skraćenoj ekvivalentnoj formi preko operatora docnje (B):
𝑋𝑡 − 𝜙1𝑋𝑡−1 − ⋯ − 𝜙𝑝𝑋𝑡−𝑝=ɛ𝑡−𝜃1ɛ𝑡−1 − ⋯ − 𝜃𝑞ɛ𝑡−𝑞
𝑋𝑡(1 − 𝜙1𝐵 − ⋯ − 𝜙𝑝𝐵𝑝)=(1 − 𝜃1𝐵 − ⋯ − 𝜃𝑞𝐵𝑞)ɛ𝑡
gde su: 𝜙(𝐵) = (1 − 𝜙1𝐵 − ⋯ − 𝜙𝑝𝐵𝑝) AR karakteristični polinom 𝐴𝑅𝑀𝐴(𝑝, 𝑞) procesa i
𝜃(𝐵) = (1 − 𝜃1𝐵 − ⋯ − 𝜃𝑞𝐵𝑞) MA karakteristični polinom 𝐴𝑅𝑀𝐴(𝑝, 𝑞) procesa.
Stoga važi:
𝜙(𝐵)𝑋𝑡 = 𝜃(𝐵)ɛ𝑡
Pošto je proces pokretnih sredina konačnog reda uvek stacionaran i autoregresivni proces
konačnog reda uvek invertibilan onda važi sledeće:
Master rad Tanja Armenski
42
𝐴𝑅𝑀𝐴(𝑝, 𝑞) proces je stacionaran ako AR komponenta ispunjava uslove stacionarnosti
za svako 𝑧 ∈ ℂ za koje je 𝜙(z)= 0 važi |z| > 1. Tada process može da se predstavi
𝑋𝑡 =𝜃(𝐵)
𝜙(𝐵)ɛ𝑡 = 𝜓(𝐵) ɛ𝑡, što je 𝑀𝐴(∞) representacija procesa.
𝐴𝑅𝑀𝐴(𝑝, 𝑞) proces je invertibilan ako MA komponenta ispunjava uslove invertibilnosti
za svako 𝑧 ∈ ℂ za koje je 𝜃(𝑧) = 0 važi |z| > 1. Tada proces može da se predstavi kao
ɛ𝑡 =𝜃(𝐵)
𝜙(𝐵)𝑋𝑡 = 𝜋(𝐵)𝑋𝑡, što je 𝐴𝑅(∞) representacija procesa.
Autokovarijansna i autokorelaciona funkcija 𝐴𝑅𝐼𝑀𝐴 (𝑝, 𝑞) procesa može se odrediti po
sledećem obrascu:
𝑋𝑡 = ∑ 𝜙𝑗𝑝𝑗=1 𝑋𝑡−𝑗 + ɛ𝑡 − ∑ 𝜃𝑖ɛ𝑡−𝑖
𝑞𝑖=1 /𝑋𝑡−𝑘/ 𝐸⇒
𝛾𝑘 = 𝜙1𝛾𝑘−1+. . . +𝜙𝑝𝛾𝑘−𝑝 + 𝐸(ɛ𝑡, 𝑋𝑡−𝑘) − 𝜃1𝐸(ɛ𝑡−1, 𝑋𝑡−𝑘)−. . . 𝜃𝑞𝐸(ɛ𝑡−𝑞 , 𝑋𝑡−𝑘).
Kako je 𝐸(ɛ𝑡−𝑖, 𝑋𝑡−𝑘) = 0 za 𝑘 > 𝑖 onda je:
𝛾𝑘 = 𝜙1𝛾𝑘−1 + 𝜙2𝛾𝑘−2 + ⋯ + 𝜙𝑝𝛾𝑘−𝑝, ako 𝑘 ≥ 𝑞 + 1
𝜌𝑘 = 𝜙1𝜌𝑘−1 + 𝜙2𝜌𝑘−2 + ⋯ + 𝜙𝑝𝜌𝑘−𝑝 , ako 𝑘 ≥ 𝑞 + 1
Autokorelaciona funkcija 𝐴𝑅𝐼𝑀𝐴 (𝑝, 𝑞) lagano odumire ka nuli, kao i parcijalna korelaciona
funkcija.
Master rad Tanja Armenski
43
6. Modeli nestacionarnih vremenskih serija
6.1. Tipovi nestacionarnih vremenskih serija
Mnoge ekonomske vremenske serije pokazuju neki oblik nestacionarnosti. Ovakvi procesi se
modeluju klasom nestacionarnih integrisanih procesa 𝐴𝑅𝐼𝑀𝐴 (𝑝, 𝑑, 𝑞) kod kojih se
stacionarnost postiže odgovarajućim transformacijama. Izbor transformacije zavisi od uzroka
nestacionarnosti serije koji može biti deterministički ili stohastički.
Procesi kod kojih se stacionarnost postiže uklanjanjem determinističke komponente nazivaju se
trend stacionarni procesi. Primera radi ako je 𝑌𝑡 = 𝐷𝑡 + 𝑍𝑡 proces, gde je 𝐷𝑡 deterministička
komponenta, a 𝑍𝑡 stohastička komponenta tada se serija stacionira oduzimanjem
determinističke komponente koja se predstavlja determinističkom funkcijom vremena (𝐷𝑡 =
𝛽1 + 𝛽2𝑡):
𝑌𝑡 = 𝛽1 + 𝛽2𝑡 + 𝑍𝑡/ −(𝛽1 + 𝛽2𝑡)
i tada se dobija 𝑌𝑡∗ = 𝑍𝑡 stacionarna vremenska serija.
Procesi kod kojih se stacionarnost postiže diferenciranjem (∇) nazivaju se diferencno
stacionarni procesi. Nestacionarnost ovih procesa uzrokovana je nestacionarnošću stohastičke
komponente koja se definiše preko slučajnog hoda. Vremensku seriju koja sadrži slučajan hod
karakterišu neizmenični periodi rastućeg i opadajućeg trenda, gde se trend menja iznenada i
promena je nepredvidiva. Pošto varijansa raste tokom vremena, slučajan hod je nestacionaran
proces koji se diferenciranjem (∇) svodi na stacionaran proces.
Definicija: 𝑍𝑎 𝑋𝑡, 𝑡 ∈ T proces je proces slučajnog hoda, ako važi:
𝑋𝑡 = 𝑋𝑡−1 + ɛ𝑡,
gde je ɛ𝑡, 𝑡 ∈ T proces belog šuma. Oduzimanjem 𝑋𝑡−1 sa obe strane jednakosti:
𝑋𝑡 = 𝑋𝑡−1 + ɛ𝑡 /−𝑋𝑡−1
Master rad Tanja Armenski
44
dobija se stacionaran proces 𝛻𝑋𝑡 = ɛ𝑡. Nekada je potrebno više puta diferencirati proces da bi
se postigla stacionarnost.
6.2. Autoregresivni integrisani procesi pokretnih proseka 𝑨𝑹𝑰𝑴𝑨 (𝒑, 𝒅, 𝒒)
Definicija: Proces 𝑋𝑡, 𝑡 ∈ T je integrisan proces reda 𝑑, u notaciji 𝐼(𝑑), ako
𝛻𝑑𝑋 = (1 − 𝐵)𝑑𝑋𝑡 = 𝑋𝑡 − 𝑑𝑋𝑡−1 +𝑑(𝑑 − 1)
2𝑋𝑡−2−. . . +(−1)𝑑𝑋𝑡−𝑑 = ɛ𝑡
gde ɛ𝑡 (0, 𝜎2) predstavlja proces belog šuma.
Definicija: Proces 𝑋𝑡, 𝑡 ∈ T je 𝐴𝑅𝐼𝑀𝐴 (𝑝, 𝑑, 𝑞) proces ako:
𝜙(𝐵)(1 − 𝐵)𝑑𝑋𝑡 = 𝜃(B) ɛ𝑡 ⇔ 𝜙(𝐵)∇𝑑𝑋𝑡 = 𝜃(𝐵)ɛ𝑡, 𝑑 ≥ 0
gde su 𝛻𝑑 diferencni operater reda 𝑑, 𝜙(𝐵) karakteristični polinom 𝐴𝑅(𝑝) procesa, 𝜃(B)
karakteristični polinom 𝑀𝐴(𝑞) procesa, ɛ𝑡, 𝑡 ∈ T proces belog šuma sa ɛ𝑡 (0, 𝜎2) normalnom
raspodelom.
Ukoliko je serija stacionarna, nema potrebe za njenim diferenciranjem i kao takva može da se
modeluje 𝐴𝑅𝑀𝐴(𝑝, 𝑞) procesima. Karakteristična autokorelaciona funkcija 𝐴𝑅𝐼𝑀𝐴 (𝑝, 𝑑, 𝑞)
procesa, kao i kod 𝐴𝑅𝑀𝐴 (𝑝, 𝑞) procesa, veoma sporo opada ka nuli. Parcijalna autokorelaciona
funkcija je samo na prvoj docnji različita od nule i bliska jedinica, a na višim docnjama opada
ka nuli.
𝐴𝑅𝐼𝑀𝐴 (𝑝, 𝑑, 𝑞) proces ima nekoliko nedostataka. Prvo, kratkoročnost memorije modela, jer
korelacije između udaljenih opservacija vremenskim horizontom nisu specifikovane ovim
modelom. Drugo, 𝐴𝑅𝐼𝑀𝐴 (𝑝, 𝑑, 𝑞) ne “prepoznaje“ sezonske obraske i nekarakteristične
opservacije u vremenskoj seriji (Hassler i sar., 2013). U praksi se ovi nedostaci modela
prevazilaze uvođenjem regresora u model (Harvey, 1993). Primera radi, mesečni sezonski
obrasci u vremenskoj seriji se mogu specifikovati uključivanjem binarnih regresora u model u
obliku:
Master rad Tanja Armenski
45
𝐷𝑗𝑡 = 1 𝑎𝑘𝑜 𝑡 = 𝑗0 𝑎𝑘𝑜 𝑡 ≠ 𝑗
Za vremenske serije sa mesečnim podacima 𝑗 = 1, 2, . . . , 12.
6.3. Sezonski autoregresivni integrisani procesi pokretnih proseka
𝑺𝑨𝑹𝑰𝑴𝑨 (𝒑, 𝒅, 𝒒) (𝑷, 𝑫, 𝑸)𝒔
Definicija: Proces 𝑋𝑡, 𝑡 ∈ T je 𝑆𝐴𝑅𝐼𝑀𝐴 (𝑝, 𝑑, 𝑞) (𝑃, 𝐷, 𝑄)𝑠 proces ako:
𝜙(𝐵)𝛷(𝐵𝑠)(1 − 𝐵)𝑑(1 − 𝐵𝑠)𝐷𝑋𝑡 = 𝜃(B)Θ(𝐵𝑠)ɛ𝑡, 𝑑, 𝐷 ≥ 0
gde su 𝜙(𝐵) i 𝜃(𝐵) regularni polinomi 𝐴𝑅(𝑝) i 𝑀𝐴(𝑞) procesa, a 𝛷(𝐵𝑠) i Θ(𝐵𝑠) sezonski
autoregresivni polinomi i polinomi pokretnih proseka za koje važi:
𝛷(𝐵𝑠) = 1 − 𝛷1𝐵𝑠 − ⋯ − 𝛷𝑝𝐵𝑃𝑠
𝛩(𝐵𝑠) = 1 − 𝛩1𝐵𝑠 − ⋯ − 𝛩𝑞𝐵𝑄𝑠
Model 𝑆𝐴𝑅𝐼𝑀𝐴 (0,1,1)(0,1,1)12 poznat je pod nazivom “vazduhoplovni model”, jer su ga Box
i Jenkins (1976) koristili za analizu vremenske serije broja putnika u vazdušnom saobraćaju.
Invertabilnost ovog modela zahteva ispunjenje uslova |𝜃1|< 1 i |𝛩1|< 1.
Ako diferencne operatore ∇∇𝑠= (1 − 𝐵)(1 − 𝐵𝑠) označimo sa 𝑊𝑡 , tada se model može
zapisati kao:
𝑊𝑡 = (1 − 𝐵 − 𝐵𝑠 − 𝐵𝑠+1)𝑋𝑡 = (1 − θ1B − Θ1Bs + θ1Θ1Bs+1)ɛ𝑡,
Za mesečne vremenske serije sa 12 perioda sezona (𝑠), gde 𝑊𝑡 = (1 − 𝐵)(1 − 𝐵12) važi:
(1 − 𝐵)(1 − 𝐵12)𝑋𝑡 = (1 − 𝜃𝐵)(1 − 𝛩𝐵12)ɛ𝑡.
Autokovarijansa od 𝑊𝑡 na k-toj docnji:
1. 𝛾𝑘 = 𝐸(𝑊𝑡𝑊𝑡−𝑘)
2. 𝛾0 = (1 + 𝜃12)(1 + 𝛩1
2)𝜎2
3. 𝛾1 = −𝜃1(1 + 𝛩12)𝜎2
Master rad Tanja Armenski
46
4. 𝛾𝑠−1 = 𝜃1𝛩1𝜎2
5. 𝛾𝑠 = −𝛩1(1 + 𝜃12)𝜎2
6. 𝛾𝑠+1 = 𝜃1𝛩1𝜎2.
A sve ostale autokovarijanse su jednake nuli. Na osnovu autokovarijacione funkcije dobijamo
autokorelacione koeficijente:
1. 𝜌1 =−𝜃1
1+𝜃12
2. 𝜌𝑠−1 =𝜃1𝛩1
(1+𝜃12)(1+𝛩1
2)= 𝜌𝑠+1
3. 𝜌𝑠 =−𝛩1
1+𝛩12
a ostale autokorelacione funkcije su jednake nuli. Ako serija odgovara “vazduhoplovnom“
modelu, tada je varijansa ocenjenih uzoračkih autokorelacionih koeficijenata na docnjama
većim od 𝑠 + 1:
Var(𝑘) =1 + 2(1
2 + 𝑠−12 + 𝑠
2 + 𝑠+12)
𝑛, 𝑘 > 𝑠 + 1
Grafik 5. Autokorelacija i parcijalna autokorelacija 𝑆𝐴𝑅𝐼𝑀𝐴(0,1,1)(0,1,1)12
Autokovarijansne i autokorelacione funcije ostalih karakterističnih slučajeva sezonskih ARIMA
modela prikazani su u Box i Jenkins (1976).
Master rad Tanja Armenski
47
6.4. Stabilizacija varijanse
Nestacionarni procesi se postupkom diferenciranja svode na stacionarne procese u sredini, ali
ne i u varijansi, autokovarijansi i autokorelaciji. Može se pokazati da je varijansa
𝐴𝑅𝐼𝑀𝐴 (𝑝, 𝑑, 𝑞) procesa vremenski zavisna:
𝑉𝑎𝑟(𝑋𝑡) = 𝜎𝑡2
i da se varijansa nestacionarnog procesa menja sa promenom njene sredine, odnosno:
𝑉𝑎𝑟(𝑋𝑡) = 𝑐ℎ(µ𝑡)
gde je 𝑐 konstanta, µ𝑡 je očekivana vrednost, a ℎ je horizont prognoze. Za stabilizaciju varijanse,
potrebno je odrediti funkciju 𝑓 tako da je varijansa transformisane serije konstantna.
Neka je 𝑉𝑎𝑟(𝑋𝑡) = 𝑐2µ𝑡2, dakle ℎ(µ𝑡) = µ𝑡
2 pa je:
𝑓(𝑋𝑡) = ∫1
√µ𝑡2
𝑑µ𝑡 = 𝑙𝑛(µ𝑡)
Ukoliko je varijansa promenljive 𝑋𝑡 proporcionalna njenoj očekivanoj vrednosti tada
𝐴𝑅𝐼𝑀𝐴(𝑝, 𝑑, 𝑞) procesima odgovara logaritamska transformacija. Logaritamska trasformacija
u cilju stabilizacije sprovodi se pre ma koje druge transformacije.
6.5. Testovi jediničnih korena
Testovi koji se koriste za testiranje prisustva i tipa nestacionarnosti u modelima linearnih
vremenskih serija zovu se testovi jediničnih korena. Za određivanje stacionarnosti serije obično
se koristi DF test (Dickey Fuller). Postoje tri tipa modifikacija ovog testa za modele bez
konstante (𝜏1), bez trenda (𝜏2) i sa trendom (𝜏3) 13. U radu će se za testiranje stacionarnosti serija
koristiti statistike 𝜏2i 𝜏3.
13 Za više informacija pogledati Mihailović (2011) na str. 40.
Master rad Tanja Armenski
48
Statistikom 𝜏2 testira se prisustvo trend stacionarnosti. Nulta hipoteza pretpostavlja da
vremenska serija prati proces slučajnog hoda sa konstantom, a alternativna da je proces
stacionaran. Ako 𝛼 = 𝜙 − 1 , tada:
∇𝑋𝑡 = 𝛽0 + 𝛼 𝑋𝑡−1 + ɛ𝑡
H0: 𝛼=0 H1: 𝛼<0.
DF statistika može da se modifikuje dodavanjem linearnog trenda u cilju testiranja da je proces
trend stacionaran (hulta hipoteza) protiv alternativne da je proces diferencno stacionaran (𝜏3).
∇𝑋𝑡 = 𝛽0+𝛽1𝑡 + (𝛼 − 1) 𝑋𝑡−1 + ɛ𝑡
H0: 𝛼=0 H1: 𝛼<0.
Za testiranja stacionarnosti autoregresivnih procesa viših redova obično se koristi prošireni
Dickey-Fuller-ov test (ADF) u oznaci:
∇𝑋𝑡 = 𝛽0+𝛽1𝑡 + (𝛼 − 1) 𝑋𝑡−1 + ∑ 𝜆𝑖∇𝑋𝑡−𝑖+ ɛ𝑡
𝑝
𝑖=1
Ukoliko se na osnovu ADF testa odbaci hipoteza o postojanju jednog jediničnog korena,
odnosno utvrdi se da serija nije diferencno stacionarna tada je moguće da je serija trend
stacionarna. Ako se na osnovu ADF statistike ne odbaci pretpostavka o postojanju jednog
jediničnog korena tada se serija transformiše diferenciranjem i testiranje se ponavlja za prvu
diferencu vremenske serije (𝜏2) itd.
Kritične vrednosti oblasti odbacivanja nulte hipoteze za ADF test dobijaju se poređenjem
empirijskih i teorijskih vrednosti Dickey-Fuller-e 𝜏 statistike t-raspodele14. Ocenjena kritična
vrednost testa može se izračunati po obrascu:
𝛽∞ +𝛽1
𝑛+
𝛽2
𝑛2 .
14 Pored testova za testiranje prisustva jediničnog korena sa t-raspodelom, Dickey i Fuller (1981) su predloži
nekoliko testova koji prate F-raspodelu (Ф1, Ф2, Ф3). Osnovu testa čini količnik verodostojnosti koji se naziva Ф
statistika. Više se može naći kod Kovačića (1995).
Master rad Tanja Armenski
49
6.6. Opšta strategija izgradnje ARIMA modela
Box i Jenkins su predložili opštu strategiju izgradnje ARIMA modela koja obuhvata
identifikaciju, ocenjivanje, proveru adekvatnosti modela i predviđanje (Mladenović, Nojković,
2012):
1. Identifikacija predstavlja prvu fazu u procesu analize vremenskih serija. Samo opisivanje
vremenske serije predstavlja određivanje informacija o prirodi vremenske serije i o tome da li
je potrebno izvršiti neku transformaciju vremenske serije. Ona obuhvata postupak utvrđivanja
stacionarnosti, reda diferenciranja, izbor odgovarajućeg modela i utvrđivanje reda procesa.
Prvobitno se utvrđuje da li je vremenska serija stacionarna i da li sadrži sezonske obrasce.
Grafički prikaz vremenske serije, odnosno njenih korelograma, je informativno sredstvo za
utvrđivanje stacionarnosti vremenske serije. Ukoliko je vremenska serija nestacionarna onda je
neophodno odgovarajućim transformacijama pre dalje analize stabilizovati istu. Najčešće
metode za stabilizaciju varijanse vremenske serije su logaritamska ili Box-Cox-ova
transformacija. Kada se varijansa serije stacionira, neophodno je proveriti da li je njena sredina
konstantna kroz vreme. Ovo se može uraditi primenom proširenog Dickey Fuller testa (ADF)15.
Zatim se na osnovu teorijskih osobina obične i parcijalne autokorelacione funkcije određuje
linearni model i njegov red (Tabela 1):
Tabela 1. Izgled obične i parcijalne autokorelacione funkcije procesa 𝐴𝑅(𝑝), 𝑀𝐴(𝑞), 𝐴𝑅𝑀𝐴(𝑝, 𝑞)16
Izgled funkcije 𝑨𝑹 (𝒑) 𝑴𝑨 (𝒒) 𝑨𝑹𝑴𝑨 (𝒑, 𝒒)
Autokorelaciona
funkcija
Lagano odumire ka 0 Jednaka 0 kada je red
procesa veći od q
Lagano odumire
ka 0
Parcijalna autokorelaciona
funkcija
Jednaka 0 kada je red
procesa veći od p
Lagano odumire ka 0 Lagano odumire
ka 0
15 Skraćenica ADF je preuzeta iz engleskog jezika “Augmented Dickey Fuller“. 16 Preuzeto iz Mihailović, 2011, str. 45.
Master rad Tanja Armenski
50
Osim pregleda korelograma, često se koriste dodatni kriterijumi za utvrđivanje reda modela.
Najčešće korišćeni su Akaike informativni kriterijum (AIK) i Akaike-ova konačna greška
predviđanja (FPE) (Akaike, 1974):
𝐴𝐼𝐶(𝑝, 𝑞) = 𝑙𝑛𝜎𝑝,𝑞2 +
𝑝 + 𝑞
𝑛𝑙𝑛(𝑛)
𝐹𝑃𝐸(𝑝, 𝑞) =𝑛 + 𝑝 + 𝑞
𝑛 − 𝑝 − 𝑞𝜎𝑝,𝑞
2
gde se biraju vrednosti za 𝑝, 𝑞 koje minimiziraju AIC (p, q) i FPE (p,q). AIC se koristi za
poređenje konkurentskih modela koji odgovaraju istim serijama u ovom radu. Model sa manjim
informacionim kriterijumima bolje odgovara podacima.
2.Ocenjivanje je faza u kojoj se ocenjuju koeficijenti modela, odnosno sredina µ = 𝐸(𝑋𝑡) i
varijansa serije 𝜎2 = 𝐸(ɛ𝑡2), kao i = [𝜙1, 𝜙2, . . . , 𝜙𝑝] , 𝜃 = [𝜃1, 𝜃2, . . . , 𝜃𝑞] na osnovu
raspoloživih podataka što je uslovljeno adekvatnošću izabranog modela iz prethodne faze.
Konačne ocene se dobijaju metodom najmanjih kvadrata ili metodom maksimalne
verodostojnosti.
3. Provera adekvatnosti je postupak suočavanja prilagođenog modela podacima u cilju
otkrivanja njegovih eventualnih nedostataka, što podrazumeva proveru statističke značajnosti
ocenjenih koeficijenata i osobina reziduala (predstavljaju li proces belog šuma). Model se u
ovoj fazi ili poboljšava ili se, ako zadovoljava kriterijume, koristi za prognozu. Za proveru
adekvatnosti modela koristi se test statistika koju su predložili Ljung i Box:
𝑄𝐵𝑃 = 𝑛(𝑛 + 2) ∑𝜌𝑘
2
𝑛 − 𝑘
ℎ
𝑘=1
gde je 𝜌𝑘 =∑ ɛ𝑡
𝑛𝑡=𝑘 ɛ𝑡−𝑘
∑ ɛ𝑡2𝑛
𝑡=1 .
Nulta hipoteza je da ne postoji autokorelacija između reziduala na docnjama ℎ reda (H0), a
alternativna da postoji. Ukoliko je nulta hipoteza tačna tada je vremenska serija beli šum sa
raspodelom: 𝑄𝐵𝑃~ 𝜒ℎ−𝑝−𝑞2 .
Master rad Tanja Armenski
51
4. Predviđanje: na osnovu poznatih opservacija izabranog i ocenjenog modela iz prethodne faze
prognoziraju se buduća kretanja vremenske serije. Prognoze sa minimalnom srednjom
kvadratnom greškom se najčešće koriste u ekstrapolaciji budućih vrednosti vremenske serije.
Neka su 𝑋𝑛+ℎ buduća vrednost vremenske serije za interval ℎ i 𝑛+ℎ prognozirana vrednosti
vremenske serije za interval ℎ, tada je greška prognoziranja:
ɛ𝑡(ℎ) = 𝑋𝑡+ℎ-𝑛+ℎ
a srednje kvadratna greška prognoziranja:
𝐸(𝑋𝑡+ℎ − 𝑛+ℎ)2
Ideja je da se na osnovu poznatih vrednosti vremenske serije formira 𝑡+ℎ za koje srednja
kvadratna greška prognoziranja 𝐸(𝑋𝑛+ℎ + 𝑛+ℎ)2ima minimalnu vrednost17:
𝑡+ℎ = 𝐸(𝑋𝑡+ℎ|𝑋𝑡,𝑋𝑡−1, … )
Ako se na seriji primeni logaritamska transformacija radi stabilizacije varijanse serije
neophodno je istu inverznom funkcijom korigovati. U suprotnom će logaritmovana vremenska
serija pratiti log-normalnu raspodelu sa sredinom 𝑒1
2𝜎2
.
6.7. Kriterijumi performansi predviđanja
Za poređenje prognoza različitih modela korišćeni su parametri MAPE i RMSPE.
𝑀𝐴𝑃𝐸 =100
𝑛∑
|𝑒𝑡|
𝑋𝑡
𝑛
𝑡=1
𝑅𝑀𝑃𝑆𝐸 = √100
𝑛∑ (
𝑒𝑡
𝑋𝑡)
2𝑛
𝑡=1
Vrednosti kriterijuma predviđanja ispod 10% odražavaju visoku preciznost predviđanja
(Kovačić, 1993).
17 Za detaljnije informacije pogledati Mihailović (2011), str. 43.
Master rad Tanja Armenski
52
7. Metodologija istraživanja
U cilju procene najadekvatnijeg modela u prognozi broja putnika u avio saobraćaju na primeru
Kanade i Srbije analizirani su sledeći modeli vremenskih serija: Holt-Vinter-ov metod
eksponencijalnog izravnavanja, 𝐴𝑅𝑀𝐴 (𝑝, 𝑞), 𝐴𝑅𝐼𝑀𝐴 (𝑝, 𝑑, 𝑞) i 𝑆𝐴𝑅𝐼𝑀𝐴 (𝑝, 𝑑, 𝑞) (𝑃, 𝐷, 𝑄)𝑆.
Mesečni podaci o broju putnika u međunarodnom avio saobraćaju u periodu od januara 2007.
do decembra 2017. godine publikovani su od strane Kanadske agencije za granične usluge i
Statistike Kanade. Podaci o broju putnika u međunarodnom avio saobraćaju Srbije publikovani
su od strane Republičkog zavoda za statistiku Srbije i aerodroma Nikola Tesla, Beograd.
Međunarodni avio saobraćaj dolazećeg i odlazećeg saobraćajnog toka Kanade analiziran je u
okviru dva segmenta: a) međunarodni avio saobraćaj koji čine letovi između Kanade i USA i
b) letovi između Kanade i drugih inostranih zemalja. Na primeru Srbije, analiziran je broj
putnika u dolazećem i odlazećem međunarodnom avio saobraćaju.
Podaci o broju putnika u avio saobraćaju su podeljeni u dva uzorka. Prvi uzorak čine serije
podataka od januara 2007. do decembra 2016. godine. Ovaj set podataka se koristi za “obuku”,
odnosno prilagođavanje podataka odabranim modelima vremenskih serija. Drugi uzorak
pokriva period od januara 2017. do decembra 2017. godine i koristi se za procenu performansi
prognoza.
Sezonski obrasci su modelovani binarnim regresorima u obliku:
𝐷𝑗𝑡 = 1 𝑎𝑘𝑜 𝑡 = 𝑗0 𝑎𝑘𝑜 𝑡 ≠ 𝑗
gde 𝑗 = 1, 2, . . . , 12 prema preporuci Ghysels i Osborn (2001). Za ocenu preciznosti prognoza
korišćeni su parametri MAPE i RMSPE, kao i AIK za procenu opšte podobnosti modela.
Adekvatnost ocenjenih modela procenjena je Ljung-Box statistikom testiranjem značajnosti
pojedinačih autokorelacionih koeficijenata reziduala modela na različitim docnjama. Statističke
analize su programirane u SAS-u korišćenjem SAS 9.3. paketa.
Master rad Tanja Armenski
53
8. Rezultati istraživanja
8.1. Deskriptivna statistika
Linijskim grafikonima prikazane su vremenske serija broja putnika u dolazećem i odlazećem
avio saobraćaju na originalnim i log transformisanim podacima prve diference za ceo period
uzorkovanja. U oba slučaja Kanade i Srbije, može se uočiti da se broj putnika u avio saobraćaju
povećava tokom vremena. Pozitivni vremenski trend je naročito izražen na primeru Srbije u
periodu nakon 2013. godine. Varijanse većina serija se takođe vremenom povećavaju što
ukazuje na nestacionarnost varijansi serija, osim u slučaju serije iz Kanade prema drugim
zemljama (CAN_OVS). Sezonska komponenta je takođe prisutna u svim serijama.
Vremenske serije broja putnika na dolaznim letovima prema Kanadi postižu maksimalne
vrednosti u letnjim mesecima, dok serije putnika na odlaznim letovima iz Kanade prema USA
i drugim zemljama postižu maksimalne vrednosti u periodu od januara do maja. Interesantno je
primetiti nestandardnu opservaciju na seriji OVS_dolazni u junu 2016 godine. Porast broja
putnika u međunarodnom avio saobraćaju prema Kanadi u ovom periodu može biti posledica
održavanja letnjih Olimpijskih igara u Riu de Žaneiru, u Brazilu u avgustu, 2016. godine.
Vremenske serije broja putnika na dolaznim i odlaznim letovima u avio sabraćaju Srbije postižu
maksimalne vrednosti u letnjim mesecima. Na dolaznim letovima prema Srbiji nestandardne
opservacije se pojavljuju u julu, a naročito visoke vrednosti postižu u julu 2007. i 2010. godine.
Porast broja inostranih posetilaca može biti posledica EXIT festivala koji se održava svake
godine početkom jula meseca.
Na seriji broja putnika na odlaznim letovima iz Srbije uočava se nestandardna opservacija u
oktobru 2017 godine. Poslovanje nisko-budžetnih avio kompanija na srpskom avio tržištu,
pokretanje novih linija i povećanje broja letova na postojećim linijama prema Evropi i Bliskom
Istoku (Dubai), pozitivno je uticalo na trend broja putnika u srpskom avio saobraćaju u 2017.
godini.
Master rad Tanja Armenski
54
Vremenske serije broja putnika u međunarodnom avio saobraćaju u oba primera, Kanade i
Srbije, postižu svoje minimume u periodu između 2007. i 2009. godine. Ovo može biti posledica
finansije krize u USA 2007/2008. godine i kasnije ekonomske recesije u Kanadi 2008/2009.
godine, kao i posledica Evropske dužničke krize 2009. godine.
Grafički prikazi originalnih i diferenciranih vremenskih serija ukazuju da većina ispitivanih
serija ima multiplikativne sezone osim u slučaju serije iz Kanade prema drugim zemljama
(CAN_OVS) koja ima aditivne sezone (Grafik 6). Vremenske serije sa multiplikativnim
sezonama su log tranformisane u cilju stabilizacije varijanse serija (Grafik 6 i Grafik 7).
Grafik 6. Broj putnika u avio saobraćaju Kanade na originalnim i transformisanim podacima
Master rad Tanja Armenski
55
Grafik 7. Broj putnika u avio saobraćaju Srbije na originalnim i transformisanim podacima
8.2. Holt-Winter-ov metod eksponencijalnog izravnavanja
Deskriptivna statistika je pokazala da su vremenske serije uglavnom multiplikativne pošto se
slučajna variranja u serijama povećavaju sa protokom vremena, osim u slučaju serije iz Kanade
prema drugim zemljama (CAN_OVS). Takođe, vremenske serije nemaju konstantan nivo (𝑎𝑡),
a imaju trend (𝑏𝑡) i sezonsku komponentu (𝑠𝑡 ) stoga je na ispitivane serije primenjen Holt-
Winter-ov metod trostrukog eksponencijalnog izravnavanja. Parametri izravnavanja nivoa (𝛼),
trenda (𝛽) i sezone (𝛾) vremenskih serija prikazani su u Tabeli 2.
Tabela 2. Rezultati Holt-Winter-ovih parametara izravnavanja
Serija Tip 𝜶 𝜷 𝜸
USA_dolazni multiplikativni 0,483 0,026 0,278
OVS_dolazni multiplikativni 0,359 0,161 0,582
CAN _USA_odlazni multiplikativni 0,699 0,001 0,386
CAN_OVS_odlazni aditivni 0,343 0,001 0,606
SRB_dolazni multiplikativni 0,502 0,004 0,593
SRB_odlazni multiplikativni 0,494 0,006 0,810
Master rad Tanja Armenski
56
Parametar nivoa serija (𝛼) ima najveću vrednost na seriji letova iz Kanade za USA što ukazuje
na vremensku nestabilnost serije u odnosu na druge serije. Parametri poravnavanja trenda (𝛽)
su jednaki ili blizu nuli na većini serija što ukazuje da je nagib serija relativno konstantan tokom
vremena. Na seriji OVS-dolazni (𝛽 =0,161) je izražen pozitivan trend.
Parametri sezonskog poravnanja (𝛾) najizraženiji su u slučaju odlaznog avio saobraćaja iz
Kanade ka ostalim inostranim zemlje (izuzev USA) i iz Srbije na odlaznim letovima ka drugim
zemljama. Uzimajući u obzir samu prirodu ispitivanih podataka koje karakteriše izraženo
sezonsko kretanje visoke vrednosti sezonskih parametara na serijama broja putnika na odlaznim
međunarodnim letovima nisu iznenađujuće.
8.3. Univarijantni modeli vremenskih serija
U izgradnji ARMA, ARIMA i SARIMA modela korišćena je Box i Jenkins-ova strategija.
Prethodnim grafičkim pregledom vremenskih serija, utvrđeno je prisustvo multiplikativnih
sezona i stoga je većina ispitivanih serija log tranformisana osim u slučaju serije iz Kanade
prema drugim zemljama (CAN_OVS) koja pokazuje aditivne sezonske obraske. Potom je
procenjena stacionarnost vremenskih serija primenom ADF testa. U Tabeli 3. su prikazani
rezultati ADF testa sa dve modifikacije sa trendom (𝜏3) i bez trenda (𝜏2), kao i rezultati ADF
testa bez trenda prve diference vremenskih serija (𝜏2).
Prvobitno je testirana hipoteza da je proces trend stacionaran protiv alternativne da je proces
diferencno stacionaran (𝜏3). Ako je empiriska vrednost veća od 1% kritične vrednosti testa tada
se nulta hipoteza o prisustvu jediničnog korena u seriji ne može odbaciti. U tom slučaju se
pristupa testiranju hipoteza o prisustvu jediničnog korena bez determinističkog trenda (𝜏2). Ako
je empirijska vrednosti veća od 1% kritične vrednosti oblasti odbacivanja nulte hipoteze
zaključuje se da je u seriji prisutan jedinični koren i neophodno je diferencirati istu nakon čega
se na diferenciranoj seriji ponavlja ADF test (𝜏2).
Empirijske vrednosti statistike (𝜏3) su ispod 1% kritične vrdnosti oblasti odbacivanja nulte
hipoteze što implicira stacionarnost serijama na dolaznom sabraćaju ka Kanadi (OVS) i iz
Master rad Tanja Armenski
57
Kanade prema USA i ostalim zemljama (OVS) na nižim docnjama (𝜏2). Na višim docnjama
serije postižu stacinarnost nakon sezonskog diferenciranja.
Tabela 3. Rezultati Dickey-Fuller-ovih testova jediničnih korena
Sa trendom (𝝉𝟑) Bez trenda (𝝉𝟐) Bez trenda prve
diference (𝝉)
Serija Empirijska Kritična
vrednost1
Empirijska Kritična
vrednost1
Empirijska Kritična
vrednost1
LnUSA_dolazni -3,87 -4,04 -3,76 -3,49 -5,17 -3,49
LnOVS_dolazni -4,37 -4,04 -4,32 -3,49 -5,16 -3,49
LnCAN _USA_odlazni -5,18 -4,04 -4,44 -3,49 -4,66 -3,49
CAN_OVS_odlazni -6,22 -4,04 -5,11 -3,49 -4,88 -3,49
LnSRB_dolazni -3,75 -4,04 -2,84 -3,49 -3,98 -3,49
LnSRB_odlazni -3,39 -4,04 -2,75 -3,49 -4,67 -3,49
1 Teorijske kritične vrednosti testa su na nivou značajnosti od 0,01 za veličinu uzorka n=120.
Nakon određivanja reda diferenciranja, određuje se red 𝐴𝑅(𝑝) i 𝑀𝐴(𝑞) vremenskih serija na
osnovu AIC informacionog kriterijuma. Izabrani modeli za ocenjene serije su prikazani u Tabeli
4.
Tabela 4. Rezultati 𝐴𝑅𝑀𝐴(𝑝, 𝑞), 𝐴𝑅𝐼𝑀𝐴(𝑝, 𝑑, 𝑞) i 𝑆𝐴𝑅𝐼𝑀𝐴(𝑝, 𝑑, 𝑞) (𝑃, 𝐷, 𝑄)𝑠 modela ARIMA SARIMA
Serija Model Ljung-Box
(sig)
AIC Model Ljung-Box
(sig)
AIC
LnUSA_dolazni (1,1,1) 0,235 -430,40 (3,1,1) (1,1,0)12 0,225 -364,48
LnOVS_dolazni (1,0,1) 0,148 -394,34 (0,1,1) (1,1,0)12 0,287 -326,26
LnCAN_USA_odlazni (1,0,1) 0,606 -508,62 (1,0,1) (1,1,1)12 0,268 -441,67
CAN_OVS_odlazni1 ([1 5 10 11],
1, 2)
0,236 2771,38 (1,1,1) (0,1,2)12 0,213 2.511,98
LnSRB_dolazni (1,1,1) 0,278 -369,82 (1,1,2) (0,1,1)12 0,216 -313,16
LnSRB_odlazni (3,1,1) 0,266 -372,95 (1,1,1) (1,1,0)12 0,248 -311,38
1 CAN_OVS je aditivna i stoga nije log transformisana serija. Ostale serije su log transformisane što je rezultiralo
različitim skorovima AIC parametra. Kako je AIC korišćen za poređenje konkurentskih modela koji odgovaraju
istoj seriji, a ne za poređenje sa drugim serijama, transformacija podataka nije uticala na izbor modela prikazanih
u Tabeli 4.
Master rad Tanja Armenski
58
Na osnovu Ljung-Box testa može se zaključiti da u vremenskim serijama nisu prisutne
statistički značajne autokorelacije između reziduala što ukazuje na adekvatnost ocenjenih
modela.
Procena preciznosti prognoza izabranih modela na osnovu parametara MAPE i RMSPE
prikazani su u Tabeli 5. Ovi parametri su izračunati na osnovu prognoza izvan uzorka, odnosno
za period od januara 2017. do decembra 2017. Svi parametri MAPE i RMSPE su ispod
preporučene vrednosti od 10% (Kovačić, 1998). U većini ispitivanih slučajeva modeli ARMA i
ARIMA su postigli najpreciznije prognoze, dok je Holt-Winterov metod eksponencijalnog
izravnavanja dao najpreciznije prognoze za seriju avio saobraćaja iz Kanade za USA.
Tabela 5. Rezultati MAPE i RMSPE pojedinačnih modela
MAPE RMSPE
Serija Holt-Winter ARIMA SARIMA Holt-Winter ARIMA SARIMA
LnUSA_dolazni 2,950 2,714 3,385 3,762 3,524 4,213
LnOVS_dolazni 3,610 3,333 4,069 4,592 4,379 5,155
LnCAN _USA_odlazni 2,172 2,173 2,328 2,683 2,998 3,094
CAN_OVS_odlazni 2,791 2,404 2,882 3,590 3,297 3,848
LnSRB_dolazni 3,920 3,530 4,432 4,923 4,42 5,420
LnSRB_odlazni 3,678 3,333 4,167 5,089 4,635 5,691
Grafici ocenjenih modela sa najpreciznijim prognozama za period od januara 2017. do
decembra 2017. godine pokazuju da prognoze uglavnom dobro opisuju realne podatke, njihove
sezonske obrasce i srednje nivoe vremenskih serija (Grafik 8. do Grafik 13).
Grafik 8. USA_dolazni ARIMA (1,1,1) Grafik 9. OVS_dolazni ARIMA (1,0,1)
Master rad Tanja Armenski
59
Grafik 10. CAN _USA_odlazni Holt-Winter Grafik 11. CAN_OVS_odlazni
ARIMA ([1 5 10 11], 1, 2)
Grafik 12. SRB_dolazni ARIMA (1,1,1) Grafik 13. SRB_odlazni ARIMA (3,1,1)
U slučaju serije CAN _USA_odlazni koja je procenjena Holt-Winter-ovom metodom i
SRB_odlazni koja je procenjena ARIMA(3,1,1) prognoze su u podbačaju, odnosno pokazuju
pesimistički scenario predviđenja.
Master rad Tanja Armenski
60
9. Zaključak i diskusija
U skladu sa postavljenim ciljevima istraživanja, u radu su analizirani različiti modeli
vremenskih serija, kao što su Holt-Vinters eksponencijalno izravnavanje, ARMA, ARIMA i
SARIMA sa ciljem da se utvrdi koja metoda je najpreciznija u predviđanju broja putnika u
međunarodnom avio saobraćaju na primeru Kanade i Srbije.
U radu je analizirano šest vremenskih serija broja putnika u avio saobraćaju na primeru Kanade
i Srbije u periodu od januara 2007. do decembra 2016. godine. Na primeru Kanade analizirano
je četiri vremenske serije: broj putnika na dolaznim letovima prema Kanadi iz USA i ostalim
zemljama i broj putnika na odlaznim letovima iz Kanade prema USA i ostalim zemljama. Na
primeru Srbije analizirane su dve serije broja putnika na odlaznim i dolaznim letovima prema
Srbiji.
Većina ispitivanih vremenskih serija ukazala je na prisustvo multiplikativnih sezona osim u
slučaju serije iz Kanade prema drugim zemljama (CAN_OVS) koja ima aditivne sezone.
Parametar nivoa serija (𝛼) ima najveću vrednost na seriji letova iz Kanade za USA što ukazuje
na vremensku nestabilnost serije u odnosu na druge serije. Na seriji avio saobraćaja iz drugih
zemalja prema Kanadi, vremenska serije ima izražen pozitivni trend (𝛽 =0,161). Pozitivni trend
je posledica porasta broja putnika u međunarodnom avio saobraćaju prema Kanadi što može
ukazati na razvoj turističkog sektora, ali može biti i odraz pozitivne imigracione politike Vlade
Kanade.
Što se tiče same prognoze modelima klase ARIMA, modeli ARMA i ARIMA pokazuju
najpreciznije prognoze za 12 meseci unapred na svim serijama osim u slučaju serije iz Kanade
prema USA. Ovi rezultati su u skladu sa nalazima autora Bougas (2013) koja je ispitivala
performanse modela serija avio saobraćaja Kanade u periodu od 1988-2008. godine. U radu
istog autora, ARIMA je pokazala dobre performanse u kratkoročnim prognozama do jednog
tromesečja dok je SARIMA pokazivala bolje performanse u dugoročnim prognozama do dve
godine. Ovaj nalaz nije iznenađujući s obzirom da je ARIMA model sa kratkoročnom
Master rad Tanja Armenski
61
memorijom (Bourbonnais, Terraza, 2004) koji je „osetljiv“ na strukturne promene u serije
uzrokovane naglim promenama u geopolitičkom i ekonomskom okruženja.
U radu autora Bougas (2013) ispitivana serija avio saobraćaja sadržala je tri takva „šoka“, rat u
Golfskom zalivu (1990-1991), terorističke napade na USA 9/11 (septembar, 2001) i epidemiju
SARS18-a (novembar, 2002 - jul, 2003) koji su doprineli slučajnom variranju ispitivanih serija.
Kako u ispitivanim vremenskim serijama u periodu od januara, 2007 do decembra, 2017. godine
takvih šokova nema, ARIMA je pokazala bolje performanse predviđanja od ostalih ispitivanih
modela.
Holt-Winters metod je pokazao najbolje performanse predviđanja serije broja putnika iz Kanade
prema USA, ali je imao tendenciju pesimističkih predviđanja. Iako u seriji nisu prisutne
strukturne promene na koje je Holt-Winters-ov metod „osetljiv“ (Croux, Crevits, 2016),
prognoze su znatno varirale u prisustvu nestandardnih opservacija u seriji.
Naime, ispitivana serija sadrži nestandardne opservacije u 2009/2010. godini što je moguća
posledica finansije krize u USA 2007/2008. godine i ekonomske recesije u Kanadi 2008/2009.
godine. Ekonomska recesija u Kanadi 2008/2009. godine značajno je uticala na pad broja
putnika avionom za USA, a nakon recesije broj putnika u avio saobraćaju prema USA je
značajno varirao delom prateći kretanje kursa kanadskog dolara prema američkom dolaru.
Ovi “događaji” iz ekonomskog okruženja su značajno uticali na stabilnost vremenske serije u
posmatranom periodu. Uklanjanjem slučajnih variranja iz serije mogu se poboljšati performanse
prognoze. Slučajna variranja u seriji usled uticaja iz okruženja mogu se otkloniti uvođenjem
regresova u model koji vremenski korespondiraju sa događajima iz okruženja. Oblik regresora
zavisi od tipa nestandardne opservacije i njenog uticaja na vremensku seriju. Na primer, uticaj
ekonomske recesije (𝐸𝑅𝑡) u Kanadi 2008/2009. godine može se modelovati uvođenjem
binarnog regresora u model u obliku:
𝐸𝑅𝑡 = 1 𝑧𝑎 𝑡 = 𝑜𝑘𝑡𝑜𝑏𝑎𝑟 2008, . . . , 𝑗𝑢𝑛𝑒 2009
0 𝑧𝑎 𝑡 ≠ 𝑜𝑘𝑡𝑜𝑏𝑎𝑟 2008, . . . . , 𝑗𝑢𝑛𝑒 2009
18 Teški akutni respiratorni sindrom (Severe Acute Respiratory Syndrome) skraćeno SARS.
Master rad Tanja Armenski
62
jer ovaj događaj ima jednokratnu intervenciju na ispitivane vremenske serije odlaznog
međunarodnog avio saobraćaja iz Kanade19.
Interesantno je da je u seriji dolaznog saobraćaja iz ostalih zemalja prema Kanadi primetna
nestandarna opservacija u junu 2016. godine koja je uzrokovala pad broja putnika iz drugih
zemalja. Kako su putnici iz Velike Britanije najbrojniji posetioci Kanade moguće je da je
nestandarna opservacija posledica Brexita i pada vrednosti britanske valute.
Ovi rezultati su u skladu sa nalazima autora Kulendran i Witt (2003) i Du Preez i Witt (2003)
koji su pokazali da univarijantni modeli klase ARIMA pokazuju najpreciznije prognoze na
međunarodnim dolaznim letovima prema Velikoj Britaniji, Novom Zelandu, Japanu, USA,
Australiji i Sejšelima.
Što se tiče serija putnika u dolaznom i odlaznom avio saobraćaju Srbije, ARIMA modeli su
pokazali najbolje performanse predviđanja za 12 meseci unapred. Rezultati su u skladu sa
nalazima Petrovske (2017) koja je ispitivala serije putnika u međunarodnom avio saobraćaju
Makedonije.
Međutim, ARIMA je pokazivala pesimističke prognoze na seriji odlaznog avio saobraćaja iz
Srbije prema inostranstvu. Ovo je moguće posledica prisustva nestandardnih opservacija u
vremenskoj seriji. Naime, jedan od osnovnih nedostataka modela klase ARMA je da ne
“prepoznaje“ nekarakteristične opservacije naročito ne one opservacije koje imaju dugoročni
efekat na seriju ili pomeraju srednji nivo vremenske serije (Hassler i sar., 2013).
U seriji dolaznog avio saobraćaja iz Srbije prema inostranim zemljama identifikovana je
nestandarna opservacija početkom 2010. godine što bi mogla biti posledica Evropske dužničke
krize. Efekti Svetske ekonomske krize (2007/2009) i Evropske dužničke krize (2009/2010) na
19 Za više informacija o ekonomskim indikatorima i efektima ekonomske recesije pogledati “Canada's Performance
Report 2008-09: The Government of Canada's Contribution“ dostupno u elektronskoj formi na web lokaciji:
https://www.tbs-sct.gc.ca/reports-rapports/cp-rc/2008-2009/cp-rc-eng.pdf
Master rad Tanja Armenski
63
Srbiju manifestovali su se kroz pad likvidnosti, značajno povlačenja stranih investitora sa tržišta
Srbije, kao i usporavanje privredne aktivnosti realnog sektora (Dragutinović i sar., 2009).
Preciznost prognoze se može poboljšati modelovanjem ove nestandardne opservacije
uvođenjem regresora u model u obliku:
𝐸𝐹𝐾𝑡 = 1 𝑧𝑎 𝑡 ≥ 𝑗𝑎𝑛𝑢𝑎𝑟 20100 𝑧𝑎 𝑡 < 𝑗𝑎𝑛𝑢𝑎𝑟 2010
gde je 𝐸𝐹𝐾𝑡 efekat Evropske dužničke krize na Srbiju.
U seriji odlaznog avio saobraćaja iz Srbije takođe je identifikovana nestandardna opservacija u
januaru, 2009. godine koja je imala dugoročni efekat na seriju. Pad broja putnika iz inostranstva
prema Srbiji u ovom periodu takođe može biti posledica Svetske ekonomske krize ili Evropske
dužničke krize.
Interesanto je da su u serijama avio saobraćaja Srbije prisutne pozitivne nestandardne
opservacije na dolaznim letovima u novembru, 2013. godini i na odlaznim letovima iz Srbije
prema inostranstvu u januaru, 2014. godine. Ove aditivne opservacije mogu biti efekti
revitalizacije srpskog avio saobraćaja nakon privatizacije srpske nacionalne aviokompanije Jat
Airways izvršene 1. avgusta 2013.
U daljem istraživanjima neophodno je ispitati preciznost odabranih modela predviđanja u
dugoročnim prognozama do 24 meseci unapred. Takođe je neophodno ispitati robusnost
ocenjenih modela na strukturne promene u serijama što se može postići ispitivanjem dužeg
vremenskog horizonta. Za Srbiju, nažalost, podaci o broju putnika u avio saobraćaju pre 2007.
godine nisu dostupni, ali se prognozom unazad (backshift) ovi podaci mogu simulirati.
Master rad Tanja Armenski
64
Literatura
1. Akaike, H. (1974). A New Look at the Statistical Model Identification, IEEE Transactions
on Automatic Control, AC-19, 716–723.
2. Baggs, J., Fung, L. and Lapham, B. (2015). Exchange Rates, Cross-Border Travel, and
Retailers: Theory and Empirics. Journal of Queen’s Economics Department, 1351, 1-47.
3. Bao, Y., Xiong, T., Hu, Z. (2012). Forecasting Air Passenger Traffic by Support Vector
Machines with Ensemble Empirical Mode Decomposition and Slope-Based Method,
Discrete Dynamics in Nature and Society, 1-12.
4. Bougas, C. (2013). Forecasting Air Passenger Traffic Flows in Canada: An Evaluation of
Time Series Models and Combination Methods, master thesis, University Laval, Quebec,
Canada.
5. Bourbonnais, R., Terraza, M. (2004). Analyse des séries temporelles: applications à
l’économie et à la gestion, volume 3. Dunod.
6. Box, G.E.P., Cox, D. R. (1964). An Analysis of Transformation. Journal of the Royal
Statistical Society, Series B, 16, 211-252.
7. Box, G.E.P., Jenkins, G. M. (1976). Time Series Analysis: Forecasting and Control.
Revised Edition. San Francisco, Holden Day.
8. Canada Goverment (2009). Canada's Performance Report 2008-09. Dostupno u
elektronskoj formi na web lokaciji: https://www.tbs-sct.gc.ca/reports-rapports/cp-rc/2008-
2009/cp-rc-eng.pdf
9. Chu, F. (2009). Forecasting tourism demand with Arma-based methods. Tourism
Management, 30(5), 740–751.
10. Claveria, O., Torra, S., Monte, E. (2016). Modelling Tourism Demand to Spain With
Machine Learning Techniques. The Impact of Forecast Horizon on Model Selection.
Revista de Economía Aplicada, 72 (24), 109-132.
Master rad Tanja Armenski
65
11. Coshall, J. (2009). Combining volatility and smoothing forecasts of UK demand for
international tourism. Tourism Management, 30(4), 495–511.
12. Croux, C., Crevits, R. (2016). Robust forecasting of short time series, International
Conference on Robust Statistics, Geneva, Switzerland.
13. Dickey, D.A., Fuller W.A. (1981). Likelihood ratio statistics for autoregressive time series
with a unit root, Econometrica, 49, 1,057-1,072.
14. Du Preez, J., and Witt, S. F. (2003). Univariate versus multivariate time series forecasting:
An application to international tourism demand. International Journal of Forecasting, 19,
435- 451.
15. Dragutinović, S., Vjetrov, A., Đurić, U., Radenković, T., Cvjetićanin, I., Žutić, E., Kalašić,
O. (2009). Svetska ekonomska kriza i posledice po privredu Srbije, studije i istraživanja br.
11/2009, Institut fakulteta za ekonomiju, finansije i administraciju, Univerzitet u Beogradu,
Beograd.
16. Ganga, R. S., Reddy, P.C.P., Mohan, B. C. (2018). System for Intelligent Tourist
Information using Machine Learning Techniques. International Journal of Applied
Engineering Research, 13(7), 5321-5327.
17. Gil-Alana, L. A., Barros, C. P., Assaf, A. G. (2012). The US airline industry: persistence
and breaks, Transportmetrica A: Transport Science, 9:8, 742-752.
18. Gunter, U., Önder, I. (2015). Forecasting International City Tourism Demand for Paris:
Accuracy of Uni- and Multivariate Models Employing Monthly Data, Tourism
Management, 46, 123-135.
19. Ghysels, E., Osborn, R. D. (2001). The Econometric Analysis of Seasonal Time Series.
Cambridge University Press, Cambridge, UK.
20. Harvey, R. (1993). Time Series Models. MIT Press, second edition.
Master rad Tanja Armenski
66
21. Hassani H, Silva E, Antonakakis N, Filis G. (2017). Forecasting accuracy evaluation of
tourist arrivals. Tourism Research, 63, 112-127.
22. Hassler, U., Wolters, J., Kirchgässner, G. (2013). Introduction to Modern Time Series
Analysis, 2nd edition, Springer, Heidelberg, Germany.
23. Kalić, M., Dožić, S., Babić, D. (2011). Predicting Air Travel Demand Using Soft
Computing: Belgrade Airport Case Study. Procedia Social and Behavioral Sciences: Euro
Working Group on Transportation, 00, 1-10.
24. Kovačić, J. Z. (1995). Analiza vremenskih serija, Ekonomski fakultet, Univerzitet u
Beogradu. Beograd.
25. Kulendran, N., Shan, J. (2002). Forecasting China’s Monthly Inbound Travel Demand.
Journal of Travel & Tourism Marketing, 13, 5-19.
26. Kulendran, N., Witt, S. (2003). Forecasting the demand for international business tourism.
Journal of Travel Research, 41(3), 265–271.
27. Kuljanin, J., Kalić, M. (2015). Exploring characteristics of passengers using traditional and
low-cost airlines: A case study of Belgrade Airport. Journal of Air Transport Management,
46 (12-18).
28. Kumar, M. and Sharma, S. (2016). Forecasting tourist in-flow in South East Asia: A case
of Singapore, Tourism and Management Studies, 12 (1), 107-119.
29. Mihailović, A. (2011). Analiza vremenskih serija. Prirodno-matematički fakultet, master
rad. Univerzitet u Novom Sadu, Novi Sad.
30. Milenković, M., Svadlenka, L., Melichar, V., Bojovic, N., Avramović, Z. (2015). SARIMA
modelling approach for railway passenger flow forecasting. Transportation, 1-8.
31. Mladenović, Z., Nojković, A. (2012). Primenjena analiza vremenskih serija, Centar za
izdavačku delatnost ekonomskog fakulteta u Beogradu, Beograd, Srbija.
Master rad Tanja Armenski
67
32. Montgomery, D. C., Jennings, C. L., Kulachi, M. (2008). Introduction to Time Series
Analysis and Forecasting, John Wiley and Sons, New Jersey, USA.
33. Nai, W., Liu, L., Wang, S., Dong, D. (2017). An EMD–SARIMA-Based Modeling
Approach for Air Traffic Forecasting, Algorithms, 10 (139), 1-16.
34. Petrovska, B. (2017). Predicting tourism demand by A.R.I.M.A. models (Macedonia).
Economic Research-Ekonomska Istraživanja, 30 (1), 939–950.
35. Rajter-Ćirić, D. (2009). Verovatnoća, Univerzitet u Novom Sadu, Prirodno- matametički
fakultet u Novom Sadu, Novi Sad.
36. Shen, S., Li, G., Song, H. (2011). Combination forecasts of international tourism demand.
Annals of Tourism Research, 38(1), 72–89.
37. Statistics Canada (2017c). CANSIM 387-0010: Tourism gross domestic product (GDP),
annual (Preuzeto 11.5.2018).
38. Statistics Canada, (2017a). CANSIM 427-0001: Number of international travellers entering
or returning to Canada, by type of transport (Preuzeto 11.5.2018).
39. Statistics Canada, (2017b). CANSIM 379-0028: Gross domestic product (GDP) at basic
prices, by North American Industry Classification System (NAICS), provinces and
territories (Preuzeto 11.5.2018).
40. Statistics Canada, (2017d). CANSIM 387-0003: Employment generated by tourism, annual
(Preuzeto 11.5.2018).
41. Statistički godišnjak (2017). Bruto dodata vrednost po delatnostima i bruto domaći
proizvod, Republički zavod za statistiku R. Srbije, Beograd. (Preuzeto 28.5.2018).
42. Yılmaz, E. (2015). Forecasting tourist arrivals to Turkey. Tourism, 63(4), 435 – 445.