modelovanje i predviđanje vremenskih serija -...

68
Modelovanje i predviđanje vremenskih serija Master rad Mentor: Kandidat: Prof. Dr Mirko Savić Tanja Armenski Novi Sad, 2018. Univerzitetski centar za primenjenu statistiku Univerzitet u Novom Sadu

Upload: others

Post on 21-Sep-2019

19 views

Category:

Documents


2 download

TRANSCRIPT

Modelovanje i predviđanje vremenskih serija

Master rad

Mentor: Kandidat:

Prof. Dr Mirko Savić Tanja Armenski

Novi Sad, 2018.

Univerzitetski centar za primenjenu statistiku

Univerzitet u Novom Sadu

Master rad Tanja Armenski

1

Univerzitet u Novom Sadu

UCPS - Univerzitetski centar za primenjenu statistiku

Ključna dokumentacijska informacija

Redni broj:

RBR

Identifikacioni broj:

IBR

Tip dokumentacije:

TD

Monografska dokumentacija

Tip zapisa:

TZ

Tekstualni štampani materijal

Vrsta rada (dipl., mag., dokt.):

VR

Master rad

Ime i prezime autora:

AU

Tanja Armenski

Mentor (titula, ime, prezime,

zvanje):

MN

Prof. dr Mirko Savić

Naslov rada:

NR

Modelovanje i predviđanje vremenskih serija

Jezik publikacije:

JP

Srpski

Jezik izvoda:

JI

Srpski / engleski

Zemlja publikovanja:

ZP

Srbija

Uže geografsko područje:

UGP

Vojvodina

Godina: 2018

Master rad Tanja Armenski

2

GO

Izdavač:

IZ

autorski reprint

Mesto i adresa:

MA

Novi Sad, Trg Dositeja Obradovića 5

Fizički opis rada:

FO

broj poglavlja 9/ stranica 67/ tabela 5 /

grafikona 13 / reference 42

Naučna oblast:

NO

Primenjena statistika

Naučna disciplina:

ND

Ekonometrija

Predmetna odrednica, ključne reči:

PO

predikcije, vremenske serije, ARIMA, SARIMA, avio

saobraćaj

UDK

Čuva se:

ČU

Biblioteka

Važna napomena:

VN

Izvod:

IZ

Cilj master rad je procena preciznosti vremenskih serija u

prognozi kapaciteta međunarodnog avio saobraćaja. U

radu su analizirani različiti modeli vremenskih serija: Holt-

Vinters eksponencijalno izravnavanje, autoregresivni

procesi pokretnih proseka (ARMA), regresije sa

autoregresivno integrisanim pokretnim prosecima

(ARIMA) i sezonska regresije sa autoregresivno

integrisanim pokretnim prosecima (SARIMA). Kroz

nekoliko primera na podacima međunarodnog avio

saobraćaja Kanade i Srbije objašnjen je način izbora

odgovarajućih modela u praksi.

Master rad Tanja Armenski

3

Podaci o broju putnika u avio saobraćaju u periodu od

januara 2007. do decembra 2017. godine, prikupljeni su od

strane Kanadske agencije za granične usluge i Statistike

Kanade. Podatke o broja putnika u avio saobraćaju Srbije,

prikuplja Republički zavod za statistiku Srbije i publikuje

arhiva Aerodroma Nikola Tesla, Beograd.

Rezultati su pokazali da u većini ispitivanih slučajeva

modeli klase ARIMA postižu najpreciznije prognoze, dok

je Holt-Winterov metod eksponencijalnog izravnavanja

dao najpreciznije prognoze za seriju avio saobraćaja iz

Kanade za USA. Svi parametri MAPE i RMSPE su ispod

preporučene vrednosti od 10% što generalno ukazuje na

dobre performanse prognoza.

Datum prihvatanja teme od strane

NN veća:

DP

13.06. 2018.

Datum odbrane:

DO

Članovi komisije:

(ime i prezime / titula / zvanje

/naziv organizacije / status)

KO

Predsednik: Zorana Lužanin, doktor nauka,

Prirodno-matematički fakultet, Univerzitet u Novom Sadu,

redovni profesor

Član: Dejan Brcanov, doktor nauka, Ekonomski fakultet,

Univerzitet u Novom Sadu, docent

Član: Mirko Savić, doktor nauka, Ekonomski fakultet,

Univerzitet u Novom Sadu, redovni profesor

Master rad Tanja Armenski

4

University of Novi Sad

UCAS- University Centre for Applied Statistics

Key word documentation

Accession number:

ANO

Identification number:

INO

Document type:

DT

Monograph documentation

Type of record:

TR

Textual printed material

Contents code:

CC

Author:

AU

Tanja Armenski

Mentor:

MN

PhD Mirko Savić

Title:

TI

Time Series Modelling and Forecasting

Language of text:

LT

Serbian

Language of abstract:

LA

Serbian/English

Country of publication:

CP

Serbia

Locality of publication:

LP

Vojvodina

Publication year:

PY

2018

Master rad Tanja Armenski

5

Publisher:

PU

Author reprint

Publication place:

PP

Novi Sad

Physical description:

PD

9 chapters/ 67 pages/ 5 tables / 13 figures/ 42 references

Scientific field

SF

Applied statistic

Scientific discipline

SD

Econometric

Subject, Key words

SKW

Forecasting, Time series, ARIMA, SARIMA, air traffic

UC

Holding data:

HD

Note:

N

Abstract:

AB

This thesis evaluates various time series models and

their efficiency in forecasting the passengers air traffic.

Various time series models were analyzed such as Holt-

Winters exponential smoothing, autoregressive and

moving average processes (ARMA), autoregressive-

integrated-moving average (ARIMA) and seasonal

autoregressive-integrated-moving average regressions

(SARIMA). To demonstrate time series modeling and

appropriate forecasting in practice, a few empirical

models of passenger air traffic in Canada and Serbia are

exercised and presented in the thesis.

Master rad Tanja Armenski

6

Time series of air passengers in Canada between

January 2007 and December 2017 are produced by the

Canadian border services agency (CBSA) and Statistics

Canada. Data of air traffic in Serbia is collected by

Statistical Office of the Republic of Serbia and

published by Aerodrom Nikola Tesla, Belgrade.

The results shows that in most cases ARIMA models

provided most accurate forecasts, while Holt-Winter's

exponential smoothing method outperformed other

models on the air traffic from Canada to the United

States. With MAPE and RMSPE scores below 10% on

average, all models provided accurate forecasts.

Accepted on Scientific Board on:

AS

13.06. 2018.

Defended:

DE

Thesis Defend Board:

DB

President: Zorana Lužanin, PhD,

Faculty of Economics, University of Novi Sad, full-

time professor

Member: Dejan Brcanov, PhD,

Faculty of Economics, University of Novi Sad,

assistenat professor

Member: Mirko Savić, PhD, Faculty of Economics,

University of Novi Sad, full-time professor

Master rad Tanja Armenski

7

Rezime

U radu se procenjuje preciznost vremenskih serija u prognozi kapaciteta međunarodnog avio

saobraćaja na primeru Kanade i Srbije. Cilj rada je da se primenom različitih modela

vremenskih serija, kao što su Holt-Vinters eksponencijalno izravnavanje, autoregresivni procesi

pokretnih proseka (ARMA), autoregresivni integrisani procesi pokretnih proseka (ARIMA) i

sezonski model sa autoregresivno integrisanim prosecima (SARIMA), utvrdi koji model je

najprecizniji u predviđanju broja putnika u međunarodnom avio saobraćaju na primeru Kanade

i Srbije. Podaci o broju putnika u avio saobraćaju u periodu od januara 2007. do decembra 2017.

godine, prikupljeni su od strane Kanadske agencije za granične usluge i Statistike Kanade.

Podatke o broja putnika u avio saobraćaju Srbije prikuplja Republički zavod za statistiku Srbije

i publikuje arhiva Aerodroma Nikola Tesla, Beograd.

Rezultati su pokazali da u većini ispitivanih slučajeva modeli klase ARIMA postižu najpreciznije

prognoze. Holt-Winter-ov metod eksponencijalnog izravnavanja je dao najpreciznije prognoze

za seriju avio saobraćaja iz Kanade za USA. Svi parametri MAPE i RMSPE su ispod

preporučene vrednosti od 10% što generalno ukazuje na dobre performanse prognoza.

Ključne reči: eksponencijalno izravnavanja, ARIMA, SARIMA, avio saobraćaj, Srbija, Kanada

Master rad Tanja Armenski

8

Abstract

This thesis evaluates various time series models and their efficiency in forecasting the

passengers air traffic. Various time series models are analyzed such as Holt-Winters exponential

smoothing, autoregressive and moving average processes (ARMA), autoregressive-integrated-

moving average (ARIMA) and seasonal autoregressive-integrated-moving average regressions

(SARIMA). To explain how to select the most appropriate model in practice, a few examples of

passenger air traffic in Canada and Serbia are presented.

Time series of air passengers in Canada between January 2007 and December 2017 are

produced by the Canadian border services agency (CBSA) and Statistics Canada. Data of air

traffic in Serbia is collected by the Statistical Office of the Republic of Serbia and published by

Aerodrom Nikola Tesla, Belgrade.

The results shows that in most cases ARIMA models provided most accurate forecasts, while

Holt-Winter's exponential smoothing method outperformed other models on the air traffic from

Canada to the United States. With MAPE and RMSPE scores below 10% on average, all models

provided accurate forecasts.

Key words: Exponential Smoothing, ARIMA, SARIMA, Air Traffic, Serbia, Canada

Master rad Tanja Armenski

9

SADRŽAJ

1. Uvod .................................................................................................................11

1.1. Predmet istraživanja ..................................................................................................................... 11

1.2. Ciljevi istraživanja ....................................................................................................................... 12

2. Pregled literature ............................................................................................15

3. Stohastički procesi i vremenske serije ..........................................................18

3.1. Stohastički procesi ...................................................................................................................... 18

3.2. Autokovarijansa i autokorelaciona funkcija stacionarnog stohastičkog procesa ........................ 22

3.3. Vremenske serije ......................................................................................................................... 22

3.4. Osnovne komponente vremenskih serija ..................................................................................... 24

4. Strukturni modeli vremenskih serija ...........................................................26

4.1. Holt-Winter-ov metod eksponencijalnog izravnavanja ............................................................... 26

5. Linearni procesi i linearne vremenske serije ...............................................29

5.1. Linearni procesi ........................................................................................................................... 29

5.2. Operatori u analizi vremenskih serija .......................................................................................... 32

5.3. Autoregresivni procesi AR (p) .................................................................................................... 33

5.3.1. Parcijalna autokorelacijona funkcija .................................................................................... 36

5.4. Procesi pokretnih proseka MA (q) .............................................................................................. 38

5.5. Autoregresivni procesi pokretnih proseka ARMA (p,q) ............................................................. 41

6. Modeli nestacionarnih vremenskih serija ....................................................43

6.1. Tipovi nestacionarnih vremenskih serija ..................................................................................... 43

6.2. Autoregresivni integrisani procesi pokretnih proseka ARIMA (p,d,q) ....................................... 44

6.3. Sezonski autoregresivni integrisani procesi pokretnih proseka SARIMA (p,d,q) (P,D,Q)s ........ 45

6.4. Stabilizacija varijanse .................................................................................................................. 47

6.5. Testovi jediničnih korena ............................................................................................................ 47

6.6. Opšta strategija izgradnje ARIMA modela ................................................................................. 49

6.7. Kriterijumi performansi predviđanja ........................................................................................... 51

7. Metodologija istraživanja ..............................................................................52

8. Rezultati istraživanja .....................................................................................53

8.1. Deskriptivna statistika ................................................................................................................. 53

8.2. Holt-Winter-ov metod eksponencijalnog izravnavanja ............................................................... 55

8.3. Univarijantni modeli vremenskih serija ...................................................................................... 56

Master rad Tanja Armenski

10

9. Zaključak i diskusija ......................................................................................60

Literatura ............................................................................................................64

Master rad Tanja Armenski

11

1. Uvod

1.1. Predmet istraživanja

Vremenska serija je uređeni niz opservacija, gde se uređivanje vrši u odnosu na vreme, najčešće,

u jednakim vremenskim intervalima. Vremenske serije i njihova analiza su pogodno sredstvo

za predviđanjem parametara čije vrednosti zavise od vremenskog poredka. U ovom kontekstu

predviđanje podrazumeva analizu istorijskih podataka, na osnovu kojih prognoziramo buduće

opservacije uz upotrebu odgovarajućeg matematičkih modela. Analiza vremenskih serija je

našla široku primenu u oblasti turizma i transporta.

Predmet istraživanja ovog master rada je analiza predviđanja kapaciteta međunarodnog avio

saobraćaja na primeru Kanade i Srbije. Osnovni cilj rada je procena preciznosti najčešće

primenjivanih vremenskih modela u kratkoročnoj i srednjoročnoj prognozi kapaciteta

prekograničnog avio saobraćaja. Evaluacija vremenskih serija je primenjena na podacima o

broju putnika u prekograničnom avio saobraćaju u periodu od januara 2007. do decembra 2017.

godine.

U radu, avio saobraćaj dolazećeg i odlazećeg saobraćajnog toka analiziran je u okviru dva

segmenta, međunarodni avio saobraćaj koji čine letovi između Kanade i USA1 i letovi između

Kanade i drugih inostranih tržišta. Na primeru Srbije, analiziran je broj putnika u dolazećem i

odlazećem međunarodnom avio saobraćaju.

Područje istraživanja je međunarodni avio saobraćaj na primeru Kanade i Srbije. Međunarodni

avio saobraćaj je prepoznat kao značajan faktor ekonomskog razvoja ovih zemalja. Primera

radi, broj putnika u međunarodnom vazdušnom saobraćaju Kanade je značajno porastao od

2007. godine, sa 21,4 miliona na 32,8 miliona u 2017. godini (Statistics Canada, 2017a). Avio

saobraćaj je ostvario 2% doprinosa u ukupnom bruto domaćem proizvodu (BDP) u iznosu od

9,4 milijardi dolara u 2017. godini (Statistics Canada, 2017b; Statistics Canada, 2017c). Broj

1 Sjedinjene Američke Države (USA) preuzeta skraćenica iz engleskg jezika ‘the United States of America“.

Master rad Tanja Armenski

12

zaposlenih u avio sektoru iznosio je 217,1 hiljada u 2017, odnosno 63% od ukupnog broja

zaposlenih u saobraćajnom sektoru (Statistics Canada, 2017c).

Broj putnika u međunarodnom avio saobraćaju u Srbiji je porastao sa 2,5 miliona u 2007. godini

na 6,0 miliona putnika na odlaznim i dolaznim letovima u 2017. godini. Iste godine, delatnosti

saobraćaja i skladištenja2 su doprinele 4% u ukupnom bruto nacionalnom proizvodu u iznosu

od 179.530,1 miliona RSD dinara. U sektoru saobraćaja zaposleno je 132,0 hiljade lica, odnosno

5% od ukupnog broja zaposlenih u 2017. godini (Statistički godišnjak, 2017).

1.2. Ciljevi istraživanja

Ovaj rad ima cilj da prognozira kapacitet putnika u međunarodnom avio saobraćaju evaluacijom

različitih modela vremenskih serija. S obzirom da je avio saobraćaj povezan sa ekonomijom,

očekuje se da će serija podataka pokazivati ciklične obrasce ili sezonsko varijacije.

Pored toga, pošto je svaka ekonomija podložna uticajima iz okruženja različite prirode kao što

su politički, klimatski, itd. očekuje se da će serije vremenskih podataka sadržati nestandardne

opservacije koje predstavljaju izvore varijacija u podacima. Primera radi, politički događaji kao

što su inicijative Vlade USA za povećanje bezbednosti i sigurnosti granica sa Kanadom nakom

terorističkog napada 2001. godine i kasnije ekonomska recesija u Kanadi 2008/2009. godine su

značajno uticali na smanjenje broja putnika u međunarodnom saobraćaju (Baggs i sar., 2015).

Slično, Srbiju nakon 2007. godine karakteriše promenljiva politička i tržišna situacija. Kuljanin

i Kalić (2015) sugerišu da je bolja politička situacija, delimično otvaranje avio tržišta, ulazak

nisko-budžetnih avio kompanija na srpsko avio tržište uticala na pozitivni trend broja putnika u

međunarodnom avio saobraćaju.

2 Delatnosti saobraćaja i skladištenja obuhvataju: kopneni saobraćaj i cevovodni transport, vodeni saobraćaj,

vazdušni saobraćaj, skladištenje i prateće aktivnosti u saobraćaju, kao i poštanske aktivnosti. Bruto dodata vrednost

po delatnostima u tekućim cenama (mil RSD) dostupna je u tabeli “Bruto dodata vrednost po delatnostima i bruto

domaći proizvod”, Statistički godišnjak, Republički zavod za statistiku R. Srbije, 2017.

Master rad Tanja Armenski

13

Za predviđanje broja putnika u međunarodnom avio saobraćaju u literaturi se najčešće

primenjuju modeli vremenskih serija zasnovani na Box-Jenkis metodi u klasi ARIMA modela

(Gunter, Onder, 2015). Međutim, ove studije pokazuju da performanse predviđanja različitih

modela variraju u zavisnosti od frekvencije podataka (dnevni, mesečni, kvartalni, godišnji),

porekla zemlje putnika, zemlje destinacije putnika, dužine prognoze (kratkoročne, dugoročne

prognoze) itd. (Chu, 2009). Takođe, nijedan metodološki pristup nije pokazao stabilne i

precizne performanse u smislu prognoziranja izvan ispitivanog uzorka (Shen i sar., 2011).

Poslednjih godina, predviđanje kapaciteta saobraćaja naprednim tehnikama kao što su mašinsko

učenje i veštačka inteligencija postaje popularno u oblasti turizma, ali su ove tehnike još u

eksperimentalnoj fazi učenja i nadgledanja u učenju (Claveria i sar., 2016; Ganga i sar., 2018).

U ovom radu će biti analizirani različiti modeli vremenskih serija, kao što su Holt-Vinters

eksponencijalno izravnavanje, autoregresivne procese pokretnih proseka (ARMA)3,

autoregresivne integrisane procese pokretnih proseka (ARIMA)4 i sezonske autoregresivne

integrisane procese pokretnih proseka (SARIMA)5 sa ciljem da se utvrdi koja metoda je

najpreciznija u predviđanju broja putnika u međunarodnom avio saobraćaju na primeru Kanade

i Srbije.

Cilj master rada je da odgovi na sledeća istraživačka pitanja:

1) Da li serije međunarodnog avio saobraćaja na primeru Kanade i Srbije imaju slične

statističke osobine, odnosno trend, ciklične obrasce, stacionarnost i varijabilitet ili se

ove karakteristike znatno razlikuju?

2) Koji faktori iz geopolitičkog, ekonomskog okruženja su značajno modifikovali ili

varirali ispitivane serije podataka u periodu 2007-2017. godine?

3) Koji modeli vremenskih serija su najprecizniji u prognozi kapaciteta dolazećeg i

odlazećeg međunarodnog avio saobraćaja na primerima Kanade i Srbije?

3 Straćenica za autoregresivne procese pokretnih proseka (ARMA) preuzeta je iz engleskog jezika “Autoregressive

moving average“. 4 Straćenica za autoregresivne integrisane procese pokretnih proseka (ARIMA) preuzeta je iz engleskog jezika

“Autoregressive integrated moving average“. 5 Straćenica za sezonske autoregresivne integrisane procese pokretnih proseka (SARIMA) preuzeta je iz engleskog

jezika “Seasonal autoregressive integrated moving average“.

Master rad Tanja Armenski

14

Rad je organizovan po sledećim poglavljima. U prvom delu rada predstavljen je problem

istraživanja, postavljeni su ciljevi istraživanja i istraživačka pitanja. U drugom delu rada

prikazani su rezultati sličnih relevantnih istraživanja i predstavljene su teorijske osnove modela

vremenskih serija analiziranih u radu. Metodologija istraživanja predstavljena je u trećem

poglavlju. U četvrtom delu rada, uz korišćenje teorijskih pojmova obrađenih u prethodnim

poglavljima, objašnjen je način izbora odgovarajućih modela u praksi na primerima vazdušnog

putničkog saobraćaja u Kanadi i Srbiji. Zaključci i diskusija istraživanja, kao i ograničenja

analiziranih modela vremenskih serija u prognozi kapaciteta međunarodnog avio saobraćaja,

predstavljeni su u petom delu rad.

Master rad Tanja Armenski

15

2. Pregled literature

Postoji veliki broj studija koje se fokusiraju na predviđanje broja putnika u međunarodnom

saobraćaju. Radovi iz oblasti turizma se uglavnom fokusiraju na procenu i prognozu

međunarodnih turističkih dolazaka u Evropu (Hassani i sar., 2017; Yılmaz, 2015; Gunter, U.,

Önder, 2015), Aziju (Kumar, Šarma, 2016; Nai i sar, 2017) i u Severnu Ameriku (Gil-Alana,

Barros, Assaf, 2012; Bao, Xiong, Hu, 2012).

Na primeru Kanade, urađene je nekoliko studija evaluacije performansi vremenskih serija i

preciznosti predviđanja broja putnika u avio saobraćaju (Bougas, 2013; Rodríguez, 2003).

Autor Bougas (2013) je ispitivao preciznost različitih modela vremenskih serija u kratkoročnim

i srednjoročnim prognozama broja putnika u avionskom saobraćaju u Kanadi u periodu od

januara 1988 do decembra 2008. Autor je analizirao nekoliko osnovnih modela vremenskih

serija kao što su harmonična regresija, Holt-Vinters eksponencijalno izravnavanje, ARIMA,

SARIMA i kombinovanih tehnika na tri tipa podataka: broju putnika u domaćem avio saobraćaju,

prekograničnom avio saobraćaju sa USA-om i na međunarodnim letovima. Za procenu

preciznosti prognoza korišćeni su parametri: srednja apsolutna greška u procentima (MAPE)6 i

koren srednje kvadratne greške u procentima (RMSPE)7.

Rezultati studije pokazuju da su modeli ARIMA i SARIMA precizniji od harmonične regresije

na sva tri tipa ispitivanih podataka. ARIMA, SARIMA i harmonična regresija su davali preciznije

estimacije od Holt-Vinters eksponencijalnog izravnavanja. Kombinacije osnovnih modela sa

tehnikama jednostavnog uprošćavanja i varijansno-kovarijansnim opterećenjima u optimaziciji

vremenskih serija pokazuju bolje predikcione sposobnosti na sva tri tipa ispitivanih podataka i

u slučaju svih ispitivanih modela vremenskih serija. ARIMA je pokazala dobre performanse u

kratkoročnim prognozama do jednog tromesečja, a kombinovani modeli su davali preciznije

mere u dugoročnim prognozama.

6 Skraćenica za apsolutnu grešku reziduala u procentima (MAPE) preuzeta je iz engleskog jezika “Mean absolute

percentage error”. 7 Skraćenica za koren srednje kvadratne greške u procentima (RMSPE) preuzeta je iz engleskog jezika “Root Mean

Square Percentage Error”.

Master rad Tanja Armenski

16

Studija Kulendran i Witt (2003) pokazuju da je ARIMA model precizniji od modela

jednostavnog eksponenciajlnog izravnavanja8 u srednjoročnim prognozama od četiri do šest

kvartala unapred. Kulendran i Witt (2003) su došli do ovog zaključka na kvartalnim podacima

međunarodnih dolazaka avionom iz Japana, Novog Zelanda, Velike Britanije i USA-a u

Australiju u periodu 1998-2002. Slične rezultate, odnosno bolje prediktivne sposobnosti ARIMA

modela u kratkoročnim predikcijama u odnosu na model jednostavnog eksponenciajlnog

izravnavanja i naivni model9 sugerisali su autori Kulendran i Shan (2002) koji su sproveli

istraživanje na mesečnim podacima turističkih dolazaka u Kinu u periodu 1995-2005. Du Preez

i Witt (2003) su takođe došli do rezultata da su univarijantni modeli klase ARIMA davali

preciznije prognoze u odnosu na druge modele tipa BSM na podacima broja turističkih dolazaka

na Sejšele na mesečnim podacima u periodu 1995-2003.

Na primeru Srbije, postoji mali broj studija koje se bave ocenama performansi modela

vremenskih serija u predviđanju broja putnika u međunarodnom saobraćaju. Značajna

istraživanja su obavili autori Milenković i sar. (2015), ali na vremenskim serijama broja putnika

u železničkom saobraćaju. Ovi autori su primenili sezonski model eksponencijalnog

izravnavanja (SES) i SARIMA model na mesečnim podacima putnika u železničkom sabraćaju

od januara 2004 do juna 2014. Autori su došli do zaključka da je SARIMA tipa (0,1,0)(0,1,1)12

davala najpreciznije predikcije (u daljem tekstu je objašnjena notacija ovog modela).

Kalić, Dožic, Babić (2011) su se bavili predikcijom broja inostranih avio dolazaka u avio

saobraćaju u Srbiju, ali samo primenom multivarijantne linearne regresije sa regresorima GDP

i ukupnog broja putnika registrovanih na aerodromu Nikola Tesla, Beograd u period od 2001.

do 2010. godine. Serija podataka nije tretirana modelima vremenskih serija.

8 Kod modela jednostavnog eksponencijalnog izravnavanje prognozirana vrednost za period 𝑡(𝑡) je ponderisani

prosek tekuće vrednosti serije za period 𝑡(𝑋𝑡) i prognozirane vrednosti za period 𝑡 − 1 (𝑡−1). Ako je ponder 𝛼

broj iz intervala (0,1), koji se naziva konstanta izravnavanja, tada je: 𝑡 = 𝛼𝑋𝑡 + (1 − 𝛼)𝑡−1. Jednostavno

eksponencijalno izravnavanje pokazuje dobre rezultate kada se koristi kod vremenskih serija koje nemaju trend ni

komponente sezonskih ili cikličnih fluktuacija (više informacija kod Mladenović i Nojković (2012)). 9 Naivni modeli je najjednostavniji model prognoze koji pretpostavlja da je vrednost prognoze za period 𝑡(𝑡)

jednak stvarnoj vrednosti poslednjeg perioda 𝑡 − 1(𝑋𝑡−1): 𝑡=𝑋𝑡−1 Ovaj model se obično koristi kao osnovni

model za poređenje sa drugim kompleksnijim modelima (više informacija kod Mladenović i Nojković (2012)).

Master rad Tanja Armenski

17

Na primeru Makedonije, zemlje iz neposrednog okruženja, Petrovska (2017) je analizirala

preciznost nekoliko modela vremenskih serija koji se zasnivaju na Box–Jenkins metodologiji,

iz kategorije ARIMA modela na godišnjim podacima broja međunarodnih dolazaka u avio

saobraćaju Makedonije u periodu 1956–2013. Rezultati su pokazali da 𝐴𝑅𝐼𝑀𝐴 (1,1,1) model

daje najpreciznije prognoze (u daljem tekstu je objašnjena notacija modela).

Studije novijeg datuma, kao što je studija Hassani i sar. (2017) je procenjivao devet alternativnih

parametarskih i neparametrijskih modela na podacima međunarodnih dolazaka putnika

avionom u devet evropskih zemalja, Nemačka, Grčka, Španija, Kipar, Holandija, Austrija,

Portugal, Švedska i Velika Britanija, u periodu od januara 2000. do decembra 2013. godine. Ovi

autori si došli do rezultata da je ARIMA najpogodniji model za estimaciju i predikciju

međunarodnih dolazaka u avio saobraćaju ispitivanih Evropskih zemalja. Kumar i Šarma (2016)

uspešno su prognozirali dolaske turista u Singapur prema modelu SARIMA na mesečnim

podacima od januara 2003 do decembra 2013. Autor, Yılmaz (2015) je takođe na primeru

međunarodnih putničkih dolazaka u Tursku na mesečnim podacima u periodu januara 2002. do

decembra 2013. godine sugerisao da je SARIMA davala najpreciznije estimacije i imala uspešan

učinak u prognozi ukupnih putničkih dolazaka.

Master rad Tanja Armenski

18

3. Stohastički procesi i vremenske serije

3.1. Stohastički procesi

Vremenska serija predstavlja niz slučajnih veličina koje su uređene u odnosu na vreme. Slučajna

promenljiva je statistički pojam, dok je u analizi vremenskih serija upravo od interesa opisati

promene slučajnih promenljivih u vremenu. Do pojma slučajnog procesa dolazi se

proširivanjem pojma slučajnog elementa. Slučajni element je funkcija koja kao rezultat daje

moguće ishode slučajnog eksperimenta. Ako se slučajni element posmatra u zavisnosti od

vremena onda on postaje i funkcija vremena.

U opštem slučaju, slučajni element ne zavisi od vremena. Međutim, mnoge pojave i događaji

čiji su ishodi neizvesni, a koji se odvijaju u vremenu zahtevaju da se pojam slučajnog elementa

uopšti tako da se uključi i vremenska komponenta 𝑡. Posmatrajući familiju slučajnih elemenata

koji zavise od vremena dolazi se do definicije stohastičkog ili slučajnog procesa (Rajter-Ćirić,

2009; Mladenović, Nojković, 2012):

Definicija: Neka je (Ω, Ƒ, 𝑃) prostor verovatnoće, preslikavanje 𝑋: Ω → ℝ se zove slučajna

promenljiva ako važi 𝑋(−1)(𝐵) ∈ Ƒ10. Familija slučajnih promenljivih 𝑋𝑡(ω): 𝑡 ∈ 𝑇, ω ∈ Ω

definisanih nad istim prostorom verovatnoće (Ω, Ƒ, 𝑃 ) se zove stohastički (slučajni) proces sa

indeksnim skupom 𝑇.

Stohastički proces zavisi od dve promenljive 𝑡 i ω. Za fiksirano 𝑡0 ∈ 𝑇, funkcija 𝑋𝑡0 (ω) je

jedna slučajna promenljiva koja se naziva zasek. Za fiksirano ω0 ∈ Ω, funkcija 𝑋𝑡(ω0) je

funkcija definisana na skupu 𝑇 koja se naziva realizacija ili trajektorija slučajnog procesa.

Za fiksirane obe vrednosti 𝑡0 ∈ 𝑇 i ω0 ∈ Ω, funkcija 𝑋𝑡0(ω0) predstavlja realan broj ili jednu

realizaciju stohastičkog procesa. U tom kontekstu, vremenska serija (𝑡) je realizacija familije

slučajnih promenljivih koja se zove stohastički proces, u kraćem zapisu 𝑋𝑡: 𝑡 ∈ 𝑇.

10 gde je 𝐵 Borelova 𝛿-algebra za 𝑋 tada kažemo da je Ƒ merljivo (više u knjizi Rajter-Ćirić, 2009)

Master rad Tanja Armenski

19

Skup 𝑇 iz prethodne definicije određuje tip slučajnog procesa. Ako je skup 𝑇 neki interval iz

skupa ℝ, onda se parametar 𝑡 ∈ 𝑇 najčešće interpretira kao vreme, pa je slučajan proces 𝑋𝑡, 𝑡 ∈

𝑇 slučajan proces sa neprekidnim vremenom. Ako je skup 𝑇 neki podskup skupa celih brojeva

ℤ, onda je slučajan proces 𝑋𝑡, 𝑡 ∈ 𝑇 slučajan proces sa diskretnim vremenom ili slučajni niz.

U ovom radu razmatraće se diskretni slučajni procesi.

Struktura zavisnosti stohostičkog procesa može se opisati formiranjem funkcije raspodele

stohastičkog procesa.

𝐹𝑡(𝑥) = 𝑃𝑋𝑡 ≤ 𝑥 = 𝑃𝜔 ∊ Ω: 𝑋𝑡(𝜔) < 𝑥

U opštem slučaju neophodno je znati i raspodele višedimenzionalnih slučajnih promenljivih.

Neka je fiksirano 𝑛 vremenskih trenutaka 𝑡1, 𝑡2, . . . , 𝑡𝑛. Svakom od tih trenutaka odgovara po

jedna slučajna promenljiva. Tako se dobija 𝑛 slučajnih promenljivih 𝑋𝑡1, 𝑋𝑡2, . . . , 𝑋𝑡𝑛 koje se

mogu posmatrati kao koordinate nekog konačno-dimenzionalnog slučajnog vektora

(𝑋𝑡1, 𝑋𝑡2, . . . , 𝑋𝑡𝑛). Raspodelu konačno-dimenzionalnog vektora definiše naredna definicija.

Definicija: Za svaki prirodan broj 𝑛 i proizvoljne elemente 𝑡1, 𝑡2, . . . , 𝑡𝑛 ∈ 𝑇, t1 < t2 < ⋯ <

tn, familija konačno-dimenzionalnih raspodela slučajnog vektora (𝑋𝑡1, 𝑋𝑡2, . . . , 𝑋𝑡𝑛) je familija

funkcija raspodela definisanih sa:

𝐹𝑡(𝑥)𝑃 = 𝑋𝑡1 ≤ 𝑥1, 𝑋𝑡2 ≤ 𝑥2, … , 𝑋𝑡𝑛 ≤ 𝑥𝑛, (𝑥1, 𝑥2, . . . , 𝑥𝑛) ∈ ℝ𝑛,

Sistem funkcija raspodele zadovoljava uslove simetrije i saglasnosti ako:

Uslov simetrije: ako je 𝑖1, 𝑖2, . . . , 𝑖𝑛 jedna permutacija brojeva od 1 do 𝑛, tada važi:

𝐹𝑡𝑖1 ,...,𝑡𝑖𝑛(𝑥𝑖1

, . . . , 𝑥𝑖𝑛) = 𝐹𝑡1,...,𝑡𝑛

(𝑥1, . . . , 𝑥𝑛)

Uslov saglasnosti: ako je 𝑚 < 𝑛 za proizvoljne 𝑡𝑚+1, . . . , 𝑡𝑛 ∈ 𝑇, tada važi:

𝐹𝑡1,...,𝑡𝑚, 𝑡𝑚+1..., 𝑡𝑛(𝑥1, . . . , 𝑥𝑚, ∞. . . , ∞) = 𝐹𝑡1,...,𝑡𝑚

(𝑥1, . . . , 𝑥𝑚)

Znači da je na osnovu konačnog skupa slučajnih promenljivih 𝑋𝑡1, … , 𝑋𝑡𝑛

dobijenih iz

stohastičkog procesa 𝑋𝑡, 𝑡 ∈ 𝑇 moguće potpuno opisati strukturu zavisnosti na osnovu

Master rad Tanja Armenski

20

funkcije raspodele, u kraćem zapisu F(𝑋𝑡1, … . , 𝑋𝑡𝑛). Zavisnost ove funkcije raspodele i njenih

parametara od vremena nazivamo vremenskom heterogenošću. Ona stvara poteškoće u

modelovanju realnih pojava, jer za svako 𝑡 obično postoji samo jedna observacija, stoga se u

radu ograničavamo na klasu stacionarnih procesa koju karakteriše vremenska homogenost.

Teorema: (Kolmogorova) Za svaku familiju funkcija raspodele koje zadovoljavaju uslove

simetrije i kompatibilnosti postoji prostor verovatnoća (Ω, Ƒ, 𝑃 ) i stohastički proces 𝑋𝑡, ∈ 𝑇

definisan na njemu koji ima date raspodele kao svoje konačno – dimenzionalne raspodele. Tada

za 𝑋𝑡, ∈ 𝑇 stohastički proces važi:

1. Srednja vrednost slučajnog procesa: 𝐸(𝑋𝑡) = 𝜇𝑡, 𝑡 ∈ 𝑇

2. Varijansa slučajnog procesa: Var(𝑋𝑡) = 𝜎𝑡2 = E(𝑋𝑡 − 𝜇𝑡)2, t ∈ T

3. Kovarijansa slučajnog procesa: 𝛾(𝑟,𝑠) = 𝑐𝑜𝑣(𝑋𝑟 , 𝑋𝑠) = 𝐸((𝑋𝑟 − 𝐸(𝑋𝑟))(𝑋𝑠 −

𝐸(𝑋𝑠))), 𝑟, 𝑠 ∈ 𝑇

4. Korelacija slučajnog procesa između 𝑋𝑟 i 𝑋𝑠: 𝜌((𝑟,𝑠)) =𝐶𝑜𝑣(𝑋𝑟𝑋𝑠)

√𝑉𝑎𝑟(𝑋𝑟)𝑉𝑎𝑟(𝑋𝑠), 𝑟, 𝑠 ∈ 𝑇.

Još jedna važna osobina slučajnih procesa jeste njihova stacionarnost.

Definicija: Slučajni proces 𝑋𝑡, 𝑡 ∈ 𝑇 je strogo stacionaran (neizmenjen) ako su njegove

konačno-dimenzionirane funkcije raspodele invarijantne u odnosu na 𝑡, odnosno ako za 𝑡𝑖, 𝑡𝑖 +

𝑡 ∈ 𝑇, 𝑖 = 1,2, . ..

𝐹𝑡1,…,𝑡𝑛(𝑥1, … , 𝑥𝑛) = 𝐹𝑡1+𝑡,…,𝑡𝑛+𝑡

(𝑥1, … , 𝑥𝑛)

Znači da je konačno-dimenzionirana funkcija raspodele slučajnog procesa invarijantna u

odnosu na translaciju u vremenu za proizvoljno 𝑡. Ako je 𝑋𝑡, 𝑡 ∈ 𝑇 strogo stacionaran slučajni

proces sa 𝐸(|𝑋𝑡|) < ∞, tada je očekivana vrednost od 𝑋𝑡 konstantna za svako 𝑡 ∈ 𝑇 pošto je

funkcija raspodele ista za svako 𝑡 ∈ 𝑇. Slično, ako je 𝐸(𝑋𝑡) < ∞, tada je varijansa od 𝑋𝑡

konstanta za svako 𝑡 ∈ 𝑇.

Stroga stacionarnost nekog slučajnog procesa podrazumeva da raspodela verovatnoća

proizvoljno izabranog slučajnog vektora sa određenim brojem komponenata ne zavisi od

Master rad Tanja Armenski

21

pomeranja na vremenskoj osi. Taj uslov je prilično strog i teško se ispituje, pa se pri analizi

slučajnih procesa ispituje samo slaba stacionarnost. U nastavku će se koristiti termin

stacionarnost kada se govori o slaboj stacionarnosti:

Definicija: Slaba stacionarnost 𝑋𝑡, 𝑡 ∈ 𝑇 je stacionarnost 𝑚-tog reda ako za ma koji podskup

(𝑡1, 𝑡2 … . , 𝑡𝑛) ∈ 𝑇 i ma koje 𝑘 ∈ 𝑇, funkcija F(𝑋𝑡1, … . , 𝑋𝑡𝑛) je 𝑚-tog reda i momenti združenih

promenljivih 𝑋𝑡1+𝑘, … , 𝑋𝑡𝑛+𝑘 , tada važi:

𝐸 = [(𝑋𝑡1)

𝑚1 (𝑋𝑡2

)𝑚2

, … , (𝑋𝑡𝑛)

𝑚𝑛] = 𝐸[(𝑋𝑡1+𝑘

)𝑚1

(𝑋𝑡2+𝑘)

𝑚2, … , (𝑋𝑡𝑛+𝑘

)𝑚𝑛

]

gde je 𝑚1 + 𝑚2, … , + 𝑚𝑛 ≤ 𝑚.

Proces je stacionaran 𝑚-tog reda ako postoje svi njegovi momenti 𝑚-tog reda koji ne zavise od

početnog vremenskog trenutka. Primera radi, slaba stacionarnost drugog reda podrazumeva da

proces ima konstantnu sredinu i varijansu, a da su kovarijansna i korelaciona funkcija zavisne

od vremenskog intervala.

Slabo stacionaran stohastički proces 𝑋𝑡, 𝑡 ∈ 𝑇 ispunjava sledeće uslove:

𝐸(𝑋𝑡) = µ = 𝑐𝑜𝑛𝑡. ,⩝ 𝑡 ∈ 𝑇

𝐸(𝑋𝑡2) < ∞, ⩝ 𝑡 ∈ 𝑇

𝛾(𝑋𝑡,𝑋𝑠) = 𝛾(𝑋𝑡+𝑟𝑋𝑠+𝑟), ⩝ 𝑡, 𝑠, 𝑟 ∈ 𝑇.

Poslednji uslov podrazumeva da je kovarijansa slabo stacionarnog slučajnog procesa funkcija

vremenske udaljenosti slučajnih promenljivih, tj. ona ne zavisi od trenutka u kojem se

posmatraju slučajne veličine, već zavisi samo do njihovog međusobnog rastojanja u vremenu.

Još jedna važna klasa slučajnih procesa su normalni ili Gausovski procesi kod kojih je združen

zakon verovatnoće normalan. U ovom radu, ako drugačije nije navedeno, razmatraju se

normalni procesi.

Master rad Tanja Armenski

22

3.2. Autokovarijansa i autokorelaciona funkcija stacionarnog stohastičkog

procesa

Pri definisanju slabo stacionarnih slučajnih procesa ključne veličine za definisanje slučajnih

procesa su autokovarijansa i autokorelaciona funkcija. Kovarijansna i korelaciona funkcija

stohastičkog procesa 𝑋𝑡, 𝑡 ∈ T između dva trenutka 𝑋𝑡, 𝑋𝑡−𝑘 je definisana sa:

1. Kovarijansna funkcija: 𝛾𝑘 = 𝐶𝑜𝑣(𝑋𝑡 , 𝑋𝑡−𝑘) =E((Xt − 𝐸(𝑋𝑡))(𝑋𝑡−𝑘 − 𝐸(𝑋𝑡−𝑘))), t ∈ 𝑇,

k ∈ ℤ

2. Korelaciona funkcija: 𝜌𝑘 =𝐶𝑜𝑣(𝑋𝑡𝑋𝑡−𝑘)

√𝑉𝑎𝑟(𝑋𝑡)𝑉𝑎𝑟(𝑋𝑡−𝑘)=

𝛾𝑘

𝛾0, 𝑡 ∈ 𝑇, 𝑘 ∈ ℤ

gde je 𝑉𝑎𝑟(𝑋𝑡) = 𝑉𝑎𝑟(𝑋𝑡+𝑘) = 𝛾0

Ako su 𝛾𝑘 i 𝜌𝑘 za 𝑘 iz skupa celih brojeva (𝑘 ∈ ℤ) autokovarijansa i autokorelaciona funkcija

slabo stacionarnog procesa, tada važi:

1. 𝛾0 = 𝑉𝑎𝑟(𝑋𝑡) ≥ 0, 𝜌0 = 1

2. 𝛾𝑘 = 𝛾−𝑘, 𝜌𝑘 = 𝜌−𝑘

3. [𝛾𝑘]≤ 𝛾0, [𝜌𝑘]≤ 1

Drugi uslov proizilazi iz osobine simetrije pa su autokovarijansna i autokorelaciona funkcija

parne funkcije docnje 𝑘. Zbog ove simetrije, autokorelacione funkcije se izračunavaju i grafički

prikazuju samo za nenegativne docnje (Kovačić, 1995). Da bi neke funkcije bile

autokovarijansne i autokorelacione funkcije nekog stacionarnog slučajnog procesa one moraju

biti pozitivno semidefinisane.

3.3. Vremenske serije

Definicija:Vremenska serija je jedna realizacija stohastičkog procesa.

Neka je data jedna realizacija slučajnog procesa (X1, … , Xn,), odnosno vremenska serija. Da bi

se na osnovu jedne realizacije slučajnog procesa moglo zaključivati o karakteristikama tih

Master rad Tanja Armenski

23

procesa, kao što je srednja vrednost, varijansa i kovarijansa, potrebno je pored stacionarnosti

vremenske serije zadovoljiti još jedan zahtev u pogledu memorije procesa.

Zahtev da je vremenska serija ergodična znači da uzorački momenti koji su izračunati na osnovu

jedne realizacije srednje kvadratno konvergiraju ka odgovarajućim momentima populacije kada

𝑛 → ∞. U analizi vremenskih serija je od najvećeg značaja da momenti prvog i drugog reda za

jednu realizaciju procesa konvergiraju ka odgovarajućim prvim i drugim momentima populacije

stohastičkog procesa kada se obim uzorka povećava, odnosno da je ispunjeno:

lim𝑛→∞

𝐸 [(1

n∑ Xi − µ𝑛

𝑖=1 )2

] = 0,

lim𝑛→∞

𝐸 [(1

n∑(Xi − µ)2 − 𝜎2

𝑛

𝑖=1

)

2

] = 0

Ergodičnost se može posmatrati kao uslov koji osigurava da će memorija procesa merena

𝛾𝑘 slabiti uprošćavanjem tokom vremena. On je uveden da bi se omogućilo modelovanje

vremenske zavisne slučajnog procesa korišćenjem konačnog skupa parametara. U praksi, uslov

ergodičnosti je ispunjen u većini stacionarnih procesa. Uz uslov ergodičnosti vremenski prosek

je nepristrasna ocena populacione sredine i ocena kovarijacione funkcije je konzistentna ocena

populacione kovarijacione funkcije.

Uz zadovoljene pretpostavke stacionarnosti i ergodičnosti, na osnovu jedne realizacije

slučajnog procesa (X1, … , Xn,), mogu se odrediti sledeće uzoračke ocene:

1. =1

𝑛∑ 𝑋𝑡

𝑛𝑡=1

2. 𝑉𝑎(𝑋𝑡) =1

𝑛∑ (𝑋𝑡 − )2𝑛

𝑡=1

3. 𝛾𝑘 =1

𝑛∑ (𝑋𝑡 − )𝑛

𝑡=𝑘+1 (𝑋𝑡−𝑘 − )

4. 𝑘 =𝑘

0=

∑ (𝑋𝑡−)𝑛𝑡=𝑘+1 (𝑋𝑡−𝑘−)

∑ (𝑋𝑡−)2𝑛𝑡=𝑘+1

Master rad Tanja Armenski

24

Za uzoračke ocene 𝛾𝑘 i 𝑘 je zadovoljen uslov da su determinante njihovih matrica nenegativno

definisane. Box i Jenkins (1976) su predložili da se u praksi ne izračunava više od 𝑛

4

autokorelacionih koeficijenata, gde je 𝑛 obim uzorka, kada postoji mnogo parova (𝑋𝑡,𝑋𝑡−𝑘).

3.4. Osnovne komponente vremenskih serija

„Vremenska serija predstavlja uređeni niz vrednosti neke pojave, tj. niz vrednosti procesa koji

generiše neku pojavu u vremenu, a koje su složene u hronološkom redosledu u sukcesivnim,

jednakim vremenskim intervalima“ (Kovačić, 1998; Hassler i sar., 2013). Svaka vremenska

serija se može razložiti na njene osnovne komponente:

- Trend 𝑓(𝑡) predstavlja dugoročnu pravilnost u kretanju vremenske serije. U zavisnosti

od toga da li vrednosti vremenske serije tokom vremena sistematski opadaju ili rastu

trend može biti opadajući ili rastući“ (Kovačić, 1995)11. Takođe, trend može biti

deterministički ili stohastički, u zavisnosi od toga da li se promene serije tokom vremena

mogu predvideti ili ne, odnosno da li se promene serije mogu aproksimirati nekom

determinističkom funkcijom ili se one dešavaju slučajno (Montgomery i sar. 2008).

- Sezonska komponenta 𝑠(𝑡) predstavlja pravilnost u kretanju serije, koja se pojavljuje u

toku jedne kalendarske godine. Do sezonskih oscilacija dolazi usled promene u

različitim vremenskim uslovima, kao sto su klimatski (leto ili zima) ili kalendarski

faktori (državni praznici, broj vikenda u mesecu itd.).

- Ciklična komponenta 𝑐(𝑡) predstavlja pravilnost u kretanju serije koja se pojavljuje u

određenim cikličnim, često nejednakim, periodima većim od jedne kalendarske godine.

- Slučajne komponente 휀(𝑡) su promene u kretanju vremenske serije slučajnog karaktera.

Nestandardne opservacije u vremenskoj seriji se pojavljuju, na primer, usled obustave

avio saobraćaja zbog vremenskih nepogoda, saobraćajnih nezgoda koje bi usporile ili

prekinule saobraćajni avio tok itd.

11 Kovačić (1995) opisuje neke karakteristične tipove trenda: (1) serije sa jednokratnom intervencijom; (2) sa

stepenastom intervencijom; (3) serija sa rampom; (4) serija sa nestandardnom opservacijom. Za detaljniji pregled

tipova trendova pogledati Kovačić (1995) i Mladenović, Nojković (2012).

Master rad Tanja Armenski

25

U slučaju kada vremenska serija sadrži sve četiri osnovne komponente, postoje tri opšta modela

kojima se može opisati vremenska serija:

1. Aditivni model pretpostavlja da se sve komponente ponašaju nezavisno jedna od druge.

Odnosno, povećanje jedne od komponenti ne izaziva povećanje ili smanjenje neke druge

komponente. Aditivni model se koristi ako su sezonska, ciklična i slučajna komponenta

nezavisne od kretanja trenda:

𝑋𝑡 = 𝑓(𝑡) + 𝑠(𝑡) + 𝑐(𝑡) + ɛ(𝑡)

2. Multiplikativni model pretpostavlja da su sve komponente međusobno zavisne. Primera radi,

ako trend serije raste, varijansa izazvana sezonom, ciklusom ili slučajnim kretanjem će takođe

rasti:

𝑋𝑡 = 𝑓(𝑡) · 𝑠(𝑡) · 𝑐(𝑡) · ɛ(𝑡)

3. Mešoviti model predstavlja kombinaciju aditivnog i multiplikativnog modela. U njemu se

pretpostavlja da su sezonska i slučajna komponenta zavisne od ciklične komponente i trenda,

ali da su one međusobno nezavisne:

𝑋𝑡 = 𝑓(𝑡) · 𝑐(𝑡) · (𝑠(𝑡) + ɛ(𝑡) − 1)

Druga svojstva vremenskih serija se mogu opisati klasifikacijom vremenskih serija u odnosu na

različite kriterijume. U zavisnosti od toga kako se registruju vrednosti u vremenskim serijama

razlikuju se neprekidne i diskrente (prekidne) vremenske serije. Kod neprekidnih vremenskih

serija vrednosti se mogu registrovati u bilo kom vremenskom trenutku dok se kod diskretnih

serija vrednosti beleže u istim, jednakim vremenskim intervalima (sat, dan, nedelja, mesec,

godina, itd.). Vremenske serije se još mogu podeliti i na stacionarne i nestacionarne vremenske

serije u zavisnosti da li se prosečne vrednosti serija menjaju ili ne menjaju tokom vremena.

Stacionarna sredina procesa, odnosno konstantan prosečni nivo (𝜇𝑡) oko kog se kreću slučajne

fluktuacije, omogućava lakše i preciznije predviđanje budućih vrednosti vremenskih serija.

Najveći broj vremenskih serija ne zadovoljava uslov stacionarnosti, što dalje zahteva

transformaciju vremenskih serija u cilju njene stabilizacije. Takođe, postoje modeli kojima se

predviđaju nestacionarni linerni procesi među kojima je i ARIMA.

Master rad Tanja Armenski

26

4. Strukturni modeli vremenskih serija

U vremenskih serija obično su prisutna kolebanja individualnih vrednosti opservacija u seriji.

Ta kolebanja, frekvencije, znatno otežati uočavanje osnovnih tendencija razvoja posmatrane

serije stoga je potrebno kolebanja individualnih vrednosti serije svesti na što manju meru,

izravnavanjem serije. Vremenska serija se izravnava prilagođavanjem linije trenda svim

opservacijama serije i ta prilagođena linija trenda predstavlja ocenu glatkog kretanja serije, a

razlike između opservacija vremenske serije i ocenjenog trenda su reziduali.

U ovoj metodi polazi se od pretpostavke da je važnost podataka u seriji obrnuto proporcionalna

sa njihovom starošću stoga se seriji pridružuju vrednosti pondera koji opadaju po geometrijskoj

progresiji sa starošću. Prema karakteristikama vremenske serije koja se ispituje, kao što je

prisustvo i tip trenda i sezonski karakter, biraju se odgovarajući metode izravnavanja. Postoje

tri osnovna tipa eksponencijalnog izravnavanja: jednostavno izravnavanje, dvostruko

izravnavanje i trostruko eksponencijalno izravnavanje12. Ovaj rad se fokusira na Holt-Winter-

ovoj metodi trostrukog eksponencijalnog izravnavanja.

4.1. Holt-Winter-ov metod eksponencijalnog izravnavanja

Holt-Winter-ov metod trostrukog eksponencijalnog izravnavanja se koristi za modelovanje

vremenskih serija koje nemaju konstantan srednji nivo (𝜇𝑡) oko kog se kreću slučajne

fluktuacije, a imaju trend (𝑓𝑡), sezonu (𝑠𝑡) i slučajnu komponentu (휀𝑡) za koju važe sledeći

uslovi:

𝐸(ɛ𝑡) = 0, ⩝ 𝑡

𝑉𝑎𝑟 (ɛ𝑡) = 𝜎ɛ2, ⩝ 𝑡

𝐶𝑜𝑣(ɛ𝑡, ɛ𝑠) = 0, ⩝ 𝑡, ⩝ 𝑠, 𝑡 ≠ 𝑠.

12 Za više informacija o jednostrukom i dvostrukom metodu izravnavanja pogledati Mladenović i Nojković (2012).

Master rad Tanja Armenski

27

U zavisnosti od tipa sezonske komponente, aditivne ili multiplikativne, mogu se primeniti dve

procedure izravnavanja. Za vremenske serije sa aditivnom sezonskom komponentom 𝑠𝑡 koja

ima period k :

𝜇𝑡 = 𝛼(𝑋𝑡 − 𝑠𝑡−𝑘) + (1 − 𝛼)(𝜇𝑡−1 + 𝑓𝑡−1)

𝑓𝑡 = 𝛽(𝜇𝑡 − 𝜇𝑡−1) + (1 − 𝛽)𝑓𝑡−1

𝑠𝑡 = 𝛾(𝑋𝑡 − 𝜇𝑡) + (1 − 𝛾)𝑠𝑡−𝑘

gde su 𝛼, 𝛽, i 𝛾 ponderi za nivo, trend i sezonsku komponentu čijim se pridruživanjem vrši

izravnavanje vremenske serije. Prognozirana vrednost vremenske serije (𝑡), koja ima period

𝑘, za ℎ perioda unapred zasnovana na 𝑡 prethodnih raspoloživih opservacija je:

𝑡(ℎ) = 𝜇𝑡 + ℎ𝑓𝑡 + 𝑠𝑡−𝑘+ℎ

Za vremenske serije sa multiplikativnom sezonskom komponentom 𝑠𝑡 koja ima period 𝑘 važi:

𝜇𝑡 = 𝛼(𝑋𝑡

𝑠𝑡−𝑘) + (1 − 𝛼)(𝜇𝑡−1 + 𝑓𝑡−1)

𝑓𝑡 = 𝛽(𝜇𝑡 − 𝜇𝑡−1) + (1 − 𝛽)𝑓𝑡−1

𝑠𝑡 = 𝛾(𝑋𝑡

𝜇𝑡) + (1 − 𝛾)𝑠𝑡−𝑘

Prognozirana vrednost multiplikativne vremenske serije (𝑡), koja ima period 𝑘, za ℎ perioda

unapred, zasnovana na 𝑡 prethodnih raspoloživih opservacija iznositi:

𝑡(ℎ) = (𝜇𝑡 + ℎ𝑓𝑡) · 𝑠𝑡−𝑘+ℎ

Što se tiče izbora početnih vrednosti konstanti izravnavanja (𝛼, 𝛽, 𝛾) kod Holt-Winters-ovog

trosturkog eksponencijalnog izravnavanja preporučuju se vrednosti od 0.01 do 0.3 za sve tri

komponente koje se podležu izravnavanju (Montgomery i sar., 2008). Međutim, isti autori

kritikuju kompletno arbitraran izbor početnih vrednosti konstanti izravnavanja nezavisno od

karakteristika same vremenske serije i sugerišu da testiranjem različitih početnih vrednosti

konstantni može da se utvrde i izaberu vrednosti koje minimiziraju srednju kvadratnu grešku

prognoze, kao jednog od statističkih pokazatelja kvaliteta same prognoze.

Master rad Tanja Armenski

28

Sve tri konstante izravnavanja (𝛼, 𝛽, 𝛾) zadovoljavaju uslove da je njihova suma jednaka 1.

Kako se vrednosti parametara kreću u rasponu između 0 i 1, što je manja vrednost konstante

izravnavanja to će ocena nivoa sporije reagovati na promenu (glatko izravnavanje) i obrnuto,

ocene bliže 1 uzrokovaće da izravnate vrednosti brzo reaguju na promene nivoa i slučajnih

fluktuacija u seriji (Coshall, 2009).

Master rad Tanja Armenski

29

5. Linearni procesi i linearne vremenske serije

5.1. Linearni procesi

Pronalaženje odgovarajuće funkcionalne veze između određenih ulaznih (istorijskih podataka)

i izlaznih (prognoze) informacija u vremenskoj seriji je jedan od osnovnih zadataka statističkog

modelovanja. Najčešća pretpostavka je da je ta veza linearna. U analizi vremenskih serija

linearni filter je operator koji transformiše vremensku seriju 𝑋𝑡𝑡∈ℤ u vremensku seriju 𝑌𝑡𝑡∈ℤ.

Linearni filter može da se definiše:

𝑌𝑡 = 𝐿(𝑋𝑡) = ∑ 𝜔𝑗𝑋𝑡−𝑗

𝑗=0

gde su 𝜔𝑗 koeficijenti vremenski invarijantni. Kako su u praksi, prilikom modelovanja

vremenske serije na raspolaganju istorijski podaci, definicija pretpostavlja da je 𝑗 ≥ 0.

Definicija implicira da će vrednosti 𝑌𝑡𝑡∈ℤ u trenutku 𝑡 zavisiti samo od sopstvenih prošlih

vrednosti.

Definicija Proces 𝑋𝑡, 𝑡 ∈ T je linearan ako može da se predstavi u obliku

𝑋𝑡 = µ𝑡 + ∑ 𝜃𝑗ɛ𝑡−𝑗

𝑗=0

gde je µ𝑡 deterministička komponenta, ɛ𝑡 ɛ𝑡, 𝑡 ∈ T niz nekoreliranih slučajnih promenljivih i

𝜃1, 𝜃2,…. nepoznati parametri.

Osnovno odlika determinističke komponente je ta da ona može da se aproksimira nekom

matematičkom funkcijom. U slučaju prognoze vremenskih serija to znači da će izabrani tip

funkcije važiti i u budućem periodu.

Stohastička komponenta ∑ 𝜃𝑗ɛ𝑡−𝑗∞𝑗=0 procesa opisuje dejstvo slučajnih faktora u modelu.

Osnovna pretpostavka je da se stohastička komponenta može modelovati pomoću procesa belog

šuma ɛ𝑡, 𝑡 ∈ T.

Master rad Tanja Armenski

30

Beli šum formira niz slučajnih promenljivih međusobno nekoreliranih koje imaju jednaku

raspodelu 𝐸(ɛ𝑡) = 0 sa konstantnom 𝑉𝑎𝑟(ɛ𝑡)=𝜎2 i 𝛾𝑘 = 𝐶𝑜𝑣(ɛ𝑡, ɛ𝑡−𝑘) = 0, za svako 𝑘 ≠ 0.

Tada je proces belog šuma stacionaran proces čija je autokovarijansna i autokorelaciona

funkcija:

1. 𝛾𝑘 = 𝜎2, 𝑘 = 00, 𝑘 ≠ 0

2. 𝜌𝑘 = 1, 𝑘 = 0 0, 𝑘 ≠ 0

U analizi vremenskih serija, beli šum služi za izvođenje autokovarijansne i autokorelacione

funkcije koje se koriste kao reperne vrednosti za poređenje istih pokazatelja drugih procesa.

1. Očekivanje i varijansa linearnog procesa su: 𝐸(𝑋𝑡) = µ𝑡 i 𝑉𝑎𝑟(𝑋𝑡) = 𝜎2 ∑ 𝜃𝑗2∞

𝑗=0

2. Kovarijansna funkcija linearnog procesa 𝑘-toj docnji 𝛾𝑘 = 𝜎2 ∑ 𝜃𝑗∞𝑗=0 𝜃𝑗+𝑘

3. Korelaciona funkcija linearnog procesa je: 𝜌𝑘 =𝛾𝑘

𝛾0=

𝜎2 ∑ 𝜃𝑗∞𝑗=0 𝜃𝑗+𝑘

∑ 𝜃∞𝑗=0 𝑗

2

Ako su momenti prvog i drugog reda konačni, odnosno važi µ𝑡 ≡ µ = 𝑐𝑜𝑛𝑠𝑡. i zadovoljava

uslov stacionarnosti, ∑ 𝜃𝑗2 < ∞∞

𝑗=0 , tada kovarijansna funkcija zavisi samo od 𝑘, pa je linearni

proces slabo stacionaran.

Uz uslov µ𝑡 ≡ µ = 𝑐𝑜𝑛𝑠𝑡 onda linearni proces ekvivalentno može da se zapiše u obliku:

𝑋𝑡− µ𝑡 = 𝑋𝑡∗ ∑ 𝜃𝑗ɛ𝑡−𝑗

𝑗=0

gde je 𝐸(𝑋𝑡∗) = 0.

Prema Woldov-oj teoremi razlaganja, koji je dokazao da je klasa linearnih procesa dovoljno

opšta da obuhvati sve slabo stacionarne vremenske serije, proces 𝑋𝑡, 𝑡 ∈ T može da se

Master rad Tanja Armenski

31

predstavi kao zbir dva međusobno nekorelirana procesa, jednog čisto determinističkog i jednog

nedeterminističkog.

Teorema (Woldova dekompozicija) Stohastička komponenta slabo stacionarne vremenske serije

𝑋𝑡, 𝑡 ∈ T može da se predstavi u formi linearnog procesa oblika:

𝑋𝑡 = ψ𝑡 + ∑ 𝑋𝑡ɛ𝑡−𝑗

𝑗=1

gde su:

ψ𝑡 deterministička komponenta

ɛ𝑡, 𝑡 ∈ T proces belog šuma

∑ 𝑋𝑗2∞

𝑗=1 < ∞, 𝑋0 = 1

𝐸(ɛ𝑡, 𝑉𝑡) = 0

Definicija Linearan proces 𝑋𝑡, 𝑡 ∈ T za koji važi 𝐸( 𝑋𝑡) = 𝜇,⩝ 𝑡 ∊ 𝑇 da je je invertibilan ako

postoje takvi da je:

ɛ𝑡 = ∑ 𝜙𝑗(𝑋𝑡−𝑗

𝑗=0

− 𝜇) = ∑ 𝜙𝑗𝑋∗𝑡−𝑗

𝑗=0

gde je ∑ |𝜙𝑗|∞𝑗=0 < ∞. Linearna vremenska serija je jedna realizacija linearnog stohastičkog

procesa.

Na osnovu linernih procesa mogu da se definišu tri posebne klase procesa sa konačnim brojem

parametara za aproksimiranje slučajnih procesa kojima se bavimo u ovom radu:

1. Autoregresivni procesi reda 𝑝 (𝐴𝑅(𝑝))

2. Proces pokretnih proseka reda 𝑞 (𝑀𝐴(𝑞))

3. Proces 𝐴𝑅𝑀𝐴(𝑝, 𝑞) je kombinacija 𝐴𝑅(𝑝) i 𝑀𝐴(𝑞)

Master rad Tanja Armenski

32

5.2. Operatori u analizi vremenskih serija

U analizi vremenskih serija često se koristi operator docnje u oznaci 𝐵 (backshift). Neka je dat

proizvoljan proces 𝑋𝑡, 𝑡 ∊ 𝑇, operator 𝐵 transformiše proces iz sadašnjeg vremenskog

trenutka u isti proces u prethodnom vremenskom trenutku.

U opštem zapisu:

𝐵𝑋𝑡 = 𝑋𝑡−1

Dalje za proces 𝑋𝑡, 𝑡 ∊ 𝑇 važi:

𝑋𝑡−2 = 𝐵𝑋𝑡−1 = 𝐵𝐵𝑋𝑡 = 𝐵2𝑋𝑡

𝑋𝑡−3 = 𝐵𝑋𝑡−2 = 𝐵𝐵2𝑋𝑡 = 𝐵3𝑋𝑡

...

𝑋𝑡−𝑗 = 𝐵𝑋𝑡−(𝑗−1) = 𝐵𝐵𝑗−1𝑋𝑡 = 𝐵𝑗𝑋𝑡

Linearan proces može da se preko operatora docnje (𝐵) predstavi u obliku:

𝑋𝑡 = ∑ 𝜃𝑗

𝑗=0

𝐵𝑗ɛ𝑡 = 𝜃(𝐵)ɛ𝑡

Ako je proces i invertibilan tada se koristeći operator 𝐵 dobija :

ɛ𝑡 = ∑ 𝜙𝑗

𝑗=0

𝑋𝑡−𝑗 = ∑ 𝜙𝑗

𝑗=0

𝐵𝑋𝑡 = 𝜙(𝐵)𝑋𝑡

Još jedan od operatora koji se često koristi u analizi vremenskih serija je operator diferenciranja

(∇). Operacija diferenciranja se vrši da bi se stabilizovala srednja vrednost vremenske serije (𝜇𝑡)

i time otklonila nestacionarnost vremenske serije, kalkulacijom odstupanja vrednosti vremenske

serije u trenutku 𝑡 od vrednosti iste serije u trenutku 𝑡 − 𝑘. Za diferencni operator prvog reda

važi:

∇𝑋𝑡 = 𝑋𝑡 − 𝑋𝑡−1 = 𝑋𝑡 − 𝐵𝑋𝑡 = (1 − 𝐵)𝑋𝑡,

a drugog reda:

𝛻2𝑋𝑡 = 𝛻(𝛻𝑋𝑡) = 𝛻(𝑋𝑡 − 𝑋𝑡−1) = (𝑋𝑡 − 𝑋𝑡−1) − (𝑋𝑡−1 − 𝑋𝑡−2)

= (𝑋𝑡 − 2𝑋𝑡−1 + 𝑋𝑡−2) = 𝑋𝑡 − 2𝐵𝑋𝑡 + 𝐵2𝑋𝑡

= (1 − 2𝐵 + 𝐵2)𝑋𝑡 = (1 − 𝐵)2𝑋𝑡

Master rad Tanja Armenski

33

odnosno u opštem slučaju diferencni operator 𝑑 −tog reda važi:

𝛻𝑑𝑋𝑡 = 𝛻(𝛻𝑑−1) 𝑋𝑡 =. . . = (1 − 𝐵)𝑑𝑋𝑡

U analizi vremenskih serija od posebnog značaja je operator sezonske diference kod kojeg je

vrednost d jednaka broju perioda sezona (𝑠) u vremenskim podacima. Na primer, u vremenskoj

seriji sa mesečnim podacima postoji 12 perioda sezona i stoga važi 𝑑 = 12, važi:

𝛻12𝑋𝑡 = (1 − B)12𝑋𝑡 = 𝑋𝑡 − 𝑋𝑡−12.

5.3. Autoregresivni procesi 𝑨𝑹(𝒑)

Autoregresivni proces 𝐴𝑅(𝑝) impicira regresiju na sopstvene vrednosti, gde je zavisna

promenljiva član vremenske serije u trenutku 𝑡, a skup nezavisnih promenljivih članovi iste

vremenske serje u trenucima 𝑡 − 1, 𝑡 − 2, . . . , 𝑡 − 𝑝.

Definicija: 𝑋𝑡, 𝑡 ∈ T je autoregresivan proces reda 𝑝, ako može da se predstavi u obliku:

𝑋𝑡 = µ + ∑ 𝜙𝑗𝑋𝑡−𝑗 + ɛ𝑡

𝑝

𝑗=1

gde je µ konstanta, ɛ𝑡, 𝑡 ∈ T proces belog šuma i 𝜙𝑗 nepoznati parameter 𝐴𝑅(𝑝).

Znači da je tekuća vrednost procesa linearna kombinacija 𝑝 sopstvenih prošlih vrednosti i

vrednosti slučajnih poremećaja. Kako je ∑ |𝜙𝑗 < ∞|𝑝𝑗=1 proces je uvek invertibilan. Koristeći 𝐵

operator 𝐴𝑅 (𝑝) u kraćem zapisu glasi:

𝜙(𝐵)𝑋𝑡 = ɛ𝑡

gde je 𝜙(𝐵) = 1 − 𝜙1𝐵 − 𝜙2𝐵2 − ⋯ − 𝜙𝑝𝐵𝑝 karakteristični polinom 𝐴𝑅(𝑝) procesa.

Jednačina 𝜙(z) = 0, z ∈ ℂ je karakteristična jednačina 𝐴𝑅(𝑝) procesa. Rešenja karakteristične

jednačine su karakteristični koreni 𝐴𝑅(𝑝) procesa.

Master rad Tanja Armenski

34

Ako je dat 𝐴𝑅(1) proces, zamenom 𝑝 = 1 u izrazu opšteg 𝐴𝑅(𝑝) procesa tada važi:

𝑋𝑡 = 𝜙1𝑋𝑡−1 + ɛ𝑡

Odnosno u zapisu sa operatorom docnje (𝐵) važi:

(1 − 𝜙1𝐵)𝑦𝑡 = ɛ𝑡, odatle dobijamo:

𝑋𝑡 = (1 − 𝜙1𝐵)−1ɛ𝑡 = (1 − 𝜙1𝐵 + 𝜙12𝐵2 + ⋯ )ɛ𝑡 = ɛ𝑡 + 𝜙1ɛ𝑡−1 + 𝜙1

2ɛ𝑡−2 + ⋯

Odnosno uz zadovoljen uslov stacionarnosti |𝜙1| < 1 u opštem zapisu važi:

(1 − 𝜙1𝐵)−1 =1

1 − 𝜙𝐵= ∑(𝜙𝐵)𝑖

𝑖=1

Onda je karakteristična jednačina AR (1) procesa 1 − 𝜙𝑧 = 0, a njen karakteristični koren:

𝑧 =1

𝜙= 𝜙−1

Kako je |𝑧| =1

|𝜙| u slučaju kada je |𝜙| < 1 onda je |𝑧| > 1 odnosno važi: |𝜙| < 1 ⇔ |𝑧| > 1.

Ako za svako z𝑖 ∈ ℂ važi |𝑧𝑖| < 1, 𝑖 = 1,2, . . . , 𝑝 onda je 𝐴𝑅(𝑝) proces slabo stacionaran.

Odnosno, na osnovu prethodnog iskaza proizilazi da je 𝐴𝑅(𝑝) proces slabo stacionaran ako je

|𝜙𝑖| < 1, za svako 𝑖 = 1,2, . . . , 𝑝 . U tom slučaju kada je 𝐴𝑅 (𝑝) proces slabo stacionaran mogu

se odrediti:

1. 𝐸(𝑋) = 𝐸(𝑋𝑡−𝑝) =1

1−∑ 𝜙𝑗𝑝𝑗=1

2. 𝛾𝑘 = 𝐶𝑜𝑣 (𝑋𝑡, 𝑋𝑡−𝑘) = ∑ 𝜙𝑖𝛾𝑘−𝑖𝑝𝑖=0 +

𝜎2, 𝑘 = 00, 𝑘 ≠ 0

3. 𝑉𝑎𝑟 (𝑋𝑡) = 𝛾0 =𝜎2

1−𝜙1𝜌1−⋯−𝜙𝑝𝜌𝑝 , za k=0 i k>0

4. 𝛾𝑘 = 𝜙1𝛾𝑘−1 + 𝜙2𝛾𝑘−2 + ⋯ + 𝜙𝑝𝛾𝑘−𝑝, ako k>0:

5. 𝜌𝑘 =𝛾𝑘

𝛾0= 𝜙1𝜌𝑘−1 + 𝜙2𝜌𝑘−2 + ⋯ + 𝜙𝑝𝜌𝑘−𝑝 , ako k>0

Master rad Tanja Armenski

35

Prvih 𝑝 jednačina rekurzivne relacije od 𝜌 glase:

𝜌1 = 𝜙1 + 𝜌1𝜙2 + ⋯ + 𝜌𝑝−1𝜙𝑝

𝜌2 = 𝜌1𝜙1 + ⋯ 𝜙2 + ⋯ + 𝜌𝑝−2𝜙𝑝

...

𝜌𝑝 = 𝜌𝑝−1𝜙1 + ⋯ 𝜌𝑝−2𝜙2 + ⋯ + 𝜙𝑝

i nazivaju se Yule-Walker-ove jednačine na osnovu kojih se uspostavlja relacija između 𝐴𝑅(𝑝)

procesa i 𝑝 autokorelacionih koeficijenata. Ukoliko se sistem jednačina koji određuju

kovarijansu i korelaciju autoregresivnog procesa zapišu u matričnom obliku dobija se:

𝑝 = 𝑃𝜙

gde su 𝑝′ = [𝑝1, 𝑝2, … , 𝑝𝑝] , 𝜙′ = [𝜙1, 𝜙2, … , 𝜙𝑝] i 𝑃 autokorelaciona matrica. Rešavanjem

matrične jednačine dobija se 𝜙 = 𝑃−1𝑝.

Ponašanje autokorelacione funkcije može se ispitati na osnovu rešenja diferentne jednačine po

𝜌𝑘 koja u opštem obliku glasi:

𝜌𝑘 = 𝐴1(𝑧1−1)𝑘+...+𝐴𝑝(𝑧𝑝

−1)𝑘

gde su 𝐴𝑗 konstante čije vrednosti zavise od početnih vrednosti 𝜌, a 𝑧1−1 je 𝑖-ti koren

karakteristične jednačine 𝑖 = 1, 2, . . . 𝑝 za [𝑧𝑖] < 1 ispunjava uslov stacionarnosti procesa.

U praktičnom modelovanju za reprezentaciju 𝐴𝑅(1) karakteristične jednačine, zamenom 𝑝 =

1 u izrazu opšteg 𝐴𝑅(𝑝) procesa, 𝑋𝑡 = 𝜙1𝑋𝑡−1+ ɛ𝑡, rešenjem diference jednačine

autokorelaciona funkcija(𝜌𝑘) sledi:

𝜌𝑘 = 𝜙1𝜌𝑘−1 = 𝜙12𝜌𝑘−2 = 𝜙1

𝑘−1𝜌1 = 𝜙1𝑘−1𝜌0 = 𝜙𝑘 za 𝑘 = 0,1,2, . ..

ako je 𝜙 > 0 vrednosti autokorelacione funkcije opadaju po eksponencijalnog krivi ka nuli, dok

za 𝜙 < 0 vrednosti autokorelacione funkcije alterniraju, opadaju ka nuli, odnosno predstavljaju

kombinaciju dve eksponencijalne krive. U oba slučaja opadanje je sporije ukoliko je 𝜙1 blisko

granicama nestacionarnosti: +1 ili -1.

Master rad Tanja Armenski

36

U slučaju AR reprezentacije drugog reda 𝐴𝑅(2), zamenom 𝑝 = 2 u izrazu opšteg 𝐴𝑅(𝑝)

procesa, karakteristična jednačina glasi 𝑋𝑡 = 𝜙1𝑋𝑡−1 + 𝜙2𝑋𝑡−2+ ɛ𝑡, odnosno u zapisu preko

operatora 𝐵 dobija se kvadratna jednačina:

(1 − 𝜙1𝐵 − 𝜙2𝐵2)𝑋𝑡 = ɛ𝑡

za koju rešavanjem 𝜌𝑘 = 𝜙1𝜌𝑘−1 + 𝜙2𝜌𝑘−2, 𝑘 ≥ 1 za 𝑘 = 1 i 𝑘 = 2 i uz uslove stacionarnosti

procesa drugog reda (𝜙1 + 𝜙2 < 1; 𝜙2 − 𝜙1 < 1; −1 < 𝜙2 < 1 ) dobijamo:

𝜌1 =𝜙1

1−𝜙2, 𝜌2 =

𝜙12

1−𝜙1+ 𝜙2

a preostale autokorelacijione funkcije dobijamo korišćenjem rekurzivne relacije Yule-Walker

jednačina. Kada su rešenja karakteristične jednačine realne funkcije (𝑧𝑖 realni broj, tada

𝐴𝑖(𝑧𝑖−1)𝑘 → 0 𝑘𝑎𝑑𝑎 𝑘 → ∞), tada su autokorelacione funkcije kombinacija dve prigušene

eksponencijalne krive, a za kompleksna rešenja (𝑧𝑖 , 𝑧𝑗) autokorelacione funkcije slede putanju

prigušene sinusne funkcije čija se amplituda smanjuje tokom vremena. Ponašanje korelacione

funkcije zavisi od karakterističnih korena i u oba slučaja kada se ona približava ka nuli njeno

ponašanje može da se okarakteriše kao lagano odumiranje ka nuli (Grafik 1 i 2).

5.3.1. Parcijalna autokorelacijona funkcija

U statistici je čest slučaj da je korelacija između dve promenljive u stvari rezultat njihove

koreliranosti sa trećom promenljivom u modelu. Zbog toga se uvodi pojam parcijalne korelacije

koja predstavlja korelaciju između dve promenljive uz eliminisan uticaj drugih promenljivih iz

modela.

U analizi vremenskih serija deo korelacije između 𝑋𝑡 i 𝑋𝑡−𝑘 može se prepisati njihovoj

korelaciji sa vrednostima serije na docnjama između vremenskih trenutaka 𝑡 i 𝑡 − 𝑘. Po

definiciji parcijalni koeficijent korelacije između 𝑋𝑡 i 𝑋𝑡−𝑘, u oznaci 𝜙𝑘𝑘 je 𝑘-ti regresioni

koeficijent u autoregresivnom procesu reda 𝑝 = 𝑘:

𝑋𝑡 = 𝜙𝑘1𝑋𝑡−1 + 𝜙𝑘2𝑋𝑡−2 + ⋯ + 𝜙𝑘𝑘𝑋𝑡−𝑘 + ɛ𝑡

Master rad Tanja Armenski

37

Ovaj model može da se predstavi u obliku Yule-Walkers-ovog sistema, tada se zapisuje:

[

𝜌1

⋮𝜌𝑘

] = [1 ⋯ 𝜌𝑘−1

⋮ ⋱ ⋮𝜌𝑘−1 ⋯ 1

] [𝜙𝑘1

⋮𝜙𝑘𝑘

]

a pomoću Kramerovog pravila može da se odredi 𝑘-ti parcijalni korelacioni koeficijent (Rajter-

Ćirić, 2009). Međutim, da bi se skratio postupak rešavanja pomoću Kramerovih jednačina,

Durbin je predložio efikasan metod za dobijanje rešenja sistema, a time i za dobijanje uzoračke

parcijalne korelacione funkcije. Durbin-ova rekurzivna formula je:

𝜙𝑘𝑘 =𝜌𝑘−∑ 𝜙𝑘−1,𝑗 𝜌𝑘−𝑗

𝑘−1𝑗=1

1−∑ 𝜙𝑘−1,𝑗𝜌𝑗𝑘−1𝑗=1

, 𝜙𝑘𝑗 = 𝜙𝑘−1,𝑗 − 𝜙𝑘𝑘𝜙𝑘−1,𝑘−𝑗, 𝑗 = 1, 2, . . . , 𝑘 − 1.

Parcijalne autokorelacije za koeficijente definisanih AR procesa glase (Grafici 1 i 2):

𝐴𝑅(1): 𝜙11=𝜌1=𝜙1, za 𝜙𝑘𝑘 = 0, za 𝑘 > 1

𝐴𝑅(2): 𝜙11 = 𝜌1 =𝜙1

1−𝜙2 , 𝜙22 =

𝜌2−𝜌12

1−𝜌12 = 𝜙2, za 𝜙𝑘𝑘 = 0, za 𝑘 > 2

𝐴𝑅(𝑝): 𝜙11=𝜌1, 𝜙22≠ 0,...., 𝜙𝑝𝑝≠ 0 za 𝜙𝑘𝑘 = 0, za 𝑘 > 𝑝.

Grafik 1. Autokorelacija i parcijalna autokorelacija prvog reda 𝐴𝑅(1)

Master rad Tanja Armenski

38

Grafik 2. Autokorelacija i parcijalna autokorelacija drugog reda 𝐴𝑅(2)

Ukoliko se oceni 𝑝 + 𝑚 parcijalnih korelacija, za 𝑚 > 0, √𝑛𝑘𝑘 će biti asimptotski normalno

raspoređeni parametri 𝑁(0,1), stoga se ±1.96/√𝑛 može koristiti kao 95% interval poverenja

populacionih parcijalnih autokorelacija. Pored toga, kako su parametri √𝑛𝑘𝑘 nekorelirani, u

velikim uzorcima će 𝑛 ∑ 𝑝+𝑗,𝑝+𝑗2𝑚

𝑗=1 imati asimptotsku 𝜒2 raspodelu sa 𝑚 stepeni slobode.

5.4. Procesi pokretnih proseka 𝑴𝑨 (𝒒)

Definicija: 𝑋𝑡, 𝑡 ∈ T je proces pokretnih proseka reda 𝑞, ako je

𝑋𝑡 = µ + ɛ𝑡 − ∑ 𝜃𝑗ɛ𝑡−𝑗

𝑞

𝑗=1

gde je µ konstanta, ɛ𝑡, 𝑡 ∈ T proces belog šuma i 𝜃𝑗 nepoznati parameter 𝑀𝐴(𝑞). U kraćem

zapisu:

𝑋𝑡 = 𝜃(𝐵)ɛ𝑡, za 𝜃(𝐵) = 1 − 𝜃1𝐵 − 𝜃2𝐵2 − ⋯ − 𝜃𝑞𝐵𝑞,

gde je 𝜃(𝐵) karakteristični polinom, a je 𝜃(z)=0, z ∈ ℂ je karakteristična jednačina 𝑀𝐴(𝑞)

procesa. Proces pokretnih proseka je koristan u modelovanju pojava kod kojih događaji

Master rad Tanja Armenski

39

uzrokuju kratkoročne efekte. Proces pokretnih proseka reda q je linearni proces sa konačnim

očekivanjem i konačnim brojem parametara sa osobinama:

1. 𝐸(𝑋𝑡) = µ

2. Var(𝑋𝑡) = 𝜎2(1 + 𝜃12 + ⋯ + 𝜃𝑞

2)

3. 𝛾0 = 𝜎2(1 + 𝜃12 + ⋯ + 𝜃𝑞

2)

4. 𝛾𝑘 = 0, 𝑘 > 𝑞

𝜎2 ∑ 𝜃𝑗𝜃𝑗+𝑘 ,1 ≤ 𝑘 ≤ 𝑞𝑞−𝑘𝑗=0

5. 𝜌𝑘 =𝛾𝑘

𝛾0

0, 𝑘 > 𝑞

∑ 𝜃𝑗𝜃𝑗+𝑘 𝑞−𝑘𝑗=0

∑ 𝜃𝑗2𝑞−𝑘

𝑗=0

, 1 ≤ 𝑘 ≤ 𝑞

Kako iz definicije pokretnih proseka važi, 𝐸(𝑋𝑡) < ∞ i Var(𝑋𝑡) < ∞ konačni proces pokretnih

proseka reda 𝑞 će uvek biti slabo stacionaran. Ukoliko je 𝑀𝐴(𝑞) proces invertibilan tada se

kaže da on ima 𝐴𝑅(𝑝) reprezentaciju: 𝜃(𝐵) = 𝜙(𝐵)−1.

Na osnovu ponašanja parcijalnih autokorelacija prvog i drugog reda 𝑀𝐴(1) i 𝑀𝐴(2) procesa

(Grafici 2. i 3.) može se sagledati ponašanje parcijalne autokorelacione funkcije opšteg procesa

MA reda 𝑞.

Grafik 3. Autokorelacija i parcijalna autokorelacija prvog reda 𝑀𝐴(1)

Master rad Tanja Armenski

40

Grafik 4. Autokorelacija i parcijalna autokorelacija drugog reda 𝑀𝐴(2)

Za proces 𝑀𝐴(1) prvog reda 𝑋𝑡 = (1 − 𝜃1𝐵)ɛ𝑡 važi, 𝜌𝑘 =−𝜃1

1+𝜃12 , 𝜌𝑘 = 0, 𝑘 > 1 odatle sledi da

je tekuća vrednost procesa korelirana samo sa prethodnom i narednom vrednošću što sugeriše

kratku memoriju procesa. Za 𝑀𝐴(1) proces vrednosti autokorelacione funkcije su ograničeni -

0.5 < 𝜌𝑘 < 0.5 za svako 𝑘 i vrednosti koeficijenata 𝜃1 i 1

𝜃1 imaju istu autokorelacinu funkciju.

Parcijalna autokorelacija se određuje Durbinovom rekurzivnm formulom koja za 𝑀𝐴(1) proces

prvog reda glasi:

𝜙𝑘𝑘 =−𝜃1

𝑘(1 − 𝜃12)

1 − 𝜃12(𝑘+1)

, 𝑘 ≥ 1

Nasuprot autokorelacionoj funkciji koja se prekida posle prve docnje, parcijalna

autokorelaciona funkcija za 𝑀𝐴(1) lagano odumire na dva načina u zavisnosti od predznaka θ1,

odnosno predznaka 𝜌1. Ako je vrednost 𝜃1 negativnog podznaka, vrednost parcijalne korelacije

na prvoj docnji je pozitivna da bi zatim alternirala. U suprotnom opada uzimajući samo

negativne vrednosti. Iz parcijalnog korelograma može se takođe uočiti da je |𝜙𝑘𝑘| < 0.5.

Za proces 𝑀𝐴(2) drugog reda 𝑋𝑡 = (1 − 𝜃1𝐵 − 𝜃2𝐵2)ɛ𝑡, važi:

𝜌1 =−𝜃1(1−𝜃2)

1+𝜃12+𝜃2

2 , 𝜌2 =−𝜃2

1+𝜃12+𝜃2

2 , 𝜌𝑘 = 0, 𝑘 > 2

Master rad Tanja Armenski

41

Model implicira da su opservacije međusobno nekorelirane ako su udaljene više od dva perioda

jedna od druge. 𝑀𝐴(2) proces je stacionaran, a da bi bio invertibilan mora da ispunjava uslove

koji su analogni uslovima stacionarnosti 𝐴𝑅(2) procesa (𝜃1 + 𝜃2 < 1; 𝜃2 − 𝜃1 < 1; −1 <

𝜃2 < 1 ). Korišćenjem izraza za 𝑀𝐴(2) i osobina 𝜌𝑘 = 0, 𝑧𝑎 𝑘 > 2 parcijalne autokorelacije

koeficijenata glase:

𝜙11 = 𝜌1, 𝜙22 =𝜌2 − 𝜌1

2

1 − 𝜌12 , 𝜙33 =

𝜌13 − 𝜌1𝜌2(2 − 𝜌2)

1 − 𝜌22 − 2𝜌1

2(1 − 𝜌2) , . ..

Vrednosti ovih funkcija eksponencijalno opadaju ili osciliraju sledeći prigušenu sinusoidu u

zavisnosti od predzaka i veličina koeficijenata 𝜃1 i 𝜃2.

5.5. Autoregresivni procesi pokretnih proseka 𝑨𝑹𝑴𝑨 (𝒑, 𝒒)

Definicija: Proces 𝑋𝑡, 𝑡 ∈ T je mešoviti autoregresivni proces pokretnih proseka, u notaciji

𝐴𝑅𝑀𝐴(𝑝, 𝑞), ako može da se predstavi kao:

𝑋𝑡 = ∑ 𝜙𝑗

𝑝

𝑗=1𝑋𝑡−𝑗 + ɛ𝑡 − ∑ 𝜃𝑖ɛ𝑡−𝑖

𝑞

𝑖=1

odnosno u skraćenoj ekvivalentnoj formi preko operatora docnje (B):

𝑋𝑡 − 𝜙1𝑋𝑡−1 − ⋯ − 𝜙𝑝𝑋𝑡−𝑝=ɛ𝑡−𝜃1ɛ𝑡−1 − ⋯ − 𝜃𝑞ɛ𝑡−𝑞

𝑋𝑡(1 − 𝜙1𝐵 − ⋯ − 𝜙𝑝𝐵𝑝)=(1 − 𝜃1𝐵 − ⋯ − 𝜃𝑞𝐵𝑞)ɛ𝑡

gde su: 𝜙(𝐵) = (1 − 𝜙1𝐵 − ⋯ − 𝜙𝑝𝐵𝑝) AR karakteristični polinom 𝐴𝑅𝑀𝐴(𝑝, 𝑞) procesa i

𝜃(𝐵) = (1 − 𝜃1𝐵 − ⋯ − 𝜃𝑞𝐵𝑞) MA karakteristični polinom 𝐴𝑅𝑀𝐴(𝑝, 𝑞) procesa.

Stoga važi:

𝜙(𝐵)𝑋𝑡 = 𝜃(𝐵)ɛ𝑡

Pošto je proces pokretnih sredina konačnog reda uvek stacionaran i autoregresivni proces

konačnog reda uvek invertibilan onda važi sledeće:

Master rad Tanja Armenski

42

𝐴𝑅𝑀𝐴(𝑝, 𝑞) proces je stacionaran ako AR komponenta ispunjava uslove stacionarnosti

za svako 𝑧 ∈ ℂ za koje je 𝜙(z)= 0 važi |z| > 1. Tada process može da se predstavi

𝑋𝑡 =𝜃(𝐵)

𝜙(𝐵)ɛ𝑡 = 𝜓(𝐵) ɛ𝑡, što je 𝑀𝐴(∞) representacija procesa.

𝐴𝑅𝑀𝐴(𝑝, 𝑞) proces je invertibilan ako MA komponenta ispunjava uslove invertibilnosti

za svako 𝑧 ∈ ℂ za koje je 𝜃(𝑧) = 0 važi |z| > 1. Tada proces može da se predstavi kao

ɛ𝑡 =𝜃(𝐵)

𝜙(𝐵)𝑋𝑡 = 𝜋(𝐵)𝑋𝑡, što je 𝐴𝑅(∞) representacija procesa.

Autokovarijansna i autokorelaciona funkcija 𝐴𝑅𝐼𝑀𝐴 (𝑝, 𝑞) procesa može se odrediti po

sledećem obrascu:

𝑋𝑡 = ∑ 𝜙𝑗𝑝𝑗=1 𝑋𝑡−𝑗 + ɛ𝑡 − ∑ 𝜃𝑖ɛ𝑡−𝑖

𝑞𝑖=1 /𝑋𝑡−𝑘/ 𝐸⇒

𝛾𝑘 = 𝜙1𝛾𝑘−1+. . . +𝜙𝑝𝛾𝑘−𝑝 + 𝐸(ɛ𝑡, 𝑋𝑡−𝑘) − 𝜃1𝐸(ɛ𝑡−1, 𝑋𝑡−𝑘)−. . . 𝜃𝑞𝐸(ɛ𝑡−𝑞 , 𝑋𝑡−𝑘).

Kako je 𝐸(ɛ𝑡−𝑖, 𝑋𝑡−𝑘) = 0 za 𝑘 > 𝑖 onda je:

𝛾𝑘 = 𝜙1𝛾𝑘−1 + 𝜙2𝛾𝑘−2 + ⋯ + 𝜙𝑝𝛾𝑘−𝑝, ako 𝑘 ≥ 𝑞 + 1

𝜌𝑘 = 𝜙1𝜌𝑘−1 + 𝜙2𝜌𝑘−2 + ⋯ + 𝜙𝑝𝜌𝑘−𝑝 , ako 𝑘 ≥ 𝑞 + 1

Autokorelaciona funkcija 𝐴𝑅𝐼𝑀𝐴 (𝑝, 𝑞) lagano odumire ka nuli, kao i parcijalna korelaciona

funkcija.

Master rad Tanja Armenski

43

6. Modeli nestacionarnih vremenskih serija

6.1. Tipovi nestacionarnih vremenskih serija

Mnoge ekonomske vremenske serije pokazuju neki oblik nestacionarnosti. Ovakvi procesi se

modeluju klasom nestacionarnih integrisanih procesa 𝐴𝑅𝐼𝑀𝐴 (𝑝, 𝑑, 𝑞) kod kojih se

stacionarnost postiže odgovarajućim transformacijama. Izbor transformacije zavisi od uzroka

nestacionarnosti serije koji može biti deterministički ili stohastički.

Procesi kod kojih se stacionarnost postiže uklanjanjem determinističke komponente nazivaju se

trend stacionarni procesi. Primera radi ako je 𝑌𝑡 = 𝐷𝑡 + 𝑍𝑡 proces, gde je 𝐷𝑡 deterministička

komponenta, a 𝑍𝑡 stohastička komponenta tada se serija stacionira oduzimanjem

determinističke komponente koja se predstavlja determinističkom funkcijom vremena (𝐷𝑡 =

𝛽1 + 𝛽2𝑡):

𝑌𝑡 = 𝛽1 + 𝛽2𝑡 + 𝑍𝑡/ −(𝛽1 + 𝛽2𝑡)

i tada se dobija 𝑌𝑡∗ = 𝑍𝑡 stacionarna vremenska serija.

Procesi kod kojih se stacionarnost postiže diferenciranjem (∇) nazivaju se diferencno

stacionarni procesi. Nestacionarnost ovih procesa uzrokovana je nestacionarnošću stohastičke

komponente koja se definiše preko slučajnog hoda. Vremensku seriju koja sadrži slučajan hod

karakterišu neizmenični periodi rastućeg i opadajućeg trenda, gde se trend menja iznenada i

promena je nepredvidiva. Pošto varijansa raste tokom vremena, slučajan hod je nestacionaran

proces koji se diferenciranjem (∇) svodi na stacionaran proces.

Definicija: 𝑍𝑎 𝑋𝑡, 𝑡 ∈ T proces je proces slučajnog hoda, ako važi:

𝑋𝑡 = 𝑋𝑡−1 + ɛ𝑡,

gde je ɛ𝑡, 𝑡 ∈ T proces belog šuma. Oduzimanjem 𝑋𝑡−1 sa obe strane jednakosti:

𝑋𝑡 = 𝑋𝑡−1 + ɛ𝑡 /−𝑋𝑡−1

Master rad Tanja Armenski

44

dobija se stacionaran proces 𝛻𝑋𝑡 = ɛ𝑡. Nekada je potrebno više puta diferencirati proces da bi

se postigla stacionarnost.

6.2. Autoregresivni integrisani procesi pokretnih proseka 𝑨𝑹𝑰𝑴𝑨 (𝒑, 𝒅, 𝒒)

Definicija: Proces 𝑋𝑡, 𝑡 ∈ T je integrisan proces reda 𝑑, u notaciji 𝐼(𝑑), ako

𝛻𝑑𝑋 = (1 − 𝐵)𝑑𝑋𝑡 = 𝑋𝑡 − 𝑑𝑋𝑡−1 +𝑑(𝑑 − 1)

2𝑋𝑡−2−. . . +(−1)𝑑𝑋𝑡−𝑑 = ɛ𝑡

gde ɛ𝑡 (0, 𝜎2) predstavlja proces belog šuma.

Definicija: Proces 𝑋𝑡, 𝑡 ∈ T je 𝐴𝑅𝐼𝑀𝐴 (𝑝, 𝑑, 𝑞) proces ako:

𝜙(𝐵)(1 − 𝐵)𝑑𝑋𝑡 = 𝜃(B) ɛ𝑡 ⇔ 𝜙(𝐵)∇𝑑𝑋𝑡 = 𝜃(𝐵)ɛ𝑡, 𝑑 ≥ 0

gde su 𝛻𝑑 diferencni operater reda 𝑑, 𝜙(𝐵) karakteristični polinom 𝐴𝑅(𝑝) procesa, 𝜃(B)

karakteristični polinom 𝑀𝐴(𝑞) procesa, ɛ𝑡, 𝑡 ∈ T proces belog šuma sa ɛ𝑡 (0, 𝜎2) normalnom

raspodelom.

Ukoliko je serija stacionarna, nema potrebe za njenim diferenciranjem i kao takva može da se

modeluje 𝐴𝑅𝑀𝐴(𝑝, 𝑞) procesima. Karakteristična autokorelaciona funkcija 𝐴𝑅𝐼𝑀𝐴 (𝑝, 𝑑, 𝑞)

procesa, kao i kod 𝐴𝑅𝑀𝐴 (𝑝, 𝑞) procesa, veoma sporo opada ka nuli. Parcijalna autokorelaciona

funkcija je samo na prvoj docnji različita od nule i bliska jedinica, a na višim docnjama opada

ka nuli.

𝐴𝑅𝐼𝑀𝐴 (𝑝, 𝑑, 𝑞) proces ima nekoliko nedostataka. Prvo, kratkoročnost memorije modela, jer

korelacije između udaljenih opservacija vremenskim horizontom nisu specifikovane ovim

modelom. Drugo, 𝐴𝑅𝐼𝑀𝐴 (𝑝, 𝑑, 𝑞) ne “prepoznaje“ sezonske obraske i nekarakteristične

opservacije u vremenskoj seriji (Hassler i sar., 2013). U praksi se ovi nedostaci modela

prevazilaze uvođenjem regresora u model (Harvey, 1993). Primera radi, mesečni sezonski

obrasci u vremenskoj seriji se mogu specifikovati uključivanjem binarnih regresora u model u

obliku:

Master rad Tanja Armenski

45

𝐷𝑗𝑡 = 1 𝑎𝑘𝑜 𝑡 = 𝑗0 𝑎𝑘𝑜 𝑡 ≠ 𝑗

Za vremenske serije sa mesečnim podacima 𝑗 = 1, 2, . . . , 12.

6.3. Sezonski autoregresivni integrisani procesi pokretnih proseka

𝑺𝑨𝑹𝑰𝑴𝑨 (𝒑, 𝒅, 𝒒) (𝑷, 𝑫, 𝑸)𝒔

Definicija: Proces 𝑋𝑡, 𝑡 ∈ T je 𝑆𝐴𝑅𝐼𝑀𝐴 (𝑝, 𝑑, 𝑞) (𝑃, 𝐷, 𝑄)𝑠 proces ako:

𝜙(𝐵)𝛷(𝐵𝑠)(1 − 𝐵)𝑑(1 − 𝐵𝑠)𝐷𝑋𝑡 = 𝜃(B)Θ(𝐵𝑠)ɛ𝑡, 𝑑, 𝐷 ≥ 0

gde su 𝜙(𝐵) i 𝜃(𝐵) regularni polinomi 𝐴𝑅(𝑝) i 𝑀𝐴(𝑞) procesa, a 𝛷(𝐵𝑠) i Θ(𝐵𝑠) sezonski

autoregresivni polinomi i polinomi pokretnih proseka za koje važi:

𝛷(𝐵𝑠) = 1 − 𝛷1𝐵𝑠 − ⋯ − 𝛷𝑝𝐵𝑃𝑠

𝛩(𝐵𝑠) = 1 − 𝛩1𝐵𝑠 − ⋯ − 𝛩𝑞𝐵𝑄𝑠

Model 𝑆𝐴𝑅𝐼𝑀𝐴 (0,1,1)(0,1,1)12 poznat je pod nazivom “vazduhoplovni model”, jer su ga Box

i Jenkins (1976) koristili za analizu vremenske serije broja putnika u vazdušnom saobraćaju.

Invertabilnost ovog modela zahteva ispunjenje uslova |𝜃1|< 1 i |𝛩1|< 1.

Ako diferencne operatore ∇∇𝑠= (1 − 𝐵)(1 − 𝐵𝑠) označimo sa 𝑊𝑡 , tada se model može

zapisati kao:

𝑊𝑡 = (1 − 𝐵 − 𝐵𝑠 − 𝐵𝑠+1)𝑋𝑡 = (1 − θ1B − Θ1Bs + θ1Θ1Bs+1)ɛ𝑡,

Za mesečne vremenske serije sa 12 perioda sezona (𝑠), gde 𝑊𝑡 = (1 − 𝐵)(1 − 𝐵12) važi:

(1 − 𝐵)(1 − 𝐵12)𝑋𝑡 = (1 − 𝜃𝐵)(1 − 𝛩𝐵12)ɛ𝑡.

Autokovarijansa od 𝑊𝑡 na k-toj docnji:

1. 𝛾𝑘 = 𝐸(𝑊𝑡𝑊𝑡−𝑘)

2. 𝛾0 = (1 + 𝜃12)(1 + 𝛩1

2)𝜎2

3. 𝛾1 = −𝜃1(1 + 𝛩12)𝜎2

Master rad Tanja Armenski

46

4. 𝛾𝑠−1 = 𝜃1𝛩1𝜎2

5. 𝛾𝑠 = −𝛩1(1 + 𝜃12)𝜎2

6. 𝛾𝑠+1 = 𝜃1𝛩1𝜎2.

A sve ostale autokovarijanse su jednake nuli. Na osnovu autokovarijacione funkcije dobijamo

autokorelacione koeficijente:

1. 𝜌1 =−𝜃1

1+𝜃12

2. 𝜌𝑠−1 =𝜃1𝛩1

(1+𝜃12)(1+𝛩1

2)= 𝜌𝑠+1

3. 𝜌𝑠 =−𝛩1

1+𝛩12

a ostale autokorelacione funkcije su jednake nuli. Ako serija odgovara “vazduhoplovnom“

modelu, tada je varijansa ocenjenih uzoračkih autokorelacionih koeficijenata na docnjama

većim od 𝑠 + 1:

Var(𝑘) =1 + 2(1

2 + 𝑠−12 + 𝑠

2 + 𝑠+12)

𝑛, 𝑘 > 𝑠 + 1

Grafik 5. Autokorelacija i parcijalna autokorelacija 𝑆𝐴𝑅𝐼𝑀𝐴(0,1,1)(0,1,1)12

Autokovarijansne i autokorelacione funcije ostalih karakterističnih slučajeva sezonskih ARIMA

modela prikazani su u Box i Jenkins (1976).

Master rad Tanja Armenski

47

6.4. Stabilizacija varijanse

Nestacionarni procesi se postupkom diferenciranja svode na stacionarne procese u sredini, ali

ne i u varijansi, autokovarijansi i autokorelaciji. Može se pokazati da je varijansa

𝐴𝑅𝐼𝑀𝐴 (𝑝, 𝑑, 𝑞) procesa vremenski zavisna:

𝑉𝑎𝑟(𝑋𝑡) = 𝜎𝑡2

i da se varijansa nestacionarnog procesa menja sa promenom njene sredine, odnosno:

𝑉𝑎𝑟(𝑋𝑡) = 𝑐ℎ(µ𝑡)

gde je 𝑐 konstanta, µ𝑡 je očekivana vrednost, a ℎ je horizont prognoze. Za stabilizaciju varijanse,

potrebno je odrediti funkciju 𝑓 tako da je varijansa transformisane serije konstantna.

Neka je 𝑉𝑎𝑟(𝑋𝑡) = 𝑐2µ𝑡2, dakle ℎ(µ𝑡) = µ𝑡

2 pa je:

𝑓(𝑋𝑡) = ∫1

√µ𝑡2

𝑑µ𝑡 = 𝑙𝑛(µ𝑡)

Ukoliko je varijansa promenljive 𝑋𝑡 proporcionalna njenoj očekivanoj vrednosti tada

𝐴𝑅𝐼𝑀𝐴(𝑝, 𝑑, 𝑞) procesima odgovara logaritamska transformacija. Logaritamska trasformacija

u cilju stabilizacije sprovodi se pre ma koje druge transformacije.

6.5. Testovi jediničnih korena

Testovi koji se koriste za testiranje prisustva i tipa nestacionarnosti u modelima linearnih

vremenskih serija zovu se testovi jediničnih korena. Za određivanje stacionarnosti serije obično

se koristi DF test (Dickey Fuller). Postoje tri tipa modifikacija ovog testa za modele bez

konstante (𝜏1), bez trenda (𝜏2) i sa trendom (𝜏3) 13. U radu će se za testiranje stacionarnosti serija

koristiti statistike 𝜏2i 𝜏3.

13 Za više informacija pogledati Mihailović (2011) na str. 40.

Master rad Tanja Armenski

48

Statistikom 𝜏2 testira se prisustvo trend stacionarnosti. Nulta hipoteza pretpostavlja da

vremenska serija prati proces slučajnog hoda sa konstantom, a alternativna da je proces

stacionaran. Ako 𝛼 = 𝜙 − 1 , tada:

∇𝑋𝑡 = 𝛽0 + 𝛼 𝑋𝑡−1 + ɛ𝑡

H0: 𝛼=0 H1: 𝛼<0.

DF statistika može da se modifikuje dodavanjem linearnog trenda u cilju testiranja da je proces

trend stacionaran (hulta hipoteza) protiv alternativne da je proces diferencno stacionaran (𝜏3).

∇𝑋𝑡 = 𝛽0+𝛽1𝑡 + (𝛼 − 1) 𝑋𝑡−1 + ɛ𝑡

H0: 𝛼=0 H1: 𝛼<0.

Za testiranja stacionarnosti autoregresivnih procesa viših redova obično se koristi prošireni

Dickey-Fuller-ov test (ADF) u oznaci:

∇𝑋𝑡 = 𝛽0+𝛽1𝑡 + (𝛼 − 1) 𝑋𝑡−1 + ∑ 𝜆𝑖∇𝑋𝑡−𝑖+ ɛ𝑡

𝑝

𝑖=1

Ukoliko se na osnovu ADF testa odbaci hipoteza o postojanju jednog jediničnog korena,

odnosno utvrdi se da serija nije diferencno stacionarna tada je moguće da je serija trend

stacionarna. Ako se na osnovu ADF statistike ne odbaci pretpostavka o postojanju jednog

jediničnog korena tada se serija transformiše diferenciranjem i testiranje se ponavlja za prvu

diferencu vremenske serije (𝜏2) itd.

Kritične vrednosti oblasti odbacivanja nulte hipoteze za ADF test dobijaju se poređenjem

empirijskih i teorijskih vrednosti Dickey-Fuller-e 𝜏 statistike t-raspodele14. Ocenjena kritična

vrednost testa može se izračunati po obrascu:

𝛽∞ +𝛽1

𝑛+

𝛽2

𝑛2 .

14 Pored testova za testiranje prisustva jediničnog korena sa t-raspodelom, Dickey i Fuller (1981) su predloži

nekoliko testova koji prate F-raspodelu (Ф1, Ф2, Ф3). Osnovu testa čini količnik verodostojnosti koji se naziva Ф

statistika. Više se može naći kod Kovačića (1995).

Master rad Tanja Armenski

49

6.6. Opšta strategija izgradnje ARIMA modela

Box i Jenkins su predložili opštu strategiju izgradnje ARIMA modela koja obuhvata

identifikaciju, ocenjivanje, proveru adekvatnosti modela i predviđanje (Mladenović, Nojković,

2012):

1. Identifikacija predstavlja prvu fazu u procesu analize vremenskih serija. Samo opisivanje

vremenske serije predstavlja određivanje informacija o prirodi vremenske serije i o tome da li

je potrebno izvršiti neku transformaciju vremenske serije. Ona obuhvata postupak utvrđivanja

stacionarnosti, reda diferenciranja, izbor odgovarajućeg modela i utvrđivanje reda procesa.

Prvobitno se utvrđuje da li je vremenska serija stacionarna i da li sadrži sezonske obrasce.

Grafički prikaz vremenske serije, odnosno njenih korelograma, je informativno sredstvo za

utvrđivanje stacionarnosti vremenske serije. Ukoliko je vremenska serija nestacionarna onda je

neophodno odgovarajućim transformacijama pre dalje analize stabilizovati istu. Najčešće

metode za stabilizaciju varijanse vremenske serije su logaritamska ili Box-Cox-ova

transformacija. Kada se varijansa serije stacionira, neophodno je proveriti da li je njena sredina

konstantna kroz vreme. Ovo se može uraditi primenom proširenog Dickey Fuller testa (ADF)15.

Zatim se na osnovu teorijskih osobina obične i parcijalne autokorelacione funkcije određuje

linearni model i njegov red (Tabela 1):

Tabela 1. Izgled obične i parcijalne autokorelacione funkcije procesa 𝐴𝑅(𝑝), 𝑀𝐴(𝑞), 𝐴𝑅𝑀𝐴(𝑝, 𝑞)16

Izgled funkcije 𝑨𝑹 (𝒑) 𝑴𝑨 (𝒒) 𝑨𝑹𝑴𝑨 (𝒑, 𝒒)

Autokorelaciona

funkcija

Lagano odumire ka 0 Jednaka 0 kada je red

procesa veći od q

Lagano odumire

ka 0

Parcijalna autokorelaciona

funkcija

Jednaka 0 kada je red

procesa veći od p

Lagano odumire ka 0 Lagano odumire

ka 0

15 Skraćenica ADF je preuzeta iz engleskog jezika “Augmented Dickey Fuller“. 16 Preuzeto iz Mihailović, 2011, str. 45.

Master rad Tanja Armenski

50

Osim pregleda korelograma, često se koriste dodatni kriterijumi za utvrđivanje reda modela.

Najčešće korišćeni su Akaike informativni kriterijum (AIK) i Akaike-ova konačna greška

predviđanja (FPE) (Akaike, 1974):

𝐴𝐼𝐶(𝑝, 𝑞) = 𝑙𝑛𝜎𝑝,𝑞2 +

𝑝 + 𝑞

𝑛𝑙𝑛(𝑛)

𝐹𝑃𝐸(𝑝, 𝑞) =𝑛 + 𝑝 + 𝑞

𝑛 − 𝑝 − 𝑞𝜎𝑝,𝑞

2

gde se biraju vrednosti za 𝑝, 𝑞 koje minimiziraju AIC (p, q) i FPE (p,q). AIC se koristi za

poređenje konkurentskih modela koji odgovaraju istim serijama u ovom radu. Model sa manjim

informacionim kriterijumima bolje odgovara podacima.

2.Ocenjivanje je faza u kojoj se ocenjuju koeficijenti modela, odnosno sredina µ = 𝐸(𝑋𝑡) i

varijansa serije 𝜎2 = 𝐸(ɛ𝑡2), kao i = [𝜙1, 𝜙2, . . . , 𝜙𝑝] , 𝜃 = [𝜃1, 𝜃2, . . . , 𝜃𝑞] na osnovu

raspoloživih podataka što je uslovljeno adekvatnošću izabranog modela iz prethodne faze.

Konačne ocene se dobijaju metodom najmanjih kvadrata ili metodom maksimalne

verodostojnosti.

3. Provera adekvatnosti je postupak suočavanja prilagođenog modela podacima u cilju

otkrivanja njegovih eventualnih nedostataka, što podrazumeva proveru statističke značajnosti

ocenjenih koeficijenata i osobina reziduala (predstavljaju li proces belog šuma). Model se u

ovoj fazi ili poboljšava ili se, ako zadovoljava kriterijume, koristi za prognozu. Za proveru

adekvatnosti modela koristi se test statistika koju su predložili Ljung i Box:

𝑄𝐵𝑃 = 𝑛(𝑛 + 2) ∑𝜌𝑘

2

𝑛 − 𝑘

𝑘=1

gde je 𝜌𝑘 =∑ ɛ𝑡

𝑛𝑡=𝑘 ɛ𝑡−𝑘

∑ ɛ𝑡2𝑛

𝑡=1 .

Nulta hipoteza je da ne postoji autokorelacija između reziduala na docnjama ℎ reda (H0), a

alternativna da postoji. Ukoliko je nulta hipoteza tačna tada je vremenska serija beli šum sa

raspodelom: 𝑄𝐵𝑃~ 𝜒ℎ−𝑝−𝑞2 .

Master rad Tanja Armenski

51

4. Predviđanje: na osnovu poznatih opservacija izabranog i ocenjenog modela iz prethodne faze

prognoziraju se buduća kretanja vremenske serije. Prognoze sa minimalnom srednjom

kvadratnom greškom se najčešće koriste u ekstrapolaciji budućih vrednosti vremenske serije.

Neka su 𝑋𝑛+ℎ buduća vrednost vremenske serije za interval ℎ i 𝑛+ℎ prognozirana vrednosti

vremenske serije za interval ℎ, tada je greška prognoziranja:

ɛ𝑡(ℎ) = 𝑋𝑡+ℎ-𝑛+ℎ

a srednje kvadratna greška prognoziranja:

𝐸(𝑋𝑡+ℎ − 𝑛+ℎ)2

Ideja je da se na osnovu poznatih vrednosti vremenske serije formira 𝑡+ℎ za koje srednja

kvadratna greška prognoziranja 𝐸(𝑋𝑛+ℎ + 𝑛+ℎ)2ima minimalnu vrednost17:

𝑡+ℎ = 𝐸(𝑋𝑡+ℎ|𝑋𝑡,𝑋𝑡−1, … )

Ako se na seriji primeni logaritamska transformacija radi stabilizacije varijanse serije

neophodno je istu inverznom funkcijom korigovati. U suprotnom će logaritmovana vremenska

serija pratiti log-normalnu raspodelu sa sredinom 𝑒1

2𝜎2

.

6.7. Kriterijumi performansi predviđanja

Za poređenje prognoza različitih modela korišćeni su parametri MAPE i RMSPE.

𝑀𝐴𝑃𝐸 =100

𝑛∑

|𝑒𝑡|

𝑋𝑡

𝑛

𝑡=1

𝑅𝑀𝑃𝑆𝐸 = √100

𝑛∑ (

𝑒𝑡

𝑋𝑡)

2𝑛

𝑡=1

Vrednosti kriterijuma predviđanja ispod 10% odražavaju visoku preciznost predviđanja

(Kovačić, 1993).

17 Za detaljnije informacije pogledati Mihailović (2011), str. 43.

Master rad Tanja Armenski

52

7. Metodologija istraživanja

U cilju procene najadekvatnijeg modela u prognozi broja putnika u avio saobraćaju na primeru

Kanade i Srbije analizirani su sledeći modeli vremenskih serija: Holt-Vinter-ov metod

eksponencijalnog izravnavanja, 𝐴𝑅𝑀𝐴 (𝑝, 𝑞), 𝐴𝑅𝐼𝑀𝐴 (𝑝, 𝑑, 𝑞) i 𝑆𝐴𝑅𝐼𝑀𝐴 (𝑝, 𝑑, 𝑞) (𝑃, 𝐷, 𝑄)𝑆.

Mesečni podaci o broju putnika u međunarodnom avio saobraćaju u periodu od januara 2007.

do decembra 2017. godine publikovani su od strane Kanadske agencije za granične usluge i

Statistike Kanade. Podaci o broju putnika u međunarodnom avio saobraćaju Srbije publikovani

su od strane Republičkog zavoda za statistiku Srbije i aerodroma Nikola Tesla, Beograd.

Međunarodni avio saobraćaj dolazećeg i odlazećeg saobraćajnog toka Kanade analiziran je u

okviru dva segmenta: a) međunarodni avio saobraćaj koji čine letovi između Kanade i USA i

b) letovi između Kanade i drugih inostranih zemalja. Na primeru Srbije, analiziran je broj

putnika u dolazećem i odlazećem međunarodnom avio saobraćaju.

Podaci o broju putnika u avio saobraćaju su podeljeni u dva uzorka. Prvi uzorak čine serije

podataka od januara 2007. do decembra 2016. godine. Ovaj set podataka se koristi za “obuku”,

odnosno prilagođavanje podataka odabranim modelima vremenskih serija. Drugi uzorak

pokriva period od januara 2017. do decembra 2017. godine i koristi se za procenu performansi

prognoza.

Sezonski obrasci su modelovani binarnim regresorima u obliku:

𝐷𝑗𝑡 = 1 𝑎𝑘𝑜 𝑡 = 𝑗0 𝑎𝑘𝑜 𝑡 ≠ 𝑗

gde 𝑗 = 1, 2, . . . , 12 prema preporuci Ghysels i Osborn (2001). Za ocenu preciznosti prognoza

korišćeni su parametri MAPE i RMSPE, kao i AIK za procenu opšte podobnosti modela.

Adekvatnost ocenjenih modela procenjena je Ljung-Box statistikom testiranjem značajnosti

pojedinačih autokorelacionih koeficijenata reziduala modela na različitim docnjama. Statističke

analize su programirane u SAS-u korišćenjem SAS 9.3. paketa.

Master rad Tanja Armenski

53

8. Rezultati istraživanja

8.1. Deskriptivna statistika

Linijskim grafikonima prikazane su vremenske serija broja putnika u dolazećem i odlazećem

avio saobraćaju na originalnim i log transformisanim podacima prve diference za ceo period

uzorkovanja. U oba slučaja Kanade i Srbije, može se uočiti da se broj putnika u avio saobraćaju

povećava tokom vremena. Pozitivni vremenski trend je naročito izražen na primeru Srbije u

periodu nakon 2013. godine. Varijanse većina serija se takođe vremenom povećavaju što

ukazuje na nestacionarnost varijansi serija, osim u slučaju serije iz Kanade prema drugim

zemljama (CAN_OVS). Sezonska komponenta je takođe prisutna u svim serijama.

Vremenske serije broja putnika na dolaznim letovima prema Kanadi postižu maksimalne

vrednosti u letnjim mesecima, dok serije putnika na odlaznim letovima iz Kanade prema USA

i drugim zemljama postižu maksimalne vrednosti u periodu od januara do maja. Interesantno je

primetiti nestandardnu opservaciju na seriji OVS_dolazni u junu 2016 godine. Porast broja

putnika u međunarodnom avio saobraćaju prema Kanadi u ovom periodu može biti posledica

održavanja letnjih Olimpijskih igara u Riu de Žaneiru, u Brazilu u avgustu, 2016. godine.

Vremenske serije broja putnika na dolaznim i odlaznim letovima u avio sabraćaju Srbije postižu

maksimalne vrednosti u letnjim mesecima. Na dolaznim letovima prema Srbiji nestandardne

opservacije se pojavljuju u julu, a naročito visoke vrednosti postižu u julu 2007. i 2010. godine.

Porast broja inostranih posetilaca može biti posledica EXIT festivala koji se održava svake

godine početkom jula meseca.

Na seriji broja putnika na odlaznim letovima iz Srbije uočava se nestandardna opservacija u

oktobru 2017 godine. Poslovanje nisko-budžetnih avio kompanija na srpskom avio tržištu,

pokretanje novih linija i povećanje broja letova na postojećim linijama prema Evropi i Bliskom

Istoku (Dubai), pozitivno je uticalo na trend broja putnika u srpskom avio saobraćaju u 2017.

godini.

Master rad Tanja Armenski

54

Vremenske serije broja putnika u međunarodnom avio saobraćaju u oba primera, Kanade i

Srbije, postižu svoje minimume u periodu između 2007. i 2009. godine. Ovo može biti posledica

finansije krize u USA 2007/2008. godine i kasnije ekonomske recesije u Kanadi 2008/2009.

godine, kao i posledica Evropske dužničke krize 2009. godine.

Grafički prikazi originalnih i diferenciranih vremenskih serija ukazuju da većina ispitivanih

serija ima multiplikativne sezone osim u slučaju serije iz Kanade prema drugim zemljama

(CAN_OVS) koja ima aditivne sezone (Grafik 6). Vremenske serije sa multiplikativnim

sezonama su log tranformisane u cilju stabilizacije varijanse serija (Grafik 6 i Grafik 7).

Grafik 6. Broj putnika u avio saobraćaju Kanade na originalnim i transformisanim podacima

Master rad Tanja Armenski

55

Grafik 7. Broj putnika u avio saobraćaju Srbije na originalnim i transformisanim podacima

8.2. Holt-Winter-ov metod eksponencijalnog izravnavanja

Deskriptivna statistika je pokazala da su vremenske serije uglavnom multiplikativne pošto se

slučajna variranja u serijama povećavaju sa protokom vremena, osim u slučaju serije iz Kanade

prema drugim zemljama (CAN_OVS). Takođe, vremenske serije nemaju konstantan nivo (𝑎𝑡),

a imaju trend (𝑏𝑡) i sezonsku komponentu (𝑠𝑡 ) stoga je na ispitivane serije primenjen Holt-

Winter-ov metod trostrukog eksponencijalnog izravnavanja. Parametri izravnavanja nivoa (𝛼),

trenda (𝛽) i sezone (𝛾) vremenskih serija prikazani su u Tabeli 2.

Tabela 2. Rezultati Holt-Winter-ovih parametara izravnavanja

Serija Tip 𝜶 𝜷 𝜸

USA_dolazni multiplikativni 0,483 0,026 0,278

OVS_dolazni multiplikativni 0,359 0,161 0,582

CAN _USA_odlazni multiplikativni 0,699 0,001 0,386

CAN_OVS_odlazni aditivni 0,343 0,001 0,606

SRB_dolazni multiplikativni 0,502 0,004 0,593

SRB_odlazni multiplikativni 0,494 0,006 0,810

Master rad Tanja Armenski

56

Parametar nivoa serija (𝛼) ima najveću vrednost na seriji letova iz Kanade za USA što ukazuje

na vremensku nestabilnost serije u odnosu na druge serije. Parametri poravnavanja trenda (𝛽)

su jednaki ili blizu nuli na većini serija što ukazuje da je nagib serija relativno konstantan tokom

vremena. Na seriji OVS-dolazni (𝛽 =0,161) je izražen pozitivan trend.

Parametri sezonskog poravnanja (𝛾) najizraženiji su u slučaju odlaznog avio saobraćaja iz

Kanade ka ostalim inostranim zemlje (izuzev USA) i iz Srbije na odlaznim letovima ka drugim

zemljama. Uzimajući u obzir samu prirodu ispitivanih podataka koje karakteriše izraženo

sezonsko kretanje visoke vrednosti sezonskih parametara na serijama broja putnika na odlaznim

međunarodnim letovima nisu iznenađujuće.

8.3. Univarijantni modeli vremenskih serija

U izgradnji ARMA, ARIMA i SARIMA modela korišćena je Box i Jenkins-ova strategija.

Prethodnim grafičkim pregledom vremenskih serija, utvrđeno je prisustvo multiplikativnih

sezona i stoga je većina ispitivanih serija log tranformisana osim u slučaju serije iz Kanade

prema drugim zemljama (CAN_OVS) koja pokazuje aditivne sezonske obraske. Potom je

procenjena stacionarnost vremenskih serija primenom ADF testa. U Tabeli 3. su prikazani

rezultati ADF testa sa dve modifikacije sa trendom (𝜏3) i bez trenda (𝜏2), kao i rezultati ADF

testa bez trenda prve diference vremenskih serija (𝜏2).

Prvobitno je testirana hipoteza da je proces trend stacionaran protiv alternativne da je proces

diferencno stacionaran (𝜏3). Ako je empiriska vrednost veća od 1% kritične vrednosti testa tada

se nulta hipoteza o prisustvu jediničnog korena u seriji ne može odbaciti. U tom slučaju se

pristupa testiranju hipoteza o prisustvu jediničnog korena bez determinističkog trenda (𝜏2). Ako

je empirijska vrednosti veća od 1% kritične vrednosti oblasti odbacivanja nulte hipoteze

zaključuje se da je u seriji prisutan jedinični koren i neophodno je diferencirati istu nakon čega

se na diferenciranoj seriji ponavlja ADF test (𝜏2).

Empirijske vrednosti statistike (𝜏3) su ispod 1% kritične vrdnosti oblasti odbacivanja nulte

hipoteze što implicira stacionarnost serijama na dolaznom sabraćaju ka Kanadi (OVS) i iz

Master rad Tanja Armenski

57

Kanade prema USA i ostalim zemljama (OVS) na nižim docnjama (𝜏2). Na višim docnjama

serije postižu stacinarnost nakon sezonskog diferenciranja.

Tabela 3. Rezultati Dickey-Fuller-ovih testova jediničnih korena

Sa trendom (𝝉𝟑) Bez trenda (𝝉𝟐) Bez trenda prve

diference (𝝉)

Serija Empirijska Kritična

vrednost1

Empirijska Kritična

vrednost1

Empirijska Kritična

vrednost1

LnUSA_dolazni -3,87 -4,04 -3,76 -3,49 -5,17 -3,49

LnOVS_dolazni -4,37 -4,04 -4,32 -3,49 -5,16 -3,49

LnCAN _USA_odlazni -5,18 -4,04 -4,44 -3,49 -4,66 -3,49

CAN_OVS_odlazni -6,22 -4,04 -5,11 -3,49 -4,88 -3,49

LnSRB_dolazni -3,75 -4,04 -2,84 -3,49 -3,98 -3,49

LnSRB_odlazni -3,39 -4,04 -2,75 -3,49 -4,67 -3,49

1 Teorijske kritične vrednosti testa su na nivou značajnosti od 0,01 za veličinu uzorka n=120.

Nakon određivanja reda diferenciranja, određuje se red 𝐴𝑅(𝑝) i 𝑀𝐴(𝑞) vremenskih serija na

osnovu AIC informacionog kriterijuma. Izabrani modeli za ocenjene serije su prikazani u Tabeli

4.

Tabela 4. Rezultati 𝐴𝑅𝑀𝐴(𝑝, 𝑞), 𝐴𝑅𝐼𝑀𝐴(𝑝, 𝑑, 𝑞) i 𝑆𝐴𝑅𝐼𝑀𝐴(𝑝, 𝑑, 𝑞) (𝑃, 𝐷, 𝑄)𝑠 modela ARIMA SARIMA

Serija Model Ljung-Box

(sig)

AIC Model Ljung-Box

(sig)

AIC

LnUSA_dolazni (1,1,1) 0,235 -430,40 (3,1,1) (1,1,0)12 0,225 -364,48

LnOVS_dolazni (1,0,1) 0,148 -394,34 (0,1,1) (1,1,0)12 0,287 -326,26

LnCAN_USA_odlazni (1,0,1) 0,606 -508,62 (1,0,1) (1,1,1)12 0,268 -441,67

CAN_OVS_odlazni1 ([1 5 10 11],

1, 2)

0,236 2771,38 (1,1,1) (0,1,2)12 0,213 2.511,98

LnSRB_dolazni (1,1,1) 0,278 -369,82 (1,1,2) (0,1,1)12 0,216 -313,16

LnSRB_odlazni (3,1,1) 0,266 -372,95 (1,1,1) (1,1,0)12 0,248 -311,38

1 CAN_OVS je aditivna i stoga nije log transformisana serija. Ostale serije su log transformisane što je rezultiralo

različitim skorovima AIC parametra. Kako je AIC korišćen za poređenje konkurentskih modela koji odgovaraju

istoj seriji, a ne za poređenje sa drugim serijama, transformacija podataka nije uticala na izbor modela prikazanih

u Tabeli 4.

Master rad Tanja Armenski

58

Na osnovu Ljung-Box testa može se zaključiti da u vremenskim serijama nisu prisutne

statistički značajne autokorelacije između reziduala što ukazuje na adekvatnost ocenjenih

modela.

Procena preciznosti prognoza izabranih modela na osnovu parametara MAPE i RMSPE

prikazani su u Tabeli 5. Ovi parametri su izračunati na osnovu prognoza izvan uzorka, odnosno

za period od januara 2017. do decembra 2017. Svi parametri MAPE i RMSPE su ispod

preporučene vrednosti od 10% (Kovačić, 1998). U većini ispitivanih slučajeva modeli ARMA i

ARIMA su postigli najpreciznije prognoze, dok je Holt-Winterov metod eksponencijalnog

izravnavanja dao najpreciznije prognoze za seriju avio saobraćaja iz Kanade za USA.

Tabela 5. Rezultati MAPE i RMSPE pojedinačnih modela

MAPE RMSPE

Serija Holt-Winter ARIMA SARIMA Holt-Winter ARIMA SARIMA

LnUSA_dolazni 2,950 2,714 3,385 3,762 3,524 4,213

LnOVS_dolazni 3,610 3,333 4,069 4,592 4,379 5,155

LnCAN _USA_odlazni 2,172 2,173 2,328 2,683 2,998 3,094

CAN_OVS_odlazni 2,791 2,404 2,882 3,590 3,297 3,848

LnSRB_dolazni 3,920 3,530 4,432 4,923 4,42 5,420

LnSRB_odlazni 3,678 3,333 4,167 5,089 4,635 5,691

Grafici ocenjenih modela sa najpreciznijim prognozama za period od januara 2017. do

decembra 2017. godine pokazuju da prognoze uglavnom dobro opisuju realne podatke, njihove

sezonske obrasce i srednje nivoe vremenskih serija (Grafik 8. do Grafik 13).

Grafik 8. USA_dolazni ARIMA (1,1,1) Grafik 9. OVS_dolazni ARIMA (1,0,1)

Master rad Tanja Armenski

59

Grafik 10. CAN _USA_odlazni Holt-Winter Grafik 11. CAN_OVS_odlazni

ARIMA ([1 5 10 11], 1, 2)

Grafik 12. SRB_dolazni ARIMA (1,1,1) Grafik 13. SRB_odlazni ARIMA (3,1,1)

U slučaju serije CAN _USA_odlazni koja je procenjena Holt-Winter-ovom metodom i

SRB_odlazni koja je procenjena ARIMA(3,1,1) prognoze su u podbačaju, odnosno pokazuju

pesimistički scenario predviđenja.

Master rad Tanja Armenski

60

9. Zaključak i diskusija

U skladu sa postavljenim ciljevima istraživanja, u radu su analizirani različiti modeli

vremenskih serija, kao što su Holt-Vinters eksponencijalno izravnavanje, ARMA, ARIMA i

SARIMA sa ciljem da se utvrdi koja metoda je najpreciznija u predviđanju broja putnika u

međunarodnom avio saobraćaju na primeru Kanade i Srbije.

U radu je analizirano šest vremenskih serija broja putnika u avio saobraćaju na primeru Kanade

i Srbije u periodu od januara 2007. do decembra 2016. godine. Na primeru Kanade analizirano

je četiri vremenske serije: broj putnika na dolaznim letovima prema Kanadi iz USA i ostalim

zemljama i broj putnika na odlaznim letovima iz Kanade prema USA i ostalim zemljama. Na

primeru Srbije analizirane su dve serije broja putnika na odlaznim i dolaznim letovima prema

Srbiji.

Većina ispitivanih vremenskih serija ukazala je na prisustvo multiplikativnih sezona osim u

slučaju serije iz Kanade prema drugim zemljama (CAN_OVS) koja ima aditivne sezone.

Parametar nivoa serija (𝛼) ima najveću vrednost na seriji letova iz Kanade za USA što ukazuje

na vremensku nestabilnost serije u odnosu na druge serije. Na seriji avio saobraćaja iz drugih

zemalja prema Kanadi, vremenska serije ima izražen pozitivni trend (𝛽 =0,161). Pozitivni trend

je posledica porasta broja putnika u međunarodnom avio saobraćaju prema Kanadi što može

ukazati na razvoj turističkog sektora, ali može biti i odraz pozitivne imigracione politike Vlade

Kanade.

Što se tiče same prognoze modelima klase ARIMA, modeli ARMA i ARIMA pokazuju

najpreciznije prognoze za 12 meseci unapred na svim serijama osim u slučaju serije iz Kanade

prema USA. Ovi rezultati su u skladu sa nalazima autora Bougas (2013) koja je ispitivala

performanse modela serija avio saobraćaja Kanade u periodu od 1988-2008. godine. U radu

istog autora, ARIMA je pokazala dobre performanse u kratkoročnim prognozama do jednog

tromesečja dok je SARIMA pokazivala bolje performanse u dugoročnim prognozama do dve

godine. Ovaj nalaz nije iznenađujući s obzirom da je ARIMA model sa kratkoročnom

Master rad Tanja Armenski

61

memorijom (Bourbonnais, Terraza, 2004) koji je „osetljiv“ na strukturne promene u serije

uzrokovane naglim promenama u geopolitičkom i ekonomskom okruženja.

U radu autora Bougas (2013) ispitivana serija avio saobraćaja sadržala je tri takva „šoka“, rat u

Golfskom zalivu (1990-1991), terorističke napade na USA 9/11 (septembar, 2001) i epidemiju

SARS18-a (novembar, 2002 - jul, 2003) koji su doprineli slučajnom variranju ispitivanih serija.

Kako u ispitivanim vremenskim serijama u periodu od januara, 2007 do decembra, 2017. godine

takvih šokova nema, ARIMA je pokazala bolje performanse predviđanja od ostalih ispitivanih

modela.

Holt-Winters metod je pokazao najbolje performanse predviđanja serije broja putnika iz Kanade

prema USA, ali je imao tendenciju pesimističkih predviđanja. Iako u seriji nisu prisutne

strukturne promene na koje je Holt-Winters-ov metod „osetljiv“ (Croux, Crevits, 2016),

prognoze su znatno varirale u prisustvu nestandardnih opservacija u seriji.

Naime, ispitivana serija sadrži nestandardne opservacije u 2009/2010. godini što je moguća

posledica finansije krize u USA 2007/2008. godine i ekonomske recesije u Kanadi 2008/2009.

godine. Ekonomska recesija u Kanadi 2008/2009. godine značajno je uticala na pad broja

putnika avionom za USA, a nakon recesije broj putnika u avio saobraćaju prema USA je

značajno varirao delom prateći kretanje kursa kanadskog dolara prema američkom dolaru.

Ovi “događaji” iz ekonomskog okruženja su značajno uticali na stabilnost vremenske serije u

posmatranom periodu. Uklanjanjem slučajnih variranja iz serije mogu se poboljšati performanse

prognoze. Slučajna variranja u seriji usled uticaja iz okruženja mogu se otkloniti uvođenjem

regresova u model koji vremenski korespondiraju sa događajima iz okruženja. Oblik regresora

zavisi od tipa nestandardne opservacije i njenog uticaja na vremensku seriju. Na primer, uticaj

ekonomske recesije (𝐸𝑅𝑡) u Kanadi 2008/2009. godine može se modelovati uvođenjem

binarnog regresora u model u obliku:

𝐸𝑅𝑡 = 1 𝑧𝑎 𝑡 = 𝑜𝑘𝑡𝑜𝑏𝑎𝑟 2008, . . . , 𝑗𝑢𝑛𝑒 2009

0 𝑧𝑎 𝑡 ≠ 𝑜𝑘𝑡𝑜𝑏𝑎𝑟 2008, . . . . , 𝑗𝑢𝑛𝑒 2009

18 Teški akutni respiratorni sindrom (Severe Acute Respiratory Syndrome) skraćeno SARS.

Master rad Tanja Armenski

62

jer ovaj događaj ima jednokratnu intervenciju na ispitivane vremenske serije odlaznog

međunarodnog avio saobraćaja iz Kanade19.

Interesantno je da je u seriji dolaznog saobraćaja iz ostalih zemalja prema Kanadi primetna

nestandarna opservacija u junu 2016. godine koja je uzrokovala pad broja putnika iz drugih

zemalja. Kako su putnici iz Velike Britanije najbrojniji posetioci Kanade moguće je da je

nestandarna opservacija posledica Brexita i pada vrednosti britanske valute.

Ovi rezultati su u skladu sa nalazima autora Kulendran i Witt (2003) i Du Preez i Witt (2003)

koji su pokazali da univarijantni modeli klase ARIMA pokazuju najpreciznije prognoze na

međunarodnim dolaznim letovima prema Velikoj Britaniji, Novom Zelandu, Japanu, USA,

Australiji i Sejšelima.

Što se tiče serija putnika u dolaznom i odlaznom avio saobraćaju Srbije, ARIMA modeli su

pokazali najbolje performanse predviđanja za 12 meseci unapred. Rezultati su u skladu sa

nalazima Petrovske (2017) koja je ispitivala serije putnika u međunarodnom avio saobraćaju

Makedonije.

Međutim, ARIMA je pokazivala pesimističke prognoze na seriji odlaznog avio saobraćaja iz

Srbije prema inostranstvu. Ovo je moguće posledica prisustva nestandardnih opservacija u

vremenskoj seriji. Naime, jedan od osnovnih nedostataka modela klase ARMA je da ne

“prepoznaje“ nekarakteristične opservacije naročito ne one opservacije koje imaju dugoročni

efekat na seriju ili pomeraju srednji nivo vremenske serije (Hassler i sar., 2013).

U seriji dolaznog avio saobraćaja iz Srbije prema inostranim zemljama identifikovana je

nestandarna opservacija početkom 2010. godine što bi mogla biti posledica Evropske dužničke

krize. Efekti Svetske ekonomske krize (2007/2009) i Evropske dužničke krize (2009/2010) na

19 Za više informacija o ekonomskim indikatorima i efektima ekonomske recesije pogledati “Canada's Performance

Report 2008-09: The Government of Canada's Contribution“ dostupno u elektronskoj formi na web lokaciji:

https://www.tbs-sct.gc.ca/reports-rapports/cp-rc/2008-2009/cp-rc-eng.pdf

Master rad Tanja Armenski

63

Srbiju manifestovali su se kroz pad likvidnosti, značajno povlačenja stranih investitora sa tržišta

Srbije, kao i usporavanje privredne aktivnosti realnog sektora (Dragutinović i sar., 2009).

Preciznost prognoze se može poboljšati modelovanjem ove nestandardne opservacije

uvođenjem regresora u model u obliku:

𝐸𝐹𝐾𝑡 = 1 𝑧𝑎 𝑡 ≥ 𝑗𝑎𝑛𝑢𝑎𝑟 20100 𝑧𝑎 𝑡 < 𝑗𝑎𝑛𝑢𝑎𝑟 2010

gde je 𝐸𝐹𝐾𝑡 efekat Evropske dužničke krize na Srbiju.

U seriji odlaznog avio saobraćaja iz Srbije takođe je identifikovana nestandardna opservacija u

januaru, 2009. godine koja je imala dugoročni efekat na seriju. Pad broja putnika iz inostranstva

prema Srbiji u ovom periodu takođe može biti posledica Svetske ekonomske krize ili Evropske

dužničke krize.

Interesanto je da su u serijama avio saobraćaja Srbije prisutne pozitivne nestandardne

opservacije na dolaznim letovima u novembru, 2013. godini i na odlaznim letovima iz Srbije

prema inostranstvu u januaru, 2014. godine. Ove aditivne opservacije mogu biti efekti

revitalizacije srpskog avio saobraćaja nakon privatizacije srpske nacionalne aviokompanije Jat

Airways izvršene 1. avgusta 2013.

U daljem istraživanjima neophodno je ispitati preciznost odabranih modela predviđanja u

dugoročnim prognozama do 24 meseci unapred. Takođe je neophodno ispitati robusnost

ocenjenih modela na strukturne promene u serijama što se može postići ispitivanjem dužeg

vremenskog horizonta. Za Srbiju, nažalost, podaci o broju putnika u avio saobraćaju pre 2007.

godine nisu dostupni, ali se prognozom unazad (backshift) ovi podaci mogu simulirati.

Master rad Tanja Armenski

64

Literatura

1. Akaike, H. (1974). A New Look at the Statistical Model Identification, IEEE Transactions

on Automatic Control, AC-19, 716–723.

2. Baggs, J., Fung, L. and Lapham, B. (2015). Exchange Rates, Cross-Border Travel, and

Retailers: Theory and Empirics. Journal of Queen’s Economics Department, 1351, 1-47.

3. Bao, Y., Xiong, T., Hu, Z. (2012). Forecasting Air Passenger Traffic by Support Vector

Machines with Ensemble Empirical Mode Decomposition and Slope-Based Method,

Discrete Dynamics in Nature and Society, 1-12.

4. Bougas, C. (2013). Forecasting Air Passenger Traffic Flows in Canada: An Evaluation of

Time Series Models and Combination Methods, master thesis, University Laval, Quebec,

Canada.

5. Bourbonnais, R., Terraza, M. (2004). Analyse des séries temporelles: applications à

l’économie et à la gestion, volume 3. Dunod.

6. Box, G.E.P., Cox, D. R. (1964). An Analysis of Transformation. Journal of the Royal

Statistical Society, Series B, 16, 211-252.

7. Box, G.E.P., Jenkins, G. M. (1976). Time Series Analysis: Forecasting and Control.

Revised Edition. San Francisco, Holden Day.

8. Canada Goverment (2009). Canada's Performance Report 2008-09. Dostupno u

elektronskoj formi na web lokaciji: https://www.tbs-sct.gc.ca/reports-rapports/cp-rc/2008-

2009/cp-rc-eng.pdf

9. Chu, F. (2009). Forecasting tourism demand with Arma-based methods. Tourism

Management, 30(5), 740–751.

10. Claveria, O., Torra, S., Monte, E. (2016). Modelling Tourism Demand to Spain With

Machine Learning Techniques. The Impact of Forecast Horizon on Model Selection.

Revista de Economía Aplicada, 72 (24), 109-132.

Master rad Tanja Armenski

65

11. Coshall, J. (2009). Combining volatility and smoothing forecasts of UK demand for

international tourism. Tourism Management, 30(4), 495–511.

12. Croux, C., Crevits, R. (2016). Robust forecasting of short time series, International

Conference on Robust Statistics, Geneva, Switzerland.

13. Dickey, D.A., Fuller W.A. (1981). Likelihood ratio statistics for autoregressive time series

with a unit root, Econometrica, 49, 1,057-1,072.

14. Du Preez, J., and Witt, S. F. (2003). Univariate versus multivariate time series forecasting:

An application to international tourism demand. International Journal of Forecasting, 19,

435- 451.

15. Dragutinović, S., Vjetrov, A., Đurić, U., Radenković, T., Cvjetićanin, I., Žutić, E., Kalašić,

O. (2009). Svetska ekonomska kriza i posledice po privredu Srbije, studije i istraživanja br.

11/2009, Institut fakulteta za ekonomiju, finansije i administraciju, Univerzitet u Beogradu,

Beograd.

16. Ganga, R. S., Reddy, P.C.P., Mohan, B. C. (2018). System for Intelligent Tourist

Information using Machine Learning Techniques. International Journal of Applied

Engineering Research, 13(7), 5321-5327.

17. Gil-Alana, L. A., Barros, C. P., Assaf, A. G. (2012). The US airline industry: persistence

and breaks, Transportmetrica A: Transport Science, 9:8, 742-752.

18. Gunter, U., Önder, I. (2015). Forecasting International City Tourism Demand for Paris:

Accuracy of Uni- and Multivariate Models Employing Monthly Data, Tourism

Management, 46, 123-135.

19. Ghysels, E., Osborn, R. D. (2001). The Econometric Analysis of Seasonal Time Series.

Cambridge University Press, Cambridge, UK.

20. Harvey, R. (1993). Time Series Models. MIT Press, second edition.

Master rad Tanja Armenski

66

21. Hassani H, Silva E, Antonakakis N, Filis G. (2017). Forecasting accuracy evaluation of

tourist arrivals. Tourism Research, 63, 112-127.

22. Hassler, U., Wolters, J., Kirchgässner, G. (2013). Introduction to Modern Time Series

Analysis, 2nd edition, Springer, Heidelberg, Germany.

23. Kalić, M., Dožić, S., Babić, D. (2011). Predicting Air Travel Demand Using Soft

Computing: Belgrade Airport Case Study. Procedia Social and Behavioral Sciences: Euro

Working Group on Transportation, 00, 1-10.

24. Kovačić, J. Z. (1995). Analiza vremenskih serija, Ekonomski fakultet, Univerzitet u

Beogradu. Beograd.

25. Kulendran, N., Shan, J. (2002). Forecasting China’s Monthly Inbound Travel Demand.

Journal of Travel & Tourism Marketing, 13, 5-19.

26. Kulendran, N., Witt, S. (2003). Forecasting the demand for international business tourism.

Journal of Travel Research, 41(3), 265–271.

27. Kuljanin, J., Kalić, M. (2015). Exploring characteristics of passengers using traditional and

low-cost airlines: A case study of Belgrade Airport. Journal of Air Transport Management,

46 (12-18).

28. Kumar, M. and Sharma, S. (2016). Forecasting tourist in-flow in South East Asia: A case

of Singapore, Tourism and Management Studies, 12 (1), 107-119.

29. Mihailović, A. (2011). Analiza vremenskih serija. Prirodno-matematički fakultet, master

rad. Univerzitet u Novom Sadu, Novi Sad.

30. Milenković, M., Svadlenka, L., Melichar, V., Bojovic, N., Avramović, Z. (2015). SARIMA

modelling approach for railway passenger flow forecasting. Transportation, 1-8.

31. Mladenović, Z., Nojković, A. (2012). Primenjena analiza vremenskih serija, Centar za

izdavačku delatnost ekonomskog fakulteta u Beogradu, Beograd, Srbija.

Master rad Tanja Armenski

67

32. Montgomery, D. C., Jennings, C. L., Kulachi, M. (2008). Introduction to Time Series

Analysis and Forecasting, John Wiley and Sons, New Jersey, USA.

33. Nai, W., Liu, L., Wang, S., Dong, D. (2017). An EMD–SARIMA-Based Modeling

Approach for Air Traffic Forecasting, Algorithms, 10 (139), 1-16.

34. Petrovska, B. (2017). Predicting tourism demand by A.R.I.M.A. models (Macedonia).

Economic Research-Ekonomska Istraživanja, 30 (1), 939–950.

35. Rajter-Ćirić, D. (2009). Verovatnoća, Univerzitet u Novom Sadu, Prirodno- matametički

fakultet u Novom Sadu, Novi Sad.

36. Shen, S., Li, G., Song, H. (2011). Combination forecasts of international tourism demand.

Annals of Tourism Research, 38(1), 72–89.

37. Statistics Canada (2017c). CANSIM 387-0010: Tourism gross domestic product (GDP),

annual (Preuzeto 11.5.2018).

38. Statistics Canada, (2017a). CANSIM 427-0001: Number of international travellers entering

or returning to Canada, by type of transport (Preuzeto 11.5.2018).

39. Statistics Canada, (2017b). CANSIM 379-0028: Gross domestic product (GDP) at basic

prices, by North American Industry Classification System (NAICS), provinces and

territories (Preuzeto 11.5.2018).

40. Statistics Canada, (2017d). CANSIM 387-0003: Employment generated by tourism, annual

(Preuzeto 11.5.2018).

41. Statistički godišnjak (2017). Bruto dodata vrednost po delatnostima i bruto domaći

proizvod, Republički zavod za statistiku R. Srbije, Beograd. (Preuzeto 28.5.2018).

42. Yılmaz, E. (2015). Forecasting tourist arrivals to Turkey. Tourism, 63(4), 435 – 445.