penerapan model arima - adw/06 - adw s2...data contoh untuk mengidentifikasi nilai p , d , dan q ....
TRANSCRIPT
Penerapan Model ARIMA
(Bagian I)
Dr. Kusman Sadik, M.Si
Departemen Statistika IPB, 2016
1
2
Ada tiga tahapan iterasi dalam pemodelan data deret waktu,
yaitu:
1. Penentuan model tentatif (spesifikasi model) berdasarkan
data contoh untuk mengidentifikasi nilai p, d, dan q.
2. Pendugaan parameter model ARIMA(p, d, q) yang
diidentifikasi, yaitu penduga nilai , , dan σ𝑒2.
3. Analisis diagnostik untuk melihat kelayakan model.
3
Prosedur iterasi ini sering disebut ”Metode Box-
Jenkins”.
Untuk model ARIMA(p, d, q), spesifikasi dilakukan
untuk menentukan nilai p, d, dan q.
Alat yang digunakan pada tahap identifikasi ini adalah
fungsi autokorelasi.
Fungsi autokorelasi ini diduga dari data contoh atau
disebut fungsi autokorelasi contoh (sample of
autocorrelation function atau SACF atau ACF saja).
Disamping itu ada pula fungsi autokorelasi parsial
(sample of partial autocorrelation function atau SPACF
atau PACF saja)
4
a. ACF
.... ,2 ,1 ,
)(
))((
1
2
1
k
YY
YYYY
rn
t
t
kn
t
ktt
k
n
Y
Y
n
t
t 1
rk merupakan penduga bagi k
5
a. PACF
PACF : kk = Corr(Yt, Yt-k | Yt-1, Yt-2, …, Yt-k+1)
Berdasarkan persamaan Yule-Walker:
j = k1j-1 + k2j-2 + ... + kkj-k
j = 1, 2, ..., k; Catatan: j = -j dan 0 = 1
k ACF; kk PACF
kk̂ penduga bagi kk
6
Contoh:
Misal diketahui data : 4, 2, 5, 1. Tentukan ACF (r1, r2) dan
PACF (𝜙 11 ,𝜙 22)
Melalui persamaan .... ,2 ,1 ,
)(
))((
1
2
1
k
YY
YYYY
rn
t
t
kn
t
ktt
k
Dapat diperoleh penduga ACF : r1 = -0.7 dan r2 = 0.4
7
Berdasarkan persamaan Yule-Walker dapat diperoleh
penduga PACF kk:
j = k1j-1 + k2j-2 + ... + kkj-k
Untuk k =1 j = 1
1 = 110 1 = 11(1) r1 = 𝜙 11 = -0.7
Untuk k = 2 j = 1, 2
1 = 210 + 221 1 = 21 + 221
2 = 211 + 220 2 = 211 + 22
8
1 = 210 + 221 1 = 21 + 221
2 = 211 + 220 2 = 211 + 22
(1)2 = 211 + 22(1)
2 ...... Pers(1)
2 = 211 + 22 …….. Pers(2)
Berdasarkan Pers(1) dan Pers(2) diperoleh:
(1)2 - 2 = 22(1)
2 - 22
22 = {(1)2 - 2}/{(1)
2 - 1}
𝜙 22= {(r1)2 - r2}/{(r1)
2 - 1} = 0.09/(-0.51) = -0.176
9
0.0
0.2
0.4
0.6
0.8
1.0
1 2 3 4 5
ACF
0.0
0.2
0.4
0.6
0.8
1.0
1 2 3 4 5 6
Sample of ACF
kkr
k k
Pengidentifikasian Model
Model MA: Misal MA(1) : Yt = et - et-1
ACF :
1 ; 0
1 ;1 2
k
k
k
10
Karena rk berasal dari data contoh maka diperlukan galat
baku bagi rk yaitu Srk.
Sebagai nilai pendekatan : Srk = n/1 , dimana n adalah
banyaknya data.
Sehingga hipotesis H0 : k = 0 ditolak jika | rk | > 2Srk
atau | rk | > n/2 .
Misalnya, jika | r1 | > n/2 dan | rk | < n/2 untuk k =
2, 3, …, maka model tentatifnya adalah MA(1).
11
Model AR : Misalkan AR(1) : Yt = Yt-1 + et
ACF : k = k ; k = 1, 2, …
Untuk model AR, ACF merupakan fungsi eksponensial
sehingga ACF tidak dapat digunakan untuk menentukan
nilai p dalam AR(p).
PACF : untuk k = 1 1 = 11
untuk k = 2 1 = 21 + 221 .... (1)
2 = 211 + 22 .... (2)
12
0.0
0.2
0.4
0.6
0.8
1.0
1 2 3 4 5
PACF
0.0
0.2
0.4
0.6
0.8
1.0
1 2 3 4 5 6
Sample of PACF
kkkk̂
Berdasarkan persamaan (1) dan (2) 22 = 0.
Demikian juga 33 = 44 = ... = 0.
Sehingga PACF AR(1):
1 ; 0
1 ; 1
k
k
kk
Dengan demikian PACF dapat digunakan sebagai
penentu nilai p dalam model AR(p).
Hipotesis H0 : kk = 0 ditolak jika nkk /2 |ˆ| .
13
0.0
0.2
0.4
0.6
0.8
1.0
1 2 3 4 5 6 7 8 9
Sample of ACF
off tails
0.0
0.2
0.4
0.6
0.8
1.0
1 2 3 4 5 6 7 8 9
Sample of ACF
q lagafter off cuts
Pengidentifikasian nilai p dan q
14
15
Contoh (1)
16
Contoh (2)
17
Contoh (3)
d = 1
d = 1
18
Pendugaan Parameter Model
Apabila nilai p, d, dan q sudah dapat diidentifikasi, maka
selanjutnya dilakukan pendugaan terhadap parameter model,
yaitu 1, 2, ..., p untuk model AR(p) dan 1, 2, ..., q untuk
model MA(q) berdasarkan data terobservasi Y1, Y2, ..., Yn.
Metode pendugaan parameter :
Metode momen,
Metode kuadrat terkecil (least-square),
Metode kemungkinan maksimum (maximum likelihood).
19
1. Metode Momen
Metode ini didasarkan pada persamaan momen contoh dan
momen teoritis, kemudian memecahkan persamaan-persamaan
tersebut untuk mendapatkan penduga bagi parameter model.
Misalnya, menduga rataan populasi (teoritis) dengan rataan
contoh Y .
Model AR
a. AR(1) : Yt = Yt-1 + et
k = k ; k = 1, 2, …
1 = ˆˆ1 r1 = ̂
Jadi pada AR(1) penduga bagi parameter model, ,
adalah r1 yang dapat dihitung dari data.
20
b. AR(1) : Yt = + Yt-1 + et
Bagaimana menduga ?
Perhatikan model : (Yt - 𝑌 )= (Yt-1 - 𝑌 ) + et
↔ (Yt - 𝑌 )= (Yt-1 - 𝑌 ) + et
↔ Yt = (1 - )𝑌 + Yt-1 + et
↔ Yt = + Yt-1 + et
Sehingga : = (1 - )𝑌
21
c. AR(2) : Yt = 1Yt-1 + 2Yt-2 + et
Berdasarkan persamaan Yule-Walker :
k = 1k-1 + 2k-2 + ... + pk-p
maka diperoleh
1 = 1 + 21 dan 2 = 11 + 2
dengan metode momen diperoleh:
r1 = 1̂ +
2̂ r1 dan r2 = r1 1̂ + 2̂
penyelesaian terhadap dua persamaan ini diperoleh:
2
1
211
1
)1(ˆr
rr
dan
2
1
2
122
1ˆ
r
rr
22
Model MA
MA(1) : Yt = et - et-1
211
21 ˆ1
ˆ
r
sehingga diperoleh : 1
2
1
2
411ˆr
r
Sebagai catatan untuk persamaan ini, apabila | r1 | > 0.5
maka metode momen gagal untuk menduga parameter .
Untuk MA(2), MA(3), dst, metode momen menjadi
sangat kompleks, sehingga harus menggunakan metode
pendugaan lainnya.
23
Model ARMA
ARMA(1, 1) : Yt = Yt-1 - et-1 + et
1
221
))(1(
k
k
1
2 sehingga penduga bagi adalah : 1
2ˆr
r
Untuk menduga dapat digunakan persamaan pertama
dengan cara mengganti 1 dengan r1 dan dengan ̂ , yaitu
21 ˆˆˆ21
)ˆˆ)(ˆˆ1(
r
24
Contoh Kasus (Latihan):
Misalnya diketahui model AR(2) : Yt = + 1Yt-1 + 2Yt-2 + et.
Berdasarkan data diketahui bahwa r1 = 0.75, r2 = 0.61, dan
Y = 4.5. Tentukan ̂ , 1̂ , dan
2̂ dengan metode momen.
25
2. Metode Kuadrat Terkecil
Metode ini dilakukan dengan cara meminimumkan komponen
pada galat, yaitu
n
t
te1
2.
AR(1) : Yt = Yt-1 + et et = Yt - Yt-1
S() =
n
t
te1
2=
n
t
tt YY1
2
1)(
Penduga bagi parameter model, , dapat diperoleh
dengan cara meminimumkan S().
26
MA(1) : Yt = et - et-1 et = Yt + et-1
et = Yt + ( Yt-1 + et-2)
et = Yt + Yt-1 + 2Yt-2 +
3Yt-3 + ….
S() =
n
t
te1
2
Meminimumkan S() tidak dapat dilakukan secara
analitik / kalkulus karena bersifat non-linear, sehingga
harus diselesaikan secara numerik / iteratif, salah
satunya melalui algoritma Gauss-Newton.
27
3. Metode Kemungkinan Maksimum
Metode ini dilakukan dengan cara memaksimumkan fungsi
kemungkinan (likelihood), berdasarkan fungsi sebaran galat (et).
AR(1) : Yt = Yt-1 + et, misal et bsi
~ N(0, e2)
f(e1, e2, …., en) = )2
1exp(.)2(
1
2
2
2/)1(2
n
t
t
e
n
e e
L(, e2) = ))(
2
1exp(.)2( 2
12
2/)1(2
n
t
tt
e
n
e YY
Penduga dan e2 dapat diperoleh dengan cara
memaksimumkan fungsi kemungkinan L(, e2).
28
MA(1) : Yt = et - et-1
Fungsi kemungkinannya, L(, e2), bersifat non-linear
sehingga pemaksimumannya harus dilakukan secara
numerik / iteratif.
Catatan : SAS dan Minitab menggunakan metode iterasi
Gauss-Newton untuk menduga parameter AR(p),
MA(q), dan ARIMA(p, d, q).
29
-10
0
10
10 20 30 40
Zt
Index
Studi Kasus :
Tentukan model terbaik untuk data bulanan penjualan suatu
produk (Zt) sebagai berikut:
Zt : Data Asal
30
2
1
0
-1
-2
-3
40302010
Zt(
lag1)
Index
Zt(lag1) : Data Zt setelah differencing ordo-1
31
3
2
1
0
-1
-2
40302010
Zt(
lag2)
Index
Zt(lag2) : Data Zt setelah differencing ordo-2
32
1110987654321
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
Lag
Au
toco
rre
lati
on
Autocorrelation Function for Zt(with 5% significance limits for the autocorrelations)
Ada indikasi tidak stasioner. Mengapa?
33
1110987654321
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
Lag
Au
toco
rre
lati
on
Autocorrelation Function for Zt(lag1)(with 5% significance limits for the autocorrelations)
Ada indikasi tidak stasioner. Mengapa?
34
1110987654321
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
Lag
Au
toco
rre
lati
on
Autocorrelation Function for Zt(lag2)(with 5% significance limits for the autocorrelations)
Ada indikasi sudah stasioner. Mengapa?
ACF
35
1110987654321
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
Lag
Pa
rtia
l A
uto
co
rre
lati
on
Partial Autocorrelation Function for Zt(lag2)(with 5% significance limits for the partial autocorrelations)
PACF
36
Kandidat Model : ARIMA(0,2,1)dan ARIMA(1,2,0)
1110987654321
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
Lag
Au
toco
rre
lati
on
Autocorrelation Function for Zt(lag2)(with 5% significance limits for the autocorrelations)
1110987654321
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
Lag
Pa
rtia
l A
uto
co
rre
lati
on
Partial Autocorrelation Function for Zt(lag2)(with 5% significance limits for the partial autocorrelations)
37
Relative change in each estimate less than 0.0010
Final Estimates of Parameters
Type Coef SE Coef T P
MA 1 -0.4393 0.1371 -3.20 0.003
Constant -0.0995 0.1581 -0.63 0.533
Differencing: 2 regular differences
Number of observations: Original series 47, after
differencing 45
Residuals: SS = 48.3592
(backforecasts excluded)
MSE = 1.1246 DF = 43
ARIMA(0,2,1)
ARIMA model for Yt
Estimates at each iteration
Iteration SSE Parameters
0 66.1073 0.100 0.031
1 57.5810 -0.050 -0.011
2 51.8387 -0.200 -0.048
3 48.8500 -0.350 -0.083
4 48.3704 -0.435 -0.099
5 48.3691 -0.439 -0.099
6 48.3691 -0.439 -0.099
38
ARIMA(1,2,0)
ARIMA model for Yt
Estimates at each iteration
Iteration SSE Parameters
0 55.9021 0.100 0.035
1 50.7183 0.250 -0.022
2 47.5927 0.400 -0.056
3 46.1186 0.543 -0.069
4 45.9902 0.582 -0.067
5 45.9806 0.592 -0.067
6 45.9799 0.595 -0.067
7 45.9799 0.596 -0.067
8 45.9799 0.596 -0.067
Relative change in each estimate less than 0.0010
Final Estimates of Parameters
Type Coef SE Coef T P
AR 1 0.5958 0.1225 4.86 0.000
Constant -0.06673 0.06299 -1.06 0.295
Differencing: 2 regular differences
Number of observations: Original series 47, after
differencing 45
Residuals: SS = 45.9799
(backforecasts excluded)
MSE = 1.0693 DF = 43
39
Pemilihan Model Terbaik Berdasarkan MSE Terkecil
Berdasarkan hasil di atas:
ARIMA(0, 2, 1) MSE : 1.1246
ARIMA(1, 2, 0) MSE : 1.0693
Sehingga model terbaik berdasarkan nilai MSE terkecil adalah
ARIMA(1, 2, 0).
Model terbaik yang diperoleh dapat digunakan untuk melakukan
peramalan.
1. Melalui Minitab, bangkitkan data yt, (n = 225), berupa
model ARIMA(1, 2, 0) dengan = 0.5, Φ = 0.8 serta
et ~ Normal(0,1). Gunakan 200 data terakhir dan lakukan
proses berikut:
a. Berdasarkan ACF dan PACF untuk data yt tersebut,
identifikasilah kandidat model yang sesuai.
b. Berdasarkan kandidat model tersebut, tentukan model
terbaik berdasarkan nilai MSE-nya.
c. Bandingkan penduga parameter yang diperoleh untuk
model terbaik pada poin (b) tersebut dengan nilai
parameter yang sesungguhnya. Apa kesimpulan Anda?
40
2. Melalui Minitab, bangkitkan data yt, (n = 225), berupa
model ARIMA(1, 1, 2) dengan = 1.0, Φ = 0.8, θ1 = - 0.9,
dan θ2 = 0.7 serta et ~ Normal(0,1). Gunakan 200 data
terakhir dan lakukan proses berikut:
a. Berdasarkan ACF dan PACF untuk data yt tersebut,
identifikasilah kandidat model yang sesuai.
b. Berdasarkan kandidat model tersebut, tentukan model
terbaik berdasarkan nilai MSE-nya.
c. Bandingkan penduga parameter yang diperoleh untuk
model terbaik pada poin (b) tersebut dengan nilai
parameter yang sesungguhnya. Apa kesimpulan Anda?
41
42
Lihat Montgomery : Exercise 5.11, hlm. 290
Cryer, J.D. and Chan, K.S. 2008. Time Series Analysis with
Application in R. Springer.
Montgomery, D.C., et.al. 2008. Forecasting Time Series Analysis
2nd. John Wiley.
Wei, William, W.S. 1990. Time Series Analysis, Univariate and
Multivariate Methods. Adison-Wesley Publishing Company Inc,
Canada.
Abraham, B. and Ledolter, J. 2005. Statistical Methods for
Forecasting. John Wiley.
43
44
Bisa di-download di
http://www.stat.ipb.ac.id/en/index.php?page=dr-kusman-sadik
45