Analisis Deret Berkala
Bahan Ajar (Materi Pelengkap Modul)
Diklat Fungsional Statistisi Tingkat Ahli Angkatan 21 Badan Pusat Statistik
Tahun 2020
Jimmy Ludin, SST., M.Si.
Pusat Pendidikan dan Pelatihan Badan Pusat Statistik
Tahun 2020
Analisis Deret Berkala
i
DAFTAR ISI
DAFTAR ISI ............................................................................................................................ i
BAB 1 .....................................................................................Error! Bookmark not defined.
DATA DERET BERKALA MENGGUNAKAN ARIMA ................................................................ 1
A. Pengertian Data Deret Berkala ............................................................................... 1
B. Stasioner ................................................................................................................. 1
C. Klasifikasi Model ARIMA ......................................................................................... 1
D. Musiman dan Model ARIMA ................................................................................... 2
E. Penaksiran Parameter ...............................................Error! Bookmark not defined.
F. Pengujian Parameter Model ................................................................................... 2
G. Pemilihan Model Terbaik ..........................................Error! Bookmark not defined.
H. Peramalan Dengan Model ARIMA ............................Error! Bookmark not defined.
BAB 2 .....................................................................................Error! Bookmark not defined.
CONTOH PENERAPAN ARIMA ............................................................................................. 3
A. Pendahuluan ........................................................................................................... 3
B. Stasioneritas Data ................................................................................................... 3
C. Pemodelan ARIMA Menggunakan Metode Correlogram ....................................... 4
DAFTAR PUSTAKA ............................................................................................................. 11
Analisis Deret Berkala
1
DATA DERET BERKALA MENGGUNAKAN ARIMA
A. Pengertian Data Deret Berkala
Data deret berkala atau deret waktu adalah sekumpulan data observasi
yang variabelnya diukur dalam urutan periode waktu, misalnya bulanan,
triwulanan, tahunan, dan sebagainya. Tujuan dari pengukuran data deret berkala
adalah untuk menemukan pola data secara historis dan menerapkan pola tersebut
untuk peramalan. Peramalan deret berkala didasarkan pada nilai variabel yang
telah lalu.
Menurut Box et al (1994), jika sekumpulan observasi tersebut bersifat
kontinyu, maka dikatakan sebagai deret waktu kontinyu, dan jika sekumpulan
observasi tersebut bersifat diskrit, maka dikatakan sebagai deret waktu diskrit.
Sekumpulan observasi dari deret waktu diskrit terbentuk pada waktu t = 1,2,…,N
dan dapat di tuliskan dengan Zt = Z1, Z2, …, ZN..
B. Stasioner
Menurut Box et al (1994), untuk menggunakan model ARIMA, maka syarat
utama yang harus dipenuhi adalah stasioneritas, baik dalam rata-rata maupun
varians. Data deret waktu dikatakan stasioner dalam varians jika variansnya
tidak dipengaruhi oleh waktu atau variansnya konstan. Stastioner dalam rata-
rata yaitu jika nilai rata-ratanya konstan dan tidak dipengaruhi oleh waktu
(Makridakis et al, 1999).
Untuk melihat stasioneritas digunakan tes unit root atau biasa disebut
juga sebagai tes ADF (Augmented Dickey-Fuller). Untuk mengatasi
ketidakstasioneran data dalam rata-rata, maka dapat dilakukan proses
differencing.
C. Klasifikasi Model ARIMA
Model Box-Jenkins (ARIMA) dibagi ke dalam 3 kelompok, yaitu: model
autoregressive (AR), moving average (MA), dan model campuran ARIMA
(autoregressive moving average) yang mempunyai karakteristik dari dua model
pertama.
1. Autoregressive Model (AR)
Analisis Deret Berkala
2
Model autoregressive mendasarkan pada asumsi data pada periode sekarang
dipengaruhi oleh data periode sebelumnya. Misalnya adalah impor beras pada
semester ini dipengaruhi oleh impor beras semeseter sebelumnya.
2. Moving Average Model (MA)
Model moving average mendasarkan pada asumsi data pada periode sekarang
dipengaruhi oleh nilai residual data periode sebelumnya.
3. Model Campuran
a. Proses ARMA
Model autoregressive moving average mendasarkan pada asumsi data pada
periode sekarang dipengaruhi oleh data periode sebelumnya dan juga oleh
nilai residual data periode sebelumnya.
b. Proses ARIMA
Hampir sama seperti model ARMA, model autoregressive integrated moving
average mendasarkan pada asumsi data pada periode sekarang
dipengaruhi oleh data periode sebelumnya dan juga oleh nilai residual data
periode sebelumnya, hanya saja apabila non-stasioneritas ditambahkan
pada campuran proses ARMA, maka model umum ARIMA (p,d,q) terpenuhi.
D. Musiman dan Model ARIMA
Musiman didefinisikan sebagai suatu pola yang berulang-ulang dalam
selang waktu yang tetap.untuk data yang stasioner, faktor musiman dapat
ditentukan dengan mengidentifikasi koefisien autokorelasi pada dua atau tiga time-
lag yang berbeda nyata dari nol. Autokorelasi yang secara signifikan berbeda dari
nol menyatakan adanya suatu pola dalam data. Untuk mengenali adanya faktor
musiman, seseorang harus melihat pada autokorelasi yang tinggi.
Proses identifikasi dari model musiman tergantung pada alat-alat statistik
berupa autokorelasi dan parsial autokorelasi, serta pengetahuan terhadap system
(atau proses) yang dipelajari.
E. Pengujian Parameter Model
Pengujian parameter dapat dilakukan sebagai berikut:
a. Pengujian masing-masing parameter model secara parsial
b. Pengujian model secara keseluruhan
Analisis Deret Berkala
3
PENERAPAN METODE ARIMA
A. Pendahuluan
Pada bagian ini akan dibahas mengenai pembentukan model ARIMA dari
data curah hujan dengan menggunakan metode ARIMA. Data tersebut dibagi
menjadi dua bagian di mana bagian pertama memuat data curah hujan dari bulan
Januari 2006 sampai bulan Desember 2012 dan akan digunakan untuk
pembentukan model. Data bagian kedua memuat data dari bulan Januari 2013
sampai bulan Desember 2013 yang akan digunakan untuk melihat akurasi
peramalan. Plot datanya adalah sebagai berikut:
Dari grafik di atas, bisa tuliskan deskripsi atau gambaran plot data Time series
tersebut. Bisa berupa ukuran-ukuran statistik, seperti maksimum, minimum, rata-
rata, standar deviasi, dan lain-lain. Bisa secara keseluruhan atau secara tahunan.
Data di bagi 2 bagian untuk training dan testing. Data Training digunakan untuk
pemodelan yaitu data dari tahun 2006 sampai tahun 2012. Data testing digunakan
untuk membandingkan hasil prediksi yaitu data tahun 2013..
B. Stasioneritas Data
Sebelum melakukan pemodelan terhadap data deret waktu, maka data
tersebut harus memenuhi asumsi stasioner terhadap rata-rata.
Data tersebut dilihat stasioneritasnya dengan menggunakan tes
Augmented Dickey Fuller. Hipotesis dari tes ADF adalah sebagai berikut:
0
100
200
300
400
500
600
700
800
2006 2007 2008 2009 2010 2011 2012 2013 2014
huja
n
Analisis Deret Berkala
4
H0 : a = 1 , data deret waktu tidak stasioner
H1 : a < 1 , data deret waktu stasioner
hasilnya adalah sebagai berikut:
Augmented Dickey-Fuller test for hujan
testing down from 11 lags, criterion AIC
sample size 73
unit-root null hypothesis: a = 1
test without constant
including 10 lags of (1-L)hujan
model: (1-L)y = (a-1)*y(-1) + ... + e
estimated value of (a - 1): 0,0157966
test statistic: tau_nc(1) = 0,274853
asymptotic p-value 0,7657
1st-order autocorrelation coeff. for e: -0,014
lagged differences: F(10, 62) = 4,276 [0,0002]
test with constant
including 4 lags of (1-L)hujan
model: (1-L)y = b0 + (a-1)*y(-1) + ... + e
estimated value of (a - 1): -0,752454
test statistic: tau_c(1) = -6,43947
asymptotic p-value 9,782e-009
1st-order autocorrelation coeff. for e: -0,001
lagged differences: F(4, 73) = 6,654 [0,0001]
Dari output diatas, nilai p-value adalah 9,78 x 10^-9 (lebih kecil dari 0,05), maka
dapat dikatakan bahwa data stasioner pada level pada model ARIMA dengan
konstanta.
C. Pemodelan ARIMA Menggunakan Metode Correlogram
Setelah data sudah bersifat stasioner, maka selanjutnya dapat diidentifikasi
model yang sesuai dengan data. Untuk mengidentifikasi model dari data dapat
digunakan plot ACF dan PACF sebagai berikut:
Analisis Deret Berkala
5
Autocorrelation function for hujan ***, **, * indicate significance at the 1%, 5%, 10% levels using standard error 1/T^0.5 LAG ACF PACF Q-stat. [p-value] 1 0.6911 *** 0.6911 *** 41.5732 [0.000] 2 0.3618 *** -0.2218 ** 53.1056 [0.000] 3 0.0753 -0.1549 53.6110 [0.000] 4 -0.2364 ** -0.3248 *** 58.6595 [0.000] 5 -0.4954 *** -0.2798 ** 81.0983 [0.000] 6 -0.5445 *** -0.0155 108.5614 [0.000] 7 -0.4493 *** 0.0040 127.5020 [0.000] 8 -0.2359 ** 0.1203 132.7894 [0.000] 9 0.0193 0.0625 132.8254 [0.000] 10 0.2822 *** 0.1251 140.5987 [0.000] 11 0.4728 *** 0.1181 162.7225 [0.000] 12 0.5140 *** 0.0269 189.2273 [0.000] 13 0.4310 *** 0.0434 208.1300 [0.000] 14 0.3012 *** 0.1243 217.4914 [0.000] 15 0.0668 -0.0337 217.9580 [0.000] 16 -0.2263 ** -0.1484 223.3970 [0.000] 17 -0.3871 *** 0.0098 239.5528 [0.000] 18 -0.4645 *** -0.1032 263.1638 [0.000] 19 -0.4101 *** 0.0650 281.8509 [0.000] 20 -0.2574 ** -0.0223 289.3277 [0.000] 21 -0.0448 -0.0215 289.5582 [0.000] 22 0.1987 * 0.0806 294.1565 [0.000] 23 0.4462 *** 0.1996 * 317.7332 [0.000] 24 0.4612 *** -0.1577 343.3388 [0.000]
Gambar 2.3. Output berupa Plot ACF dan PACF
-1
-0.5
0
0.5
1
0 5 10 15 20 25
lag
ACF for hujan
+- 1.96/T^0.5
-1
-0.5
0
0.5
1
0 5 10 15 20 25
lag
PACF for hujan
+- 1.96/T^0.5
Analisis Deret Berkala
6
Berdasarkan gambar, ternyata tidak mudah untuk menentukan model yang
sesuai. Banyak model yang bisa dibentuk berdasarkan gambar tersebut. Dari
model-model yang dapat dibentuk tersebut harus dipilih model yang bisa
menghasilkan nilai AIC paling kecil, parameternya signifikan dan residualnya
berdistribusi normal dan tidak ada otokorelasi.
Pada gambar tersebut juga terlihat bahwa pada plot ACF, lag yang
signifikan yaitu lag 1, 2, kemudian terputus. dan membentuk pola sinusoidal.
Kemudian pada plot PACF-nya dapat dilihat lag yang signifikan yaitu pada lag 1,
2, 4, 5, Lag yang signifikan pada plot PACF terputus setelah lag ke 2. Berdasarkan
tabel 2.1, maka model yang bisa dibentuk dengan melihat pola ACF dan PACF
diatas adalah:
ARIMA (1,0,0), ARIMA (2,0,0), ARIMA (4,0,0), ARIMA (5,0,0), ARIMA (1,0,1),
ARIMA (1,0,2), ARIMA (2,0,1), ARIMA (2,0,2), dst
D. Estimasi Parameter ARIMA
ARIMA (1,0,0) coefficient std. error z p-value
-------------------------------------------------------
const 302,148 55,7216 5,422 5,88e-08
***
phi_1 0,697355 0,0775684 8,990 2,47e-019
***
Mean dependent var 292,2810 S.D. dependent var
222,7029
Mean of innovations −1,189024 S.D. of innovations
158,4406
R-squared 0,487827 Adjusted R-squared
0,487827
Log-likelihood −545,0158 Akaike criterion
1096,032
Schwarz criterion 1103,324 Hannan-Quinn
1098,963
ARIMA (2,0,0) coefficient std. error z p-value
--------------------------------------------------------
const 298,505 44,7230 6,675 2,48e-011
***
phi_1 0,861899 0,106188 8,117 4,79e-016
***
Analisis Deret Berkala
7
phi_2 −0,233423 0,105875 −2,205 0,0275
**
Mean dependent var 292,2810 S.D. dependent var
222,7029
Mean of innovations −0,804126 S.D. of innovations
153,9543
R-squared 0,516400 Adjusted R-squared
0,510503
Log-likelihood −542,6609 Akaike criterion
1093,322
Schwarz criterion 1103,045 Hannan-Quinn
1097,231
ARIMA (4,0,0)
Parametenya tidak signifikan
ARIMA (5,0,0)
Parameternya tidak signifikan
ARIMA (1,0,1)
Parameternya signifikan di level 10%
ARIMA (1,0,2)
Parametenya tidak signifikan
ARIMA (2,0,1) coefficient std. error z p-value
--------------------------------------------------------
const 296,511 23,0045 12,89 5,17e-038
***
phi_1 1,50153 0,0948337 15,83 1,83e-056
***
phi_2 −0,713093 0,0789760 −9,029 1,73e-019
***
theta_1 −0,700562 0,0932022 −7,517 5,62e-014
***
Mean dependent var 292,2810 S.D. dependent var
222,7029
Mean of innovations −0,917919 S.D. of innovations
145,2173
R-squared 0,569795 Adjusted R-squared
0,559173
Log-likelihood −537,9306 Akaike criterion
1085,861
Analisis Deret Berkala
8
Schwarz criterion 1098,015 Hannan-Quinn
1090,747
ARIMA (2,0,2) coefficient std. error z p-value
---------------------------------------------------------
const 296,033 19,5730 15,12 1,12e-051
***
phi_1 1,68495 0,0524195 32,14 1,08e-226
***
phi_2 −0,945254 0,0515952 −18,32 5,67e-075
***
theta_1 −1,27562 0,182801 −6,978 2,99e-012
***
theta_2 0,611473 0,153379 3,987 6,70e-05
***
Mean dependent var 292,2810 S.D. dependent var
222,7029
Mean of innovations 0,780309 S.D. of innovations
137,2022
R-squared 0,616713 Adjusted R-squared
0,602340
Log-likelihood −533,6828 Akaike criterion
1079,366
Schwarz criterion 1093,951 Hannan-Quinn
1085,229
Dari model ARIMA diatas, model ARIMA terbaik yaitu model ARIMA (2,0,2)
karena AIC, SIC, HQC paling kecil.
Analisis Deret Berkala
9
E. Uji kenormalan residual dan uji residual correlogram
Dari grafik di atas, dapat dikatakan residualnya berdistribusi normal, hal ini
dapat dilihat dari nilai p-value = 0,28 >0,05. Teruskan analisisnya…..
Dari grafik diatas, dapat dikatakan bahwa residualnya tidak terjadi
autokorelasi, hal ini dapat dilihat bahwa lag residualnya tidak ada yang signifikan
atau tidak ada yang melewati garis batas.
0
0,0005
0,001
0,0015
0,002
0,0025
0,003
0,0035
-400 -300 -200 -100 0 100 200 300 400
Density
uhat10
relative frequency
N(0,78031 141,48)Test statistic for normality:
Chi-square(2) = 2,544 [0,2803]
-0,3
-0,2
-0,1
0
0,1
0,2
0,3
0 2 4 6 8 10 12 14 16
lag
Residual ACF
+- 1,96/T^0,5
-0,3
-0,2
-0,1
0
0,1
0,2
0,3
0 2 4 6 8 10 12 14 16
lag
Residual PACF
+- 1,96/T^0,5
Analisis Deret Berkala
10
F. Peramalan
Setelah didapatkan model ARIMA dari metode Correlogram, maka
selanjutnya dilakukan peramalan dengan menggunakan model ARIMA tersebut.
Peramalan dilakukan sebanyak 12 observasi kedepan dan hasil dari peramalan
tersebut dibandingkan dengan data bagian kedua. Hasil peramalan model ARIMA
tersebut dapat dilihat sebagai berikut :
Dari tabel tersebut mengindikasikan bahwa peramalan dengan metode
Correlogram menghasilkan tingkat akurasi yang tinggi. Plot hasil peramalan
dengan kedua metode tersebut dapat dilihat pada gambar berikut:
Tahun Data Asli Prediksi 2013:01 765,0 591,3
2013:02 480,0 592,3
2013:03 350,0 516,2
2013:04 251,0 386,9
2013:05 183,0 241,1
2013:06 41,0 117,5
2013:07 22,0 47,2
2013:08 1,0 45,5
2013:09 28,0 109,1
2013:10 180,0 217,9
2013:11 295,0 341,0
2013:12 424,0 445,8
1. Tuliskan analisis tentang data prediksi
- Maksimum, minimum, rata-rata, std.deviasi, dll (dari materi Explorasi Data)
2. Tambahkan di bab kesimpulan dan ”saran”
Gambar 2.5. Hasil Peramalan dengan Metode Correlogran
-400
-200
0
200
400
600
800
1000
2009,5 2010 2010,5 2011 2011,5 2012 2012,5 2013 2013,5 2014
hujan
forecast
95 percent interval
Analisis Deret Berkala
11
DAFTAR PUSTAKA
Box, G.E.P., Jenkins, G.M., dan Reissel, G.C., 1994. Time Series Analysis Forecasting and Control, edisi ketiga. Englewood Cliffs : Prentice Hall.
Ludin, J, “Pendekatan Algoritma Genetika Untuk Pemodelan Data Deret Waktu”, Tesis, Fakultas MIPA, Institut Teknologi Sepuluh November, 2011
Makridakis, S., Wheelwright, S.C., dan McGee, V.E., 1999. Metode dan Aplikasi Peramalan, Jilid 1 Edisi Kedua, Terjemahan Ir. Hari Suminto, Bina Rupa Aksara, Jakarta.