perbandingan metode jackknife jiang dan area …digilib.unila.ac.id/26821/3/skripsi tanpa bab...
TRANSCRIPT
PERBANDINGAN METODE JACKKNIFE JIANG DAN AREA-SPESIFIC
PADA PENDUGAAN MEAN SQUARED ERROR
MODEL BETA-BINOMIAL
Skripsi
Oleh
DITA PARAMITHA
JURUSAN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS LAMPUNG
BANDAR LAMPUNG
2017
ABSTRACT
COMPARISON JACKKNIFE JIANG AND AREA-SPESIFIC METHOD
IN ESTIMATION MEAN SQUARED ERROR
OF BETA-BINOMIAL MODEL
By
DITA PARAMITHA
Empirical Bayes (EB) method is one of method in small area estimation for count
or binary data. Estimation with EB method based on posterior which its parameter
be estimated by data. Beta Binomial model is a model that can be used for binary
data. In this research, parameter estimation from the EB estimator is estimated use
the method of momen. MSE of the EB estimator is evaluated by Jackknife Jiang
and Area-spesific both in theory and empirical. Empirical studied with Ri386
using the data of preprosperous family in Bandar Lampung 2014 we know that
EB estimator is biased. Based on calculation from the data, it showed that the
MSE of Area-spesific Jackknife method is smaller than the MSE of Jackknife
Jiang method.
Keyword: Small Area Estimation, Empirical Bayes (EB), Beta Binomial Model,
Method of Momen, Jackknife.
ABSTRAK
PERBANDINGAN METODE JACKKNIFE JIANG DAN AREA-SPESIFIC
PADA PENDUGAAN MEAN SQUARE ERROR
MODEL BETA-BINOMIAL
Oleh
DITA PARAMITHA
Metode Empirical Bayes (EB) merupakan salah satu metode pada pendugaan area
kecil untuk data cacah atau biner. Pendugaan dengan pendekatan EB didasarkan
pada sebaran posterior yang parameternya diduga dari data. Model Beta Binomial
merupakan salah satu model yang dapat digunakan pada respon biner. Pada
penelitian ini pendugaan parameter dari penduga EB dilakukan menggunakan
Metode Momen. Evaluasi Mean Square Error (MSE) pada penduga EB
dilakukan dengan metode Jackknife Jiang dan Area-spesific Jackknife baik secara
teori maupun empiris. Kajian secara empiris dilakukan dengan bantuan software
R i386 menggunakan data Keluarga Prasejahtera Tahun 2014 di Kota Bandar
Lampung. Hasil penelitian ini menunjukan bahwa penduga EB bersifat bias.
Berdasarkan perhitungan dari data diperoleh bahwa metode Area-specific
Jackknife menghasilkan MSE yang relatif lebih kecil dibandingkan MSE dengan
metode Jackknife Jiang.
Kata kunci: Pendugaan Area Kecil, Empirical Bayes (EB), Model Beta
Binomial, Metode Momen, Jackknife.
PERBANDINGAN METODE JACKKNIFE JIANG DAN AREA-SPESIFIC
PADA PENDUGAAN MEAN SQUARED ERROR
MODEL BETA-BINOMIAL
OLEH
Dita Paramitha
Skripsi
Sebagai Salah Satu Syarat untuk Mencapai Gelar
SARJANA SAINS
Pada
Jurusan Matematika
Fakultas Matematika dan Ilmu Pengetahuan Alam
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS LAMPUNG
BANDAR LAMPUNG
2017
RIWAYAT HIDUP
Penulis dilahirkan di Kurungan Nyawa pada tanggal 17 Juli 1995, sebagai anak
pertama dari tiga bersaudara, dari Bapak Awaludin dan Ibu Marwiyah.
Pendidikan Taman Kanak-kanak (TK) Dharma Wanita Utama diselesaikan tahun
2001, Sekolah Dasar Negeri (SDN) 01 Bumi Dipasena Utama diselesaikan pada
tahun 2007, Sekolah Menengah Pertama Negeri (SMPN) 26 Bandar Lampung
diselesaikan pada tahun 2010, dan Sekolah Menengah Atas Negeri (SMAN) 14
Bandar Lampung diselesaikan pada tahun 2013.
Tahun 2013, penulis terdaftar sebagai mahasiswi Jurusan Matematika FMIPA
melalui jalur SNMPTN. Selama menjadi mahasiswa penulis aktif organisasi pada
periode 2014/2015 sebagai anggota bidang kaderisasi Himpunan Jurusan
Matematika (HIMATIKA), sebagai sekretaris biro sirkulasi dan periklanan Unit
Kegiatan Mahasiswa Fakultas (UKMF) Natural, dan sebagai staff ahli kementrian
Pendidikan dan Kepemudaan Badan Eksekutif Mahasiswa Universitas (BEMU),
sedangkan periode 2015/2016 sebagai pimpinan usaha UKMF Natural. Pada
tanggal 18 Januari–14 Februari 2016 penulis melakukan kerja praktek di Badan
Pusat Statistik (BPS) Kota Bandar Lampung dan pada 25 Juli–25 Agustus 2016
penulis melaksanakan Kuliah Kerja Nyata (KKN) Kebangsaan di Desa Sungai
Buluh, Kecamatan Singkep Barat, Kabupaten Lingga, Provinsi Kepulauan Riau.
PERSEMBAHAN
Dengan mengucap Alhamdulillah, puji syukur kehadirat Allah SWT kupersembahkan skripsi ini kepada :
Kedua Orang Tua Tercinta,
Ayahanda Awaludin dan Ibunda Marwiyah
Orang yang telah membesarkan, merawat, dan mendidik saya hingga saat ini, memberikan dukungan materil maupun moril selama menempuh pendidikan
hingga saat ini. Terimakasih atas doa dan harapan yang besar kepada saya, atas segala cinta kasih sayang yang tulus ikhlas serta telah menjadi pembimbing
hidup disetiap langkah ini.
Adik David Adie Chandra dan Ricard Arjunandito Zetira
Adik kandung yang selalu memberikan motivasi dari canda tawa dan keisengan kalian. Terima kasih telah membuat saya menjadi kuat dan bersemangat untuk
menikmati hari-hari.
Dhanil Ajitama
Seseorang yang hadir dan memberikan warna-warni di hidup saya. Terima kasih setiap waktunya telah memberikan semangat dan motivasi.
Almamater Tercinta
Universitas Lampung
SANWACANA
Segala bentuk puji syukur penulis curahkan kehadirat Allah SWT, yang telah
melimpahkan rahmat dan karunia-Nya sehingga penulis dapat menyusun dan
menyelesaikan skripsi ini. Skripsi dengan judul “PERBANDINGAN METODE
JACKKNIFE JIANG DAN AREA-SPESIFIC PADA PENDUGAAN MEAN
SQUARED ERROR MODEL BETA-BINOMIAL” adalah salah satu syarat untuk
memperoleh gelar sarjana Sains di Universitas Lampung.
Penulisan skripsi ini tidak terlepas dari bantuan, bimbingan dan dukungan dari
berbagai pihak yang tentunya sangat bermanfaat dan berharga sehingga skripsi
ini dapat diselesaikan oleh penulis. Oleh karena itu, penulis mengucapkan terima
kasih kepada :
1) Ibu Widiarti, S.Si., M.Si., selaku dosen pembimbing utama yang telah
meluangkan waktu untuk membimbing, mengarahkan, dan memotivasi
penulis sehingga skripsi ini dapat terselesaikan.
2) Bapak Suharsono S, M.Sc., Ph.D., selaku dosen pembimbing pembantu yang
memberikan bantuan dan saran dalam penyelesaian skripsi ini.
3) Bapak Drs. Eri Setiawan, M.Si., selaku dosen penguji atas saran dan kritik
yang diberikan bagi skripsi ini.
4) Ibu Netti Herawati, M.Sc., Ph.D., selaku dosen pembimbing akademik yang
telah membimbing penulis selama mengikuti perkuliahan.
5) Bapak Tiryono Ruby, M.Sc., Ph.D., selaku Ketua Jurusan Matematika
Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Lampung.
6) Bapak Prof. Warsito, S.Si., D.E.A., Ph.D., selaku Dekan Fakultas
Matematika dan Ilmu Pengetahuan Alam Universitas Lampung.
7) Ibu, Bapak tersayang yang selalu memberikan dukungan baik moril maupun
materil dalam menyelesaikan skripsi ini serta adik David dan Dito yang
selalu memberikan canda tawa di sela-sela penulisan skripsi ini.
8) Dhanil Ajitama penyemangat dan motivator dalam menyelesaikan skripsi ini.
9) Sahabat tersayang Sisca A, Lena, Widya Ast, Aulianda P, Rifa RP, Dimas
RS, Efrizal, Shela M, Nina D, Galuh ISP, Hanifah S, Para Pejuang (Tiyas,
Nafisa) dan Anak Bawang (Della, Lia, Chaterine) Karina, Eka, Yucky, Heni,
Shintia, Dafri, Bang Gery, Bang Yefta, teman-teman angkatan 2013 dan
seluruh pihak yang telah membantu penulis yang tidak dapat disebutkan satu
persatu, atas peran dan dukungannya dalam menyusun skripsi ini.
Akhir kata, penulis menyadari bahwa skripsi ini jauh dari kesempurnaan, namun
penulis berharap penelitian ini dapat berguna dan bermanfaat bagi pembaca.
Bandar Lampung, Mei 2017
Penulis
Dita Paramitha
DAFTAR ISI
Halaman
DAFTAR TABEL ....................................................................................... xiii
DAFTAR GAMBAR .................................................................................. xiv
I. PENDAHULUAN ................................................................................ 1
1.1 Latar Belakang dan Masalah .......................................................... 1
1.2 Tujuan Penelitian ........................................................................... 3
1.3 Manfaat Penelitian ......................................................................... 3
II. TINJAUAN PUSTAKA ....................................................................... 4
2.1 Pendugaan Area Kecil .................................................................... 4
2.2 Metode Empirical Bayes ................................................................ 5
2.3 Model Beta Binomial ..................................................................... 7
2.4 Pendugaan Parameter dengan Metode Momen .............................. 11
2.5 Karakteristik Penduga Parameter ................................................... 12
2.5.1 Ketakbiasan ............................................................................ 12
2.5.2 Varian Minimum .................................................................... 13
2.6 Evaluasi Mean Squared Error (MSE) ........................................... 13
III. METODOLOGI PENELITIAN ............................................................ 16
3.1 Waktu dan Tempat Penelitian ........................................................ 16
3.2 Data Penelitian ............................................................................... 16
3.3 Metode Penelitian .......................................................................... 16
IV. HASIL DAN PEMBAHASAN ........................................................... 19
4.1 Model Beta Binomial ..................................................................... 19
4.2 Pendugaan Parameter Empirical Bayes Model Beta Binomial ...... 20
4.3 Karakteristik Penduga Empirical Bayes (𝑝�̂�𝐸𝐵).............................. 22
4.3.1 Ketakbiasan Penduga Empirical Bayes (𝑝�̂�𝐸𝐵) ....................... 22
4.3.2 Varian Penduga Empirical Bayes(𝑝�̂�𝐸𝐵) ................................. 23
4.4 Pendugaan Parameter dengan Metode Momen .............................. 24
4.5 Mean Squared Error Penduga Empirical Bayes(�̂�𝑖𝐸𝐵) ................... 29
4.6 Aplikasi Pendugaan Area Kecil pada Data Keluarga Prasejahtera
Tahun 2014 di Kota Bandar Lampung .......................................... 31
V. KESIMPULAN DAN SARAN ............................................................. 38
5.1 Kesimpulan .................................................................................... 38
5.2 Saran .............................................................................................. 38
DAFTAR PUSTAKA ................................................................................. 39
LAMPIRAN ................................................................................................ 41
DAFTAR TABEL
Tabel Halaman
1. Data Keluarga Prasejahtera Tahun 2014 di Kota Bandar Lampung ..... 32
2. Proporsi Dugaan Data Keluarga Prasejahtera Tahun 2014 di Kota Bandar
Lampung ................................................................................................ 33
3. Nilai Mean Squared Error Data Keluarga Prasejahtera Tahun 2014 di Kota
Bandar Lampung ................................................................................... 35
DAFTAR GAMBAR
Gambar Halaman
1. Scatterplot antara Penduga Langsung dan Penduga Bayes................... 34
2. Scatterplot Mean Squared Error antara metode Langsung, Metode
Jackknife Jiang dan Area specific-Jackknife………………………….. 36
I. PENDAHULUAN
1.1 Latar Belakang dan Masalah
Survei merupakan salah satu cara yang digunakan untuk memperoleh suatu
informasi. Penerapan sistem sampel dalam survei pada area yang kecil
menyebabkan objek survei menjadi terbatas dan menyebabkan informasi yang
diperoleh tidak mewakili populasi secara keseluruhan, sehingga pendugaan
langsung tidak dapat menghasilkan dugaan yang teliti. Guna menghasilkan
pendugaan yang lebih baik, maka digunakan metode pendugaan tidak langsung
pada area kecil (Rao, 2003).
Small Area Estimation (SAE) merupakan teknik statistika yang digunakan untuk
menduga parameter subpopulasi dengan ukuran sampel yang kecil dengan
mengembangkan data survei dan sensus guna mengestimasi tingkat kesejahteraan
atau indikator lainnya sebagai peubah yang menjadi perhatian pada domain yang
lebih kecil. Biasanya objek survei jumlahnya kecil bahkan mungkin area tersebut
tidak tersampling sehingga analisis yang didasarkan pada objek tersebut memiliki
ketepatan yang rendah. Selain itu metode ini dapat mengestimasi karakteristik dari
subpopulasi yang dikembangkan dengan menghubungkan informasi dari daerah
tertentu dengan daerah lain melalui model pendekatan untuk meningkatkan
efektifitas ukuran sampel yang disebut estimasi tidak langsung (Rao, 2003).
2
Berbagai metode pendugaan area kecil telah dikembangkan khususnya
menyangkut metode yang berbasis model (model-based area estimation). Metode
tersebut adalah penduga prediksi tak bias linier terbaik empirik atau Empirical
Best Linear Unbiased Prediction (EBLUP) untuk data kontinu, bayes empirik atau
Empirical Bayes (EB), dan bayes hierarkhi atau Hierarchical Bayes (HB) untuk
data biner atau cacahan.
Proporsi merupakan salah satu peubah respons yang menjadi perhatian dalam
SAE yang didapat dari hasil survei data cacahan yaitu banyaknya pengamatan
dibagi dengan jumlah keberhasilan dari pengamatan tersebut, dengan
mengasumsikan pengamatannya menyebar binomial. Dalam pendugaan Bayes
terdapat dua jenis informasi yaitu informasi prior diperoleh dari sebaran prior dan
informasi posterior dari hasil survei. Untuk peubah Binomial, sebaran prior yang
dapat dipilih adalah sebaran Beta. Sehingga pada penelitian ini model yang
digunakan adalah model Beta-Binomial.
Kebaikan suatu penduga dapat dievaluasi melalui sifat tak bias dan varian
minimum. Karena penduga Bayes biasanya bersifat bias (Bolstad, 2007), maka
dalam penelitian ini kualitas penduga EB yang diperoleh akan dievaluasi melalui
kriteria Mean Squared Error (MSE). MSE merupakan suatu besaran untuk
mengukur keragaman penduga area kecil. Beberapa penelitian yang membahas
tentang metode pendugaan MSE adalah Prasad dan Rao (1990), Wan (1999),
Chen (2001), Jiang et al (2002), Rao (2003), serta Chen dan Lahiri (2008). Pada
penelitian ini peneliti tertarik untuk mengkaji MSE dengan membandingkan
metode Jackknife Jiang et al (2002) dan Area-spesifik Jackknife.
3
1.2 Tujuan Penelitian
Penelitian ini bertujuan untuk mengkaji karakteristik penduga Empirical Bayes
dengan mengevaluasi Mean Squared Error menggunakan metode Jackknife Jiang
dan Area-spesific Jackknife baik secara teori maupun empiris menggunakan data
Keluarga Prasejahtera tahun 2014 di Kota Bandar Lampung.
1.3 Manfaat Penelitian
Manfaat yang diperoleh dari penelitian ini adalah memberikan informasi tentang
karakteristik penduga Empirical Bayes melalui evaluasi Mean Squared Error
menggunakan metode Jackknife Jiang dan Area-spesific Jackknife pada
pendugaan area kecil dengan model Beta-Binomial.
II. TINJAUAN PUSTAKA
2.1 Pendugaan Area Kecil
Small Area Estimation (SAE) adalah salah satu teknik statistik yang digunakan
untuk menduga parameter subpopulasi dengan ukuran sampel yang relatif kecil.
Teknik ini mengembangkan data survei dan sensus untuk mengestimasi tingkat
kesejahteraan atau indikator lainnya untuk unit geografis seperti kecamatan atau
pedesaan. Terdapat dua masalah pokok dalam pendugaan area kecil. Masalah
pertama adalah bagaimana menghasilkan suatu dugaan parameter yang cukup baik
untuk ukuran sampel kecil pada suatu domain. Kedua, bagaimana menduga mean
Squared error (MSE) dari dugaan parameter tersebut. Kedua masalah pokok
tersebut dapat diatasi dengan cara “meminjam informasi” dari dalam area, luar
area maupun dari luar survei (Pfefferman, 2002).
SAE merupakan metode estimasi tidak langsung yang menduga area yang lebih
kecil dan memberikan tingkat akurasi yang lebih baik. Model area kecil
dikelompokkan menjadi dua jenis yaitu model level area dan model level unit
(Rao, 2003).
5
1.Pendugaan Area Kecil Berbasis Area
Pada model pendugaan area kecil berbasis area, data pendukung yang tersedia
hanya sampai level area. Model level area menghubungkan penduga langsung
pendugaan area kecil dengan data pendukung dari domain lain untuk setiap area.
2. Pendugaan Area Kecil Berbasis Unit
Pada model pendugaan area kecil berbasis unit diasumsikan bahwa data variabel
penyerta unit 𝑥𝑖𝑗𝑇=(xij1,xij2,....,xijp)
T tersedia untuk setiap elemen ke-j pada area ke-i
selanjutnya variabel respon 𝑦𝑖𝑗 diasumsikan berkaitan dengan 𝑥𝑖𝑗sehingga bentuk
persamaan model area kecil berbasis level unit sebagai berikut :
𝑦𝑖𝑗 = 𝑥𝑖𝑗𝑇𝛽 + 𝑒𝑖𝑗 + 𝑣𝑖 ; j=1,2, . . ., m; i=1,2,. . . ., n (2.1)
Dengan 𝑣𝑖 merupakan pengaruh acak area, β merupakan koefisien regresi dan
diasumsikan galat sama dengan 0. Namun kadang cukup dengan rata-rata populasi
�̅�𝑖𝑗 yang diketahui (Rao, 2003).
2.2 Metode Empirical Bayes
Dasar pengembangan pendekatan statistik Bayes adalah hukum Bayes yang dibuat
oleh Thomas Bayes. Hukum ini diperkenalkan oleh Richard Price tahun 1763 dua
tahun setelah wafatnya Thomas Bayes. Pada tahun 1774 dan 1781, Laplace
memberikan analisis lebih rinci dan lebih relevan untuk statistik Bayes sekarang
(Gill, 2002).
6
Bila penduga Bayes ini akan digunakan maka harus diketahui terlebih dahulu nilai
parameter sebaran priornya. Namun seringkali informasi mengenai parameter
prior belum diketahui. Pendekatan lain yang dapat digunakan adalah Bayes
Empirik. Emperical Bayes (EB) merupakan metode dengan menggunakan
inferensia dari estimasi posterior untuk menduga parameter. Pertama kali model
ini diperkenalkan oleh Fay-Herriot (1979), untuk menduga rata-rata pendapatan
area kecil di Amerika Serikat. Metode EB merupakan metode yang cocok
digunakan dalam menangani data biner dan data cacahan pada pendugaan area
kecil. Misalkan x1, x2, …, xn merupakan sampel acak berukuran n dari distribusi
yang mempunyai fungsi kepekatan peluang berbentuk f(x1, x2, …, xn|θ) dan
sebaran dari peubah acak θ yaitu h(θ) sebaran prior. Metode EB dalam konteks
pendugaan area kecil secara ringkas sebagai berikut:
1. Mendapatkan fungsi kepekatan peluang akhir (posterior) dari x1, x2, …, xn
dengan f(x1, x2, …, xn) yang didefinisikan sebagai berikut:
f(x1, x2, …, xn|θ) = f(X1,X2,…,Xn|θ).h(θ)
∫ f(X1,X2,…,Xn|θ).h(θ)dθ (2.2)
2. Menduga parameter model dari fungsi kepekatan peluang marginal.
3. Menggunakan fungsi kepekatan peluang akhir (posterior) dugaan untuk
membuat inferensi parameter area kecil yang menjadi perhatian.
(Kismiantini, 2010)
Pendugaan langsung melalui pendekatan Bayes adalah menganggap parameter pi
merupakan peubah yang memiliki distribusi tertentu. Dalam pendugaan Bayes
terdapat dua jenis informasi yaitu informasi prior diperoleh dari sebaran prior dan
informasi posterior dari hasil survei. Untuk peubah Binomial, sebaran prior yang
digunakan adalah sebaran Beta atau Logit Normal (Rumiati, 2012).
7
2.3 Model Beta Binomial
Distribusi Beta digunakan untuk menjelaskan distribusi dari sebuah nilai
probabilitas yang tidak diketahui sebagai distribusi prior pada sebuah parameter
probabilitas sukses dalam distribusi Binomial (Bolstad, 2007). Dalam hal ini
dianggap bahwa probabilitas sukses dapat menjalani setiap nilai real antara 0 dan
1, sehingga distribusi prior tidak diskrit melainkan kontinu (Subanar, 2013).
Model ini merupakan model yang berawal dari model Bernoulli dengan model
peluang untuk data biner yang dinyatakan dengan :
yi| pi ~ Binomial (ni, pi) = 0, . . ., ni, 0 < pi < 1, i = 1, . . ., m (2.3)
dengan model dasar
yi| pi ~ Bernoulli (pi) atau yi| pi ~ Binomial (ni, pi) (2.4)
pi ~ Beta (α, β) α > 0, β > 0 (2.5)
Beta (α, β) menyatakan sebaran beta dengan parameter α dan β serta fungsi
kepekatan untuk pi adalah
f(pi |α, β) = Γ(𝛼+𝛽)
Γ(𝛼)Γ(𝛽)𝑝𝑖𝛼−11 − 𝑝𝑖𝛽−1; 𝛼 > 0, 𝛽 > 0 untuk 0 ≤ pi ≤ 1 (2.6)
(Hogg dan Craig, 1995).
Model yang digunakan dalam penelitian ini adalah model berbasis area dua level.
Model dua level tersebut dapat dituliskan sebagai berikut:
𝑦𝑖 = 𝑝𝑖 + 𝜀𝑖 (2.7)
8
dengan:
𝑦𝑖= penduga langsung area ke-i
𝜀𝑖= pengaruh acak di dalam area
𝑝𝑖 = Parameter yang ingin diduga
dimana:
Level 1: yi| pi ~ Binomial (ni, pi)
Level 2: pi ~ Beta (α,β), i= 1,2,3,...,m (2.8)
Dengan yi menyatakan banyaknya pengamatan suatu kasus pada area ke-i, ni
adalah banyaknya ulangan keberhasilan suatu kasus pada area ke-i, pi adalah
peluang keberhasilan suatu kasus pada area ke-i yang tidak diketahui dan m
menyatakan jumlah area, sedangkan α dan β merupakan parameter yang belum
diketahui. Level pertama diasumsikan bahwa yi ~ Binomial (ni, pi) dan level kedua
diasumsikan bahwa pi ~ Beta (α,β) (Kismiantini, 2007).
Diketahui bahwa pi ~ Binomial (ni, pi) mempunyai fungsi kepekatan sebagai
berikut :
f(yi |pi) = (𝑛𝑖𝑦𝑖) 𝑝𝑖𝑦𝑖(1 − 𝑝𝑖)𝑛𝑖−𝑦𝑖 (2.9)
Berdasarkan fungsi kepekatan 𝑝𝑖 dan fungsi kepekatan yi maka :
𝑓(𝑝𝑖|𝑦𝑖) =𝑓(𝑝𝑖; 𝑦𝑖)
𝑚(𝑦𝑖)
=(𝑛𝑖𝑦𝑖)𝛤(𝛼+𝛽)
𝛤(𝛼)𝛤(𝛽)𝑝𝑖𝑦𝑖+𝛼−1(1−𝑝𝑖)
𝑛𝑖−𝑦𝑖+𝛽−1
(𝑛𝑖𝑦𝑖)𝛤(𝛼+𝛽)
𝛤(𝛼)𝛤(𝛽)
𝛤(𝑦𝑖+𝛼)𝛤(𝑛𝑖−𝑦𝑖+𝛽)
𝛤(𝛼+𝑛+𝛽)
=𝑝𝑖𝑦𝑖+𝛼−1(1−𝑝𝑖)
𝑛𝑖−𝑦𝑖+𝛽−1
𝛤(𝑦+𝛼)𝛤(𝑛𝑖−𝑦𝑖+𝛽)
𝛤(𝛼+𝑛𝑖+𝛽)
9
=𝛤(𝛼+𝑛𝑖+𝛽)
𝛤(𝑦𝑖+𝛼)𝛤(𝑛𝑖−𝑦𝑖+𝛽)𝑝𝑖𝑦𝑖+𝛼−1(1 − 𝑝𝑖)
𝑛𝑖−𝑦𝑖+𝛽−1
= 𝐵((𝑦𝑖 + 𝛼), (𝑛𝑖 − 𝑦𝑖 + 𝛽)) (2.10)
Menurut Berger (1990) nilai ekspektasi dan varian dari distribusi Beta adalah
𝐸(𝑋) =𝛼
𝛼+𝛽 dan 𝑉𝑎𝑟(𝑋) =
𝛼𝛽
(𝛼+𝛽+1)(𝛼+𝛽)2 Diketahui bahwa distribusi dari p
adalah fungsi Beta ((𝑦𝑖+α),( 𝑛𝑖-𝑦𝑖+β)). Sehingga diperoleh nilai ekspektasi dari
distribusi posteriornya adalah:
𝐸(𝑝𝑖|𝑦𝑖) =𝑦𝑖 + 𝛼
𝑦𝑖 + 𝛼 + 𝑛𝑖 − 𝑦𝑖 + 𝛽
=𝑦𝑖+𝛼
𝛼+𝑛𝑖+𝛽 (2.11)
dan varian dari distribusi posterior adalah
𝑉𝑎𝑟(𝑝𝑖|𝑦𝑖) =(𝑦𝑖 + 𝛼)(𝑛𝑖 − 𝑦𝑖 + 𝛽)
(𝑦𝑖 + 𝛼 + 𝑛𝑖 − 𝑦𝑖 + 𝛽 + 1)(𝑦𝑖 + 𝛼 + 𝑛𝑖 − 𝑦𝑖 + 𝛽)2
=(𝑦𝑖+𝛼)(𝑛𝑖−𝑦𝑖+𝛽)
(𝛼+𝑛𝑖+𝛽+1)(𝛼+𝑛𝑖+𝛽)2 (2.12)
Oleh karena itu penduga Bayes bagi pi adalah rata-rata dari posteriornya,
�̂�𝑖𝐵 = 𝐸[𝑝𝑖|𝑦𝑖] = ∫ 𝑝𝑖. 𝑓(𝑝𝑖|𝑦𝑖)𝑑𝑝
1
0
= ∫ 𝑝𝑖𝛤(𝛼 + 𝑛𝑖 + 𝛽)
𝛤(𝑦𝑖 + 𝛼)𝛤(𝑛𝑖 − 𝑦𝑖 + 𝛽)𝑝𝑖𝑦𝑖+𝛼−1(1 − 𝑝𝑖)
𝑛𝑖−𝑦𝑖+𝛽−11
0
𝑑𝑝𝑖
=𝛤(𝛼 + 𝑛𝑖 + 𝛽)
𝛤(𝑦𝑖 + 𝛼)𝛤(𝑛𝑖 − 𝑦𝑖 + 𝛽)∫ 𝑝𝑖
𝑦𝑖+𝛼(1 − 𝑝𝑖)𝑛𝑖−𝑦𝑖+𝛽−1
1
0
𝑑𝑝𝑖⏟
𝐵(𝑦𝑖+𝛼+1,𝑛𝑖−𝑦𝑖+𝛽)
10
=𝛤(𝛼+𝑛𝑖+𝛽)
𝛤(𝑦𝑖+𝛼)𝛤(𝑛𝑖−𝑦𝑖+𝛽)
𝛤(𝑦𝑖+𝛼+1)𝛤(𝑛𝑖−𝑦𝑖+𝛽)
𝛤(𝑦𝑖+𝛼+1+𝑛𝑖−𝑦𝑖+𝛽)
=𝛤(𝛼 + 𝑛𝑖 + 𝛽)
𝛤(𝑦𝑖 + 𝛼)𝛤(𝑛𝑖 − 𝑦𝑖 + 𝛽)
𝛤(𝑦𝑖 + 𝛼 + 1)𝛤(𝑛𝑖 − 𝑦𝑖 + 𝛽)
𝛤(𝛼 + 𝑛𝑖 + 𝛽 + 1)
=𝛤(𝛼 + 𝑛𝑖 + 𝛽)𝛤(𝑦𝑖 + 𝛼 + 1)
𝛤(𝑦𝑖 + 𝛼)𝛤(𝛼 + 𝑛𝑖 + 𝛽 + 1)
=(𝛼 + 𝑛𝑖 + 𝛽 − 1)! (𝑦𝑖 + 𝛼)!
(𝑦𝑖 + 𝛼 − 1)! (𝛼 + 𝑛𝑖 + 𝛽)!
=(𝛼 + 𝑛𝑖 + 𝛽 − 1)! (𝑦𝑖 + 𝛼)(𝑦𝑖 + 𝛼 − 1)!
(𝑦𝑖 + 𝛼 − 1)! (𝛼 + 𝑛𝑖 + 𝛽)(𝛼 + 𝑛𝑖 + 𝛽 − 1)!
=𝑦𝑖+𝛼
𝛼+𝑛𝑖+𝛽 (2.13)
(Mayasari, 2016)
Dengan ragam posterior bagi pi adalah :
𝑉(𝑝𝑖|𝑦𝑖, 𝛼, 𝛽) = (𝑦𝑖+𝛼)(𝑛𝑖−𝑦𝑖+𝛽)
(𝑛𝑖+𝛼+𝛽+1)(𝑛𝑖+𝛼+𝛽)2 (2.14)
Sebaran penghubung f(pi, α, β) yang merupakan prior pada sebaran posterior
tersebut, f(pi | yi, α, β) mempunyai bentuk yang sama dengan sebaran priornya.
Dari sebaran penghubung tersebut, maka digunakan model Beta-Binomial dengan
sebaran peluang marginal sebagai berikut :
f(yi | ni, α, β) = (𝑛𝑖𝑦𝑖)Γ(𝛼+𝑦𝑖)Γ(𝛽+𝑛𝑖−𝑦𝑖)
Γ(α+β+ni)
Γ(𝛼+𝛽)
Γ(𝛼)Γ(𝛽)
= (𝑛𝑖𝑦𝑖)Β(𝛼+𝑦𝑖,𝛽+𝑛𝑖−𝑦𝑖)
Β(𝛼,𝛽) (2.15)
Menurut Lohr dan Rao (2009) jika α dan β tidak diketahui, maka �̂�𝑖𝐵 dapat
dievaluasi dengan pendugaan �̂�𝑖𝐸𝐵 dimana �̂� dan �̂� dihitung dari data.
�̂�𝑖𝐸𝐵 =
𝑦𝑖+�̂�
�̂�+𝑛+�̂� (2.16)
11
Pendugaan dan inferensi pada pendekatan EB didasarkan pada sebaran posterior
yang parameternya diduga dari data. Salah satu metode yang dapat digunakan
untuk menduga parameter adalah Metode Momen.
2.4 Pendugaan Parameter dengan Metode Momen
Secara umum pendugaan parameter digolongkan menjadi dua yaitu pendugaan
titik dan pendugaan selang. Beberapa metode pendugaan titik yang digunakan
untuk menduga parameter diantaranya adalah metode kuadrat terkecil, metode
MLE (Maximum Likelihood Estimation) dan metode momen. Metode kuadrat
terkecil prinsip kerjanya adalah meminimumkan jumlah kuadrat penyimpangan
atau error nilai-nilai observasi terhadap rata-ratanya. Selanjutnya metode MLE
merupakan suatu metode pendugaan parameter yang memaksimalkan fungsi
likelihood. Sedangkan metode momen merupakan metode pendugaan dengan cara
menyamakan momen ke-k sampel dengan momen ke-k populasi dan
menyelesaikan sistem persamaan yang dihasilkan secara bersama atau simultan
yang ditulis sebagai berikut :
m1 = 1
𝑛∑ 𝑋𝑖
1,𝑛𝑖=1 𝜇1 = 𝐸(𝑋
1)
m2 = 1
𝑛∑ 𝑋𝑖
2,𝑛𝑖=1 𝜇2 = 𝐸(𝑋
2)
.
.
. . . .
mk = 1
𝑛∑ 𝑋𝑖
𝑘,𝑛𝑖=1 𝜇𝑘 = 𝐸(𝑋
𝑘) (2.17)
12
Momen populasi 𝜇𝑗 sering ditulis sebagai fungsi dari θ1, θ2, . . ., θk, yaitu
𝜇𝑗(θ1, θ2, . . ., θk). Metode momen penduga (𝜃1, 𝜃2, . . ., 𝜃k) dari (θ1, θ2, . . ., θk) di
dapat dengan menyelesaikan sistem persamaan untuk (θ1, θ2, . . ., θk) dalam notasi
(m1, m2, . . ., mk) sebagai berikut m’j = 𝜇′𝑗(𝜃1, 𝜃2, . . ., 𝜃k)j = 1, 2, . . . k
m1 = 𝜇1 = (θ1, θ2, . . ., θk)
m2 = 𝜇2 = (θ1, θ2, . . ., θk)
.
.
. . . .
mk = 𝜇𝑘 = (θ1, θ2, . . ., θk) (2.18)
(Berger, 1990).
Metode momen yang diciptakan oleh Karl Pearson pada tahun 1800 merupakan
metode tertua dalam menentukan estimator titik. Metode momen memiliki
keunggulan lebih mudah dalam menurunkan rumus penduga parameternya,
namun maksimum likelihood juga dikenal memiliki penduga yang efisien dari
sekian banyak penduga yang ada, walaupun kadang tidak mudah untuk mencari
bentuk rumus penduganya.
2.5 Karakteristik Penduga Parameter
Estimator yang baik adalah yang memenuhi sifat tertentu, diantaranya sifat tak
bias dan varian minimum.
2.5.1 Ketakbiasan
Sifat penduga yang baik salah satunya adalah sifat takbias. Suatu penduga
dikatakan takbias apabila asumsi yang telah ditentukan terpenuhi, yaitu misalkan
13
Y1, Y2, Y3 merupakan sampel acak dari fungsi kepekatan peluang kontinu
𝑓𝑦(𝑦; 𝜃), dimana θ merupakan parameter yang tidak diketahui.
Penduga 𝜃 = [ℎ(𝑌1, 𝑌2, … , 𝑌𝑛)] dikatakan takbias bagi θ, jika 𝐸(𝜃) = 𝜃.
2.5.2 Varian Minimum
Selain sifat ketakbiasan, penduga parameter dikatakan baik apabila memenuhi
sifat penduga ragam minimum. Bila 𝜃 merupakan penduga bagi g(θ), maka θ1
dikatakan sebagai penduga beragam terkecil, jika
𝜎θ12 ≤ 𝜎θ
2 (2.19)
dimana θ merupakan sembarang penduga bagi g(θ)
(Hogg dan Craig, 1995).
2.6 Evaluasi Mean Squared Error (MSE)
Jika suatu penduga merupakan penduga yang tak bias, maka nilai varian θ akan
sama dengan MSE θ. Pada pendugaan EB penduga yang dihasilkan bersifat bias
sehingga performa dari penduga dievaluasi melalui MSE. Jika �̂�𝑖𝐸𝐵 merupakan
sebuah estimator untuk p, maka MSE tidak bersyarat dari �̂�𝑖𝐸𝐵 adalah:
𝑀𝑆𝐸(�̂�𝑖𝐸𝐵) = 𝑀𝑆𝐸(�̂�𝑖
𝐵) + 𝐸(�̂�𝑖𝐸𝐵 − �̂�𝑖
𝐵)2 (2.20)
dimana 𝑀𝑆𝐸(�̂�𝑖𝐵) = 𝐸{𝑣𝑎𝑟(𝑝|𝑦)} (2.21)
(Lohr dan Rao, 2009).
14
Metode pendugaan MSE lainnya adalah metode Jackknife yang pertama kali
diperkenalkan oleh Quenouille pada tahun 1949 dengan tujuan mengoreksi bias
dugaan. Metode ini merupakan metode resampling dengan prosedurnya adalah
menghapus area satu persatu. Misalkan y1, y2, … , ym contoh acak berukuran m
area, kemudian y1 dihilangkan dan dilakukan perhitungan untuk memperoleh
sebuah pendugaan. Operasi ini dilakukan sebanyak m kali dengan menghilangkan
satu area pada masing-masing tahap.
Metode Jackknife lainnya adalah Rao (2003) yang dikenal sebagai metode Area-
specific Jackknife yang merupakan pengembangan dari metode Jackknife Jiang et
al (2002). Metode ini menggunakan ragam dari sebaran posterior sebagai
pendekatan bagi nilai dugaan MSE. Dari segi perhitungan, metode ini lebih
mudah dan sederhana karena tidak perlu mencari nilai harapan dari ragam sebaran
posterior yang secara analitik terkadang sulit untuk dilakukan. MSE dari (�̂�𝑖𝐵)
yaitu:
𝑀𝑆𝐸(�̂�𝑖𝐵) = E{Var (θi | yi, )} = ki(φ) (2.22)
diperoleh secara integrasi numerik dengan menggunakan sebaran marjinal dari yi
Rao menggunakan gi sebagai pendekatan bagi ki, yaitu gi (�̂�, yi) = Var(θi | yi, �̂�).
Penduga MSE metode Area-specific Jackknife yaitu:
MSEASi = �̂�A1i + �̂�2i; i = 1, 2, . . ., m
�̂�A1i (yi) = gi (�̂�, yi) – ∑ {𝑔𝑖 (�̂� (–𝑗), 𝑦𝑖) − 𝑔𝑖(�̂�, yi)}𝑚𝑗≠𝑖
�̂�2i = 𝑚−1
𝑚∑ (𝜃 𝑖(−𝑗)
𝐸𝐵 − 𝜃 𝑖𝐸𝐵) 2𝑚
𝑗=1 (2.23)
15
Metode Jackknife Jiang (2002) digunakan untuk menduga M1i dan M2i secara
terpisah pada iterasi ke-j dari sisa area (m-1) dihitung dengan menduga �̂�(-j) pada
𝜑 dimana kuantitas �̂�1i sama dengan penduga ki(𝜑) yaitu sebagai berikut :
MSE(𝜃 𝑖𝐸𝐵) = 𝐸(𝜃 𝑖
𝐵 − 𝜃𝑖) 2 + 𝐸(𝜃 𝑖
𝐸𝐵 − 𝜃 𝑖𝐵) 2
= ki(𝜑) + 𝑀2𝑖
= 𝑀1𝑖+ 𝑀2𝑖
�̂�1i = ki(�̂�) –𝑚−1
𝑚∑ {ki(φ̂ (−j)) − ki(�̂�)}𝑚𝑗=1
= ki(�̂�) –𝑚−1
𝑚{ki(φ̂ (−j)) − ki(�̂�)}
�̂�2i = 𝑚−1
𝑚∑ (𝜃 𝑖(−𝑗)
𝐸𝐵 − 𝜃 𝑖𝐸𝐵) 2𝑚
𝑗=1 (2.24)
Jiang et al (2002) menunjukan bahwa penduga Jackknife MSE(𝜃 𝑖𝐸𝐵) = �̂�1𝑖+ �̂�2𝑖
mendekati ketakbiasan (Lohr & Rao, 2009).
III. METODE PENELITIAN
3.1. Waktu dan Tempat Penelitian
Penelitian ini dilakukan pada semester genap tahun akademik 2016/2017,
bertempat di Jurusan Matematika, Fakultas Matematika dan Ilmu Pengetahuan
Alam, Universitas Lampung, Lampung.
3.2. Data Penelitian
Data yang digunakan dalam penelitian ini merupakan data sekunder, yaitu data
Keluarga Prasejahtera tahun 2014 di Kota Bandar Lampung yang diperoleh dari
Bandar Lampung Dalam Angka, Badan Pusat Statistik (BPS) Kota Bandar
Lampung.
3.3. Metode Penelitian
Penelitian ini menetapkan model dua tahap distribusi Beta Binomial. Level
pertama diasumsikan bahwa yi ~ Binomial (ni, pi) dan level kedua diasumsikan
bahwa pi ~ Beta (α,β).
Dengan :
yi = banyaknya pengamatan dalam suatu kasus pada area ke-i
ni = banyaknya ulangan keberhasilan suatu kasus pada area ke-i
17
pi = peluang keberhasilan suatu kasus pada area ke-i
α, β = parameter yang akan diduga (biasanya dapat diketahui melalui data)
Model dua level ini dapat ditulis sebagai model linear campuran
Yi= pi + ei
Dengan menentukan fungsi kepekatan peluang akhir (posterior) dari model linear
campuran di atas untuk menduga parameter distribusi Binomial dengan metode
EB seperti pada persamaan (2.16). Pendugaan parameter dari penduga EB
dilakukan menggunakan Metode Momen dengan persamaan (2.17) dan
mengevaluasi MSE pada penduga EB dengan metode Jackknife Jiang et al (2002)
dan Area-spesific Jackknife seperti pada persamaan (2.23) dan (2.24).
Langkah-langkah dalam mengevaluasi MSE adalah sebagai berikut :
1. Menentukan penduga proporsi �̂�𝑖 = 𝑦𝑖
𝑛𝑖 dari data Keluarga Prasejahtera tahun
2014 di Kota Bandar Lampung
2. Menentukan dugaan Mean Squared Error (MSE) penduga langsung
3. Menentukan parameter penduga �̂� dan �̂� dengan metode momen
4. Menentukan penduga Bayes empirik �̂�𝑖𝐸𝐵
5. Menghitung nilai MSE dengan membandingkan metode Jackknife Jiang et al
(2002) dan Area-spesific Jackknife
�̂�A1i (yi) = gi (�̂�,�̂�,, yi) – ∑ {𝑔𝑖(�̂�−𝑗, �̂�−𝑗, 𝑦𝑖) − 𝑔𝑖(�̂�, �̂�, yi)}𝑚𝑗≠𝑖 dengan gi
(�̂�,�̂�,, yi) = Var (pi | yi, �̂�,�̂�) untuk area-spesific Jackknife
18
�̂�1i = ki(�̂�,�̂�) –𝑚−1
𝑚∑ {ki(�̂�−𝑗, �̂�−𝑗) − ki(�̂�, �̂�)}𝑚
𝑗=1 dengan
ki (�̂�,�̂�) = E{Var (pi | yi, �̂�,�̂�)} untuk Jackknife Jiang (2002)
MSE �̂�𝑖𝐵 = 𝑘𝑖(�̂�𝑖, �̂�,�̂�), �̂�𝑖,−𝑗
𝐵 = 𝑘𝑖(�̂�𝑖, �̂�−𝑗,�̂�−𝑗) dan
�̂�2i = 𝑚−1
𝑚∑ (�̂� 𝑖(−𝑗)
𝐸𝐵 − �̂� 𝑖𝐸𝐵) 2𝑚
𝑗=1
mencari �̂�−𝑗 dan �̂�−𝑗 yang merupakan penduga momen yang diperoleh
dari data ke-j yang dihapus dan dihitung secara simultan
Menentukan galat baku, yaitu MSE = �̂�1i + �̂�2i; i = 1, 2, . . ., m
6. Membandingkan nilai MSE metode Jackknife Jiang et al (2002) dan Area-
spesific Jackknife dimana proses hitungan dilakukan dengan R i386.
V. KESIMPULAN DAN SARAN
5.1 Kesimpulan
Berdasarkan hasil kajian secara teori diperoleh kesimpulan bahwa pendugaan
Mean Squared Error metode Jackknife Jiang et al (2002) menggunakan
pendekatan ki sebagai nilai harapan dari ragam posteriornya sedangkan Area-
spesific Jackknife menggunakan pendekatan gi sebagai ragam posteriornya. Pada
data proporsi keluarga prasejahtera di Kota Bandar Lampung tahun 2014 Area
specific-Jackknife menghasilkan nilai Mean Squared Error yang mendekati nilai
Mean Squared Error penduga langsung dibandingkan metode Jackknife Jiang et
al (2002).
5.2 Saran
Pada pendugaan area kecil level kecamatan, data yang tersedia memenuhi untuk
dilakukan pendugaan secara langsung sehingga nilai Mean Squared Error relaif
kecil. Untuk penelitian selanjutnya disarankan menggunakan level area yang
memiliki informasi yang terbatas.
DAFTAR PUSTAKA
BadanPusat Statistik. 2015. Bandar Lampung DalamAngka 2014. BPS Kota
Bandar Lampung. Bandar Lampung.
Berger, C., 1990.Statistical Inference. California: Wadsworth and Brooks/Cole.
Bolstad, W.M. 2007. Introduction to Bayesian Statistics Second Edition. America:
A John Wiley & Sons.
Chen S. 2001. Empirical Best Prediction and Hierarchical Bayes Methods in
Small Area Estimation. [disertation]. Nebraska: The Graduate College,
University of Nebraska.
Chen S, Lahiri P. 2008. On Mean Squared Prediction Error Estimation in Small
Area Estimation Problems. Communications in Statistics 37:1792-1798.
Fay, R.E., & Herriot, R.A. 1979. Estimates of income for small places: an
application of James-Stein procedures to census data. Journal of the
American StatisticalAssociation, 74 (366), 269-277.
Giil, J. 2002. Bayesian Methods: A social and Behavioral Sciences Approach.
Chapman and Hall, Boca Raton.
Hogg, R.V., dan Craig, A.T. 1995. Introduction to Mathematical Statistics,
Fifth Edition. New Jersey: Pretice-Hall.
Jiang J., Lahiri P.,dan Wan S.M. 2002. A Unified Jackknife Theory for Empirical
Best Prediction with M-estimation. The Annals of Statistics 30(6):1782-1810.
Kismiantini. 2010. Pendugaan Statistik Area Kecil Berbasis Model Poisson-
Gamma.Seminar NasionalPenelitian,
PendidikandanPenerapanMIPA.Yogyakarta : FMIPA UniversitasYoyakarta.
Lohr, S.L., dan Rao, J.N.K. 2009. Jackknife Estimation of Mean Squared Error
of Small Area Predictors in Nonlinear Mixed Models. Journal of Biometrika.
96, 457-468.
Martinez, E.Z., Achcar, J.A., dan Aragon, D.C. 2015. Parameter estimation of the
beta-binomial distribution: anapplication using the SAS software. Cienciae
Natura,Vol 37 n. 4. P 12-19.
Mayasari, D. 2016. Karakteristik Penduga Empirical Bayes Pada Pendugaan Area
Kecil dengan Model Beta Binomial. Skripsi. Universitas Lampung. Lampung.
Pfefferman D., (2002). Small Area Estimation - New developments and
directions, International Statistical Review, Vol70, 1, 125-143.
Htpp://www.ibge.gov.br/ amostragem/download/trabalhodanny.doc. [24
Oktober 2016]
Prasad, N.G.N., and Rao, J.N.K. 1990. The Estimation of Mean Square Errors
of.Small Area Estimators. Journal of American Statistical Association. 85:
163-171.
Rao, J.N.K. 2003. Small Area Estimation. New York: John Willey and Sons.
Rumiati,A.T. 2012. Model Bayes Untuk Pendugaan Area Kecil Dengan Penarikan
Contoh Berpeluang Tidak Sama Pada Kasus Respon Binomial dan
Multinomial. Disertasi. Bogor: Institut Pertanian Bogor
Subanar. 2013. Statistika MatematikaProbabilitas, Distribusi, dan
AsimtotisdalamStatistika. Yogyakarta: Graha Ilmu.
Wan, S.M. 1999. Jackknife Methods in Small Area Estimation and Related
Problems. [disertation]. Nebraska: The Graduate College, University of
Nebraska