© 2015 LPPM IKIP Mataram
Probabilitas Cakupan Interval Konfidensi dalam Regresi Setelah Dilakukan Uji F Awal
Zainal Abidin
Pendidikan Matematika, FPMIPA IKIP MATARAM
Email: [email protected]
Abstract: Consider a linear regression model whit regrssion parameter β = (β1, ...,βp) and independent normal
errors. Suppose the parameter of interest is θ = , where a is specified. Define the s-diminsional parameter
vector , where C and t are specified. Suppose that we carry out a preliminary F test of the noll
hypothesis against the alternative hypothesis H1: . It is common statistical practice to then
construck a confidence interval for θ with nominal coverage 1 – α, using the same data, based on the
assumption that the selected model had been given to us a priori (as the true model). We call this the naive
confidence interval for . This assumption is false and it may lead to this confidence interval haveing
minimum coverage probability far below , making it completely inadequate. Our aim is to compute this
minimum coverage probability.
Abstrak: Ditentukan sebuah model regresi linier dengan parameter regresi β = (β1, ...,βp) dan eror normal
independen. Anggap parameter yang diinginkan adalah θ = , dimana diketahui. Ditentukan vektor
parameter dengan dimensi s adalah , dimana C dan t diketahui. Anggap bahwa kita telah
melakukan suatu uji F awal dari hipotesis nol melawan hipotesis alternatif H1: . Hal ini
merupakan praktek statistika umum yang selanjutnya membentuk interval konfidensi untuk θ dengan luas
cakupan nominal 1 – α, dengan menggunakan data yang sama, berdasarkan asumsi bahwa model yang dipilih
telah diberikan untuk menjadi prior (sebagai model yang sebenarnya). Kita menyebut ini sebagai naive interval
konfidensi 1 – α untuk θ. Asumsi ini salah dan dapat mengakibatkan interval konfidensi ini memiliki
probabilitas luas cakupan (coverage) minimum yang jauh di bawah 1 – α, sehingga membuatnya benar-benar
tidak cukup atau tidak memenuhi.
Kata kunci: analisis kovarian, naive interval konfidensi, uji F awal
Pendahuluan
Diketahui model regresi linier ,
dengan Y adalah n vektor random dari
variabel respon, sedangkan X adalah sebuah
matriks ukuran n × p yang diketahui dengan
kolom-kolom yang saling independen secara
linier, β adalah p vektor dari parameter yang
tidak diketahui, dan adalah vektor
gangguan dengan asumsi bahwa mean sama
dengan nol dan menpunyai variansi adalah
atau dinotasikan dengan .
Dimana σ2 adalah parameter positif yang
tidak diketahui. Dan kita anggap pula bahwa
parameter yang diinginkan yaitu
dimana adalah p vektor yang diberikan (
≠ 0). Kita akan mencari interval konfidensi 1
– α untuk θ.
Diketahui vektor parameter ber-
dimensi s adalah yang didefinisikan
sebagai dimana C adalah matriks p
× s yang ditetapkan (s < p) dengan kolom-
kolom yang independen secara linier dan t
adalah s vektor yang ditetapkan. Anggap
bahwa bukan bagian dari ruang bagian
linier yang dibangun atau direntangkan oleh
kolom-kolom dari C. Dengan melakukan uji
F awal dari hipotesis nol melawan
hipotesis alternatif H1: . Dan selanjut-
nya dibentuk interval konfidensi untuk
parameter θ dengan luas daerah cakupan
nominal adalah 1 – α, dan dengan meng-
gunakan data yang sama, dengan asumsi
bahwa model yang dipilih telah diberikan
untuk menjadi prior (model yang
sebenarnya). Kita menyebut interval yang
Jurnal Kependidikan 14 (3): 325-336
326
dibentuk setelah dilakukan uji F awal
sebagai naive interval konfidensi 1 – α untuk
parameter θ.
Naif interval konfidensi 1 – α untuk
parameter θ adalah interval kepercayaan
yang di dapatkan atau di kostruksi setelah
dilakukan suatu uji F terhadap parameter θ
dalam suatu model regresi. Dan memiliki
nominal luas cakupan yang mungkin
berbeda atau sama dengan luas cakupan
interval konfidensi sebelum dilakukan uji F.
Yang menjadi permasalahan berdasarkan
ulasan diatas adalah berapa probabilitas luas
cakupan dari naive interval konfidensi yang
di dapatkan setelah dilakukan uji F tersebut.
Probabilitas
2.1.1 Teori Probabilitas
Diberikan sebuah ruang sampel dari suatu
percobaan random dan sebuah -field
. Himpunan didalam disebut peristiwa.
Pada peristiwa dipasangkan dengan
sebuah bilangan real yang menyatakan
ukuran numerik dari kemungkinan hasil-
hasil percobaan akan menjadi anggota A,
dan selanjutnya disebut probabilitas dari
peristiwa A. Probabilitas dari suatu peristiwa
dapat diinterpretasikan atas dasar konsep
frekuensi relatif dan dapat pula didefinisikan
secara aksiomatik.
Definisi 2.1.1 Misalnya S menun-
jukkan ruang sampel eksprimen dan
menunjukkan kumpulan semua peristiwa
yang bisa dibentuk dari S. Probabilitas P(.)
adalah sebuah fungsi dengan domain dan
daerah hasil [0.1], yang memenuhu sifat-
sifat sebagai berikut:
i. P(A) 0, untuk setiap (2.1.1)
ii. P(S) = 1 (2.1.2)
iii. Jika adalah m buah
peristiwa yang saling asing dalan
(dalam arti
)
⋃ ∑
(2.1.3)
2.1.2 Sifat-sifat Probabilitas
Misalkan S adalah ruang sampel
eksperimen, A adalah kumpulan semua
peristiwa yang bisa dibentuk dari S, dan P(.)
adalah peluang sebuah peristiwa, maka
berlaku sifat-sifat berikut:
Teorema 2.1.2a Jika peristiwa himpunan
kosong dinyatakan dengan , maka:
Teorema 2.1.2b Jika A adalah sebuah
peristiwa dan adalah complemen, maka:
Teorema 2.1.2c Untuk setiap dua peristiwa
dan dalam suatu ruang sampel berlaku:
Teorema 2.1.2d Jika , maka:
Teorema 2.1.2e (Ketaksamaan Bonferroni’s)
Jika , ,...., adalah peristiwa, maka:
(⋂
) ∑
2.1.3 Probabilitas Bersyarat
Jika kita menghitung probabilitas
sebuah peristiwa, maka penghitunggannya
selalu didasarkan pada ruang sampel
eksperimen. Apabila A adalah sebuah
peristiwa, maka penghitungan probabilitas
dari peristiwa A selalu didasarkan pada
ruang sampel S. Akibatnya, peluang dari
peristiwa A ditulis selengkapnya dengan
| , artinya peluang dari peristiwa A
Zainal Abidin, Probabilitas Cakupan Interval Konfidensi dalam Regresi
327
diberikan S. Penulisan | dinamakan
peluang bersyarat.
Definisi 2.1.3. Jika A dan B adalah dua
peristiwa yang dibentuk dari ruang sampel
S, maka peluang bersyarat dari B diberikan
A didefinisikan sebagai:
|
Dalam hal ini, berarti kita ingin
menghitung probabilitas peristiwa B, apabila
peristiwa A sudah terjadi. Atau kita juga
dapat menyatakan bahwa probabilitas
peristiwa A dan B kedua-duanya terjadi
sama dengan probabilitas peristiwa A terjadi
dikalikan dengan probabilitas peristiwa B
apabila peritiwa A telah terjadi. Dalam hal
ini, kita dapat menuliskannya sebagai
berikut.
|
2.1.4 Aturan Bayes
Pehitungan peluang bersyarat Bayes
didasarkan pada beberapa peristiwa yang
merupakan partisi dari suatu ruang sampel.
Jika diketahui S adalah suatu ruang
sampel dan kejadian-kejadian dan
adalah suatu peristiwa dari ruang sampel S
Definisi 2.1.4 Peristiwa-peristiwa , ,
, ... , dikatakan partisi dari ruang
sampel, S jika :
⋃
.
Apabila semua syarat di atas dipenuhi, maka
menunjukkan partisi dari
suatu ruang sampel S.
Teorema 2.1.4.1 (Total Peluang) Jika
peristiwa-peristiwa me-
rupakan partisi dari suatu ruang sampel Ω,
maka peluang dari peristiwa A yang
sembarang dari S adalah:
∑ |
Teorema 2.1.4.2 Jika peristiwa-peristiwa
merupakan partisi dari
suatu ruang sampel S, maka untuk peristiwa
A yang sembarang dari S sedemikian hingga
berlaku:
| |
∑ |
2.1.5 Probabilitas Dua Kejadian yang
Independen
Dalam pembicaraan sehari-hari, dua
buah peristiwa dikatakan bebas, jika
terjadinya atau tidak terjadinya peristiwa
yang satu tidak dipengaruhi oleh terjadinya
peristiwa yang lain.
Sebenarnya perumusan dua peristiwa
yang saling bebas didasarkan pada
perumusan perkalian dari peluang bersyarat,
yaitu | . Karena
dua peristiwa A dan B saling bebas, maka
dalam penghitungan | terjadinya
peristiwa A tidak dipengaruhi oleh
terjadinya peristiwa B. Sehingga peristiwa A
diberikan peristiwa B akan merupakan
peristiwa A itu sendiri. Akibatnya,
| atau | .
Jurnal Kependidikan 14 (3): 325-336
328
Definisi 2.1.4 Jika A dan B dua kejadiaan
dengan dan , maka A
dan B dikatakan independen jika dan hanya
jika:
Teorema 2.1.5 Bila A dan B dua kejadian
independen maka:
i. dan independen
ii. dan independen
iii. dan independen
Interval konfidensi
Definisi 2.2.1. Estimasi interval parameter
adalah pasangan fungsi dan
dari sampel yang
memenuhi untuk semua
. Jika dari terobservasi dapat dibuat
estimasi interval.
Definisi 2.2.2. Jika dan adalah
dua statistik yang memenuhi persamaan
[ ] , dimana
adalah suatu bilangan yang ditetapkan
sebelumnya antara 0 dan 1, dan jika nilai-
nilai yang diobsevasi dari dua statistik
tersebut adalah dan ,
maka [ ] disebut interval konfidensi
untuk dengan konfidensi kepercayaan .
Definisi 2.2.3. Misalkan
hanya
tergantung pada dan
adalah konstanta
dengan syarat . dikatakan
himpunan konfidensi untuk dengan taraf
. Peluang pada sisi kiri persamaan
Definisi 2.3 dikatakan cakupan peluang pada
. Jika persamaan Definisi 2.3 diperoleh
maka dikatakan himpunan konfidensi
dengan koefisien konfidensi taraf
biasa dikatakan himpunan konfidensi .
2.2.1 Metode Tes Inversi Untuk Interval
Konfidensi
Untuk mencari suatu estimator
interval, Statistisi memperkenalkan suatu
metode yaitu inversi uji statistik. Karena
diketahui hubungan yang erat antara uji
hipotesis dengan estimasi interval. Kita
dapat menyatakan bahwa setiap interval
konfidensi berhubungan dengan uji hipotesis
dan sebaliknya. Untuk melihat hubungan itu
perhatikan contoh berikut.
Untuk melihat lebih formal hubu-
ngan antara interval konfidensi dengan
hipotesis ini berikut diberikan suatu teorema
Teorema 2.2.1. Untuk setiap ,
misalkan adalah daerah penerimaan
taraf dari uji . Untuk setiap
, didifinisikan himpunan dalam
ruang parameter dengan
maka himpunan random adalah
interval konfidensi . Sebaliknya
misalkan adalah interval konfidensi
. Untuk setiap ,
didefinisikan
maka adalah penerimaan taraf
untuk uji .
Kenyataan bila dibangun himpunan
kepercayaan dengan tes inversi kita akan
mempinyai uji hipotesis alternatif
atau . Bentuk alternatif uti
akan membawa ke bentuk yang dapat
diterima dan bentuk akan menentukan
.
Daerah Konfidensi
Konsep pada sebuah interval
konfidensi dapat kita perumum menjadi
Zainal Abidin, Probabilitas Cakupan Interval Konfidensi dalam Regresi
329
sebuah daerah kepercayaan, pada kasus
multi-dimensi untuk parameter (mean,
variansi).
Teorema 2.3 Diberikan
adalah n variabel random yang i.i.d. dengan
p.d.f. . Untuk setiap
, dangan uji pada
level dan diberikan daerah
penerimaan. Himpunan ,
, dan diberikan
. Maka adalah daerah
konfidensi untuk dengan tingkat
kepercayaan .
Regresi
2.4.1 Regresi Parametrik
2.4.1.1 Regresi Linier Sederhana
Dalam regresi linier sederhana, kita
mencoba memodelkan hubungan antara dua
variabel random, seperti penghasilan dan
tingkat pendidikan, tinggi dan berat badan
seseorang, lebar dan panjang dari amplop,
suhu dan hasil dari proses industri,
ketinggian dan titik didih air, atau juga dosis
obat-obatan dan reaksinya. Untuk hubungan
linier ini, kita menggunakan bentuk model
yi = β0 + β1xi + εi i
= 1, 2, .... , n
dimana yi adalah variabel terikat
(bergantung) atau respon dan xi adalah
variabel bebas atau prediktor. Variabel
random ε merupakan error dalam model.
Dalam konteks ini, error bukan berarti
kesalahan tetapi merupakan istilah statistik
untuk merepresentasikan ketidaktetapan
acak, error dalam pengukuran, atau efek dari
variabel luar yang tidak bisa kita kontrol.
Untuk melengkapi model diatas, kita
membuat asumsi tambahan:
1. E (εi ) = 0 untuk i = 1,2,...,n, atau
ekuivalen dengan E (yi) = β0 + β1xi
2. Var (εi ) = σ2 untuk i = 1,2,...,n,
ekuivalen dengan var (yi) = σ2
3. Cov (εi, εj) = 0 untuk i ≠ j, ekuivalen
dengan cov (yi, yj) = 0
2.4.1.1a Estimasi Parameter Regrei Linear
Sederhana
Menggunakan sample random pada n
observasi y1, y2, ... , yn dan nilai tetap x1, x2,
..., xn, kita dapat mengestimasi parameter β0
dan β1. Untuk memperoleh dan , dapat
digunakan metode kuadrat terkecil, yang
tidak memerlukan persyaratan asumsi
distribusi manapun. Pada kuadrat terkecil,
kita mencari dan yang
meminimumkan kuadrat jumlah yi - untuk
n observasi yi dari prediksi nilai = +
xi :
∑
∑
∑ ( )
Perhatikan bahwa mengestimasi E(yi),
bukan yi,, dan + xi mengestimasi β0 +
β1xi bukan β0 + β1xi + εi .Untuk menemukan
nilai dan yang meminimumkan
pada persamaan diatas, kita differensialkan
masing-masing terhadap dan dan
hasilnya disamakan dengan 0 :
∑ ( )
Persamaan diatas menjadi,
Selanjutnya, turunkan terhadap dan
samakan dengan nol,
Jurnal Kependidikan 14 (3): 325-336
330
∑( )
Maka,
∑
∑
2.4.1.2 Regresi Linier Berganda
Diberikan n pengamatan
; ; ,
pandang model regresi
. Dengan variabel
respon, variabel prediktor, dan sesatan
random tidak terobservasi yang diasumsikan
tidak berkorelasi dengan mean nol.
Didasarkan pada pengamatan
model (2.4.1.2.1)
berbentuk
. Dalam model
(2.4.1.2.1) variabel X dapat merupakan
variabel random atau bukan. Untuk pertama
akan dibahas variabel X tidak random.
Dalam notasi matrik model (2.4.1.2.2) dapat
ditulis sebagai berikut, yaitu
dengan merupakan
vektor respon berukuran n x 1,
merupakan vektor sesatan
random dan disini diasumsikan mempunyai
mean nol dan varian-covarian dan
[
]
merupakan matrik dalam bentuk n x p.
2.4.1.2.1 Estimasi Kuadrat Terkecil
Salah satu metode untuk mendapat-
kan suatu estimasi vektor parameter alah
satu metode untuk mendapatkan suatu
estimasi vektor parameter adalah
meminimumkan ∑
terhadap ; yaitu,
misalkan .
Meminimumkan
‖ ‖ . Jadi prinsip metode
kuadrat terkecil adalah menentukan
sehingga selisih nilai yang diharapkan
dengan nilai observasi menjadi minimum.
Dengan kata lain, parameter ditentukan
sehingga jumlah kuadrat sesatan yaitu:
‖ ‖
minimum.
Dari
⁄
Maka,
(2.4.1.2.1)
Dengan asumsi bahwa X adalah matriks
bertipe n x p dengan rank p, difinite
positif, diperoleh merupakan matriks
non singular. Akibatnya persamaan (2.3.1a)
mempunyai penyelesaian tunggal, yaitu:
Teorema 2.4.1.2
(a). P dan merupakan matrik simetris
dan indempoten.
(b). Rank [ ] [ ]
(c).
2.4.1.2.2 Sifat Estimasi Kuadrat Terkecil
Estimasi kuadrat terkecil memiliki
beberapa sifat antara lain:
(a). Estimasi kuadrat terkecil merupakan
estimasi tak bias untuk , sebab,
( )
(b). Matriks varian-koparian estimasi
kuadrat terkecil tergantung pada
variansi variabel random sesatan dan
Zainal Abidin, Probabilitas Cakupan Interval Konfidensi dalam Regresi
331
matriks X, artinya ( )
,
(c). Estimasi kuadrat terkecil merupakan
estimator linear tak bias dengan variansi
minimum dan tunggal.
2.4.2 Regresi Non Paramerik
Diberikan n pengamatan
; ; .
Pandang model regresi : ,
. Dengan variabel
predikator dan adalah sesatan random
tidak terobservasi yang diasumsikan tidak
berkorelasi dengan mean nol.
Dalam regresi non parametrik tidak
ada asumsi tentang bentuk fungsi regresi
m(.). Fungsi regresi m(.) umumnya hanya di
asumsikan termuat dalam suatu rauang
fungsi yang berdimensi tak hingga. Untuk
mengkonstruksi model regresi non para-
metrik terlebih dahulu dipilih ruang fungsi
yang sesuai yang mana fungsi regresi m(.)
dinyatakan termasuk didalamnya. Pemilihan
ruang fungsi ini biasanya dimotivasi oleh
sifat kelicinan (smoothness) dan kemudian
digunakan untuk mengestimasi fungsi m(.)
dengan tehnik smoothing tertentu.
2.4.3 Regresi Linier Parsial
Model regresi linier parsial didefi-
nisikan dalam bentuk
(2.2.3a). Dimana
( )
dan ( )
merupakan vektor dari variabel penjelas,
merupakan titik random yang i.i.d
(independent and identically distributed)
atau titik yang ditetapkan. ( )
adalah vektor dari parameter yang tidak
diketahui, g adalah fungsi yang tidak
diketahui dari ke R1, dan ε1, ... , εn adalah
error random yang independen dengan rata-
rata 0 dan variansi terbatas σ2 = E (εi
2).
Pembahasan
3.1 Naive Interval Konfidensi
Dalam bagian ini kita memberikan
sebuah gambaran tentang naive interval
konfidensi 1 – α yang dibentuk setelah uji F
awal. Ditentukan menyatakan estimator
kuadrat terkecil dari β. Diketahui
( ) . Diberikan
dalam arti m adalah banyaknya sampel acak
yang diberikan. Ditentukan ∑
⁄ ( ) ⁄ . Juga,
ditentukan serta .
Kita anggap bahwa kolom matriks C
independen secara linier. Kita juga
menganggap bahwa bukan merupakan
bagian dari subruang linier yang dibangun
oleh kolom-kolom dari C. Sekarang
ditentukan matriks (s + 1) × (s + 1)
[
]
([
] [ ])
Perhatikan bahwa ,
dan
.
Ditentukan β* adalah nilai β yang
meminimalkan R(β) berdasarkan batasan
bahwa = CTβ – t = 0. Seperti yang
diketahui (contohnya lihat Graybill, 1976,
p.222)
( ) ( )
Jurnal Kependidikan 14 (3): 325-336
332
Statistik uji standar untuk pengujian H0:
melawan adalah
( ) ⁄
∑
∑
Statistik uji ini berdistribusi
berdasarkan H0. Anggap bahwa kita
menolak H0 ketika dan menerima H0
untuk sebaliknya, dimana adalah nilai
positif yang ditentukan.
Ditentukan . Juga
ditentukan kuantil t(m) berdasarkan syarat
bahwa ( )
untuk . Naive interval konfidensi 1 – α
untuk θ didapatkan sebagai berikut.
Anggap bahwa . Interval
konfidensi disusun berdasarkan asumsi
bahwa = 0 tidak perlu benar. Dalam hal
ini, naive interval konfidensi 1 – α adalah
merupakan interval konfidensi 1 – α yang
biasa untuk θ berdasarkan pada penyesuaian
model penuh,
[ √ ∑ √ ∑]
Sekarang anggap bahwa . Interval
konfidensi disusun berdasarkan asumsi
bahwa = 0. Jika = 0 maka
dan
. Perhatikan bahwa dan
adalah variabel random yang saling
independen. Kita menggunakan notasi
[ ] untuk interval [ ]
. Dalam hal ini, naive interval konfidensi
1 – α untuk θ adalah
[ √
√
]
[ √
√
]
3.2 Probabilitas Cakupan Naif Interval
Konfidensi
Ditentukan
dan
∑ . Diketahui fW menotasikan fungsi
kepadatan peluang dari W. Ditentukan
‖ ‖ √ . Sedemikian sehingga
‖ ‖
Sehingga
‖ ‖ [ ]. Di asumsikan
bahwa vektor bukan merupakan bagian
dalam subruang linier yang dibangun oleh
kolom C, yang menunjukkan bahwa
‖ ‖ . Sehingga, kita dapat
mengasumsikan bahwa ‖ ‖ [ ] .
Kemudian ditentukan
‖ ‖
Dimana ‖ ‖ , dan
Zainal Abidin, Probabilitas Cakupan Interval Konfidensi dalam Regresi
333
‖ ‖ √
√ ‖ ‖
√
√ ‖ ‖
Ditentukan sebagai fungsi kepadatan
peluang dari √ ketika . Diketahui
B(a, b) menyatakan fungsi beta. Ditentukan
fungsi kepadatan peluang sebagai
( )
Untuk s ≥ 3, ditentukan fungsi kepadatan peluang sebagai
( )
Diketahui ⁄ ⁄ . Ditentukan
sebagai fungsi kepadatan peluang dari
distribusi khi kuadrat yang non sentral
dengan derajat bebas s dan parameter non
sentral . Juga ditentukan
‖ ‖ ‖ ‖
‖ ‖
Ditentukan vektor unit || ||⁄ .
Ketika || || , ditentukan ‖ ‖
dan selanjutnya . Ditentukan juga
ψ = 1 ketika ‖ ‖ . Sekarang, ketika
‖ ‖ , ditentukan
√
Teorema. Probabilitas cakupan dari naive
interval konfidensi 1 – α untuk θ adalah
.
Pernyataan yang tepat secara perhitungan
untuk bentuk kedua dalam penjumlahan ini
adalah
∫ ∫ ‖ ‖‖ ‖ ‖ ‖
dan pernyataan yang tepat secara
perhitungan untuk adalah
sebagai berikut. Diketahui
√ ‖ ‖ Untuk s = 2,
Jurnal Kependidikan 14 (3): 325-336
334
∫∫ ∫ ‖ ‖ ‖ ‖
Untuk s ≥ 3 dan ‖ ‖ , adalah sama dengan
∫∫ ∫ ‖ ‖ ‖ ‖
Untuk s ≥ 3, ‖ ‖ 0 dan , (4)
∫∫ ∫ ‖ ‖ ‖ ‖
Untuk s ≥ 3 dan , ‖ ‖
∫∫ ∫ ‖ ‖ ‖ ‖
√ ⁄
Perhatikan bahwa untuk nilai ‖ ‖ yang
diberikan (yang ditentukan oleh dan X)
serta dan α, probabilitas cakupan
dari naive interval konfidensi 1 – α adalah
merupakan sebuah fungsi dari ‖ ‖ .
Simpulan dan Saran
Berdasarkan hasil dari pembahasan pada
bab-bab sebelumnya, maka dapat di ambil
kesimpulan bahwa :
4.1.1 Interval yang dikonstruksi setelah
dilakukan uji F pendahuluan
membentuk suatu interval yang kita
sebut naive interval konfidensi.
Dengan mengangap bahwa .
Interval konfidensi disusun
berdasarkan asumsi bahwa = 0 tidak
perlu benar. Dalam hal ini, naive
interval konfidensi 1 – α adalah
merupakan interval konfidensi 1 – α
yang biasa untuk θ berdasarkan pada
penyesuaian model penuh,
[ √ ∑ √ ∑]
Sedangkan untuk . Interval
konfidensi disusun berdasarkan asumsi
bahwa = 0. Jika = 0 maka
dan
. Perhatikan bahwa dan
adalah variabel random yang
saling independen. dan menggunakan
notasi [ ] untuk interval [
] . Dalam hal ini, naive
interval konfidensi 1 – α untuk θ
adalah
[ √
√
]
Zainal Abidin, Probabilitas Cakupan Interval Konfidensi dalam Regresi
335
[ √
√
]
4.1.2 Probabilitas cakupan dari naive
interval konfidensi dapat di tentukan
berdasarkan teorema” Probabilitas
cakupan dari naive interval konfidensi
1 – α untuk θ adalah
”, dengan luas
cakupan minimun dalam arti cakupan
dari naive interval komfidensi akan
lebih kecil dari besar interval
kepercanyan yang diberikan.
Dalam melakuan evaluasi tentang
keberlakuan dari persamaan dan teorema
mengenai probabilitis cakupan naive interval
utuk parameter yang berupa vektor baris
atau vektor kolom hendaknya menggunakan
program yang dikerjakan dalam MATLAB,
itu di karenakan peneliti akan berbicara
dalam ruang berdimensi n.
Daftar Pustaka
Chin, S.F., Storkson, J.M., Albright, K.J.,
Cook, M.E. & Pariza, M.W.:
Conjugate linoleic acid is a growth
factor for rats as shown by enhanced
weight gain and improved feed
effeciency. Journal of Nutrition 124,
2344 – 2349 (1994)
Fang, K.T. & Wang, Y.: Number-theoretic
Methods in Statistics. Chapman &
Hall, London (1994)
Farchione, D.: Interval estimators that
untilize uncertain prior information.
Un- published Ph.D. thesis,
Departement of Mathematics and
Statistics, La Trobe University
(2009)
Freund, R.J., Wilson, W.J. & Sa, P.:
Regression Analysis: Statistics
Modeling of a Response Variabel,
2ed ed.. Elsevier, Academic Press,
Burlington, Mass. (2006)
Graybill, F. A.: Theory and Application of
the Linear Model. Duxbury, Pacific
Grove, CA (1976)
Kabaila, P.: On the coverage probability of
cofidence intervals in regression
after variable selection. Australiaan
& New Zealand Journal of Statistics
47, 549-562 (2005)
Kabaila, P., Leeb, H.: On the Large-sample
minimal coverage probability of
confi-dence intervals after model
selection. Journal of the American
Statistical Association 101, 619-629
(2006)
Kabaila, P., Giri, K.: Upper bounds on the
minimum coverage probability of
con-fidence intervals in regression
after model selection. Australian &
New Zealand Journal of Statistics
51, 271 – 288 (2009)
Kabaila, P., Farchione, D.: The coverage
probabililty of confidence intervals
in regression after a preliminary F
tast. Departement of Mathematics
and Statistics, La Trobe University,
Victoria 3086, Australia
Herrhyanto, N., Gantini, T.: Pengantar
Statistika Matematika, CV. Irama
Widya