analisa data statistik- chap 9b.ppt

23
Analisa Data Statistik Chap 9a: Estimasi Statistik (Interval Dua Sampel) Agoes Soehianie, Ph.D

Upload: christiansmilaw

Post on 04-Dec-2015

253 views

Category:

Documents


2 download

DESCRIPTION

statistik

TRANSCRIPT

Analisa Data StatistikChap 9a: Estimasi Statistik

(Interval Dua Sampel)

Agoes Soehianie, Ph.D

Daftar Isi

Inferensi Statistik

Interval Kepercayaan Selisih Rata-Rata Populasi (σ diketahui)

Diperoleh dua sampel berukuran cukup besar (n≥30) yg diambil dari dua buah populasi yang memiliki variansi populasi σ1

2 dan σ2

2..Jika rata-rata sampel adalah xs1 dan xs2, maka distribusi

selisih rata-rata sampel xs1-xs2 akan memiliki rata-rata:

μxs1-xs2 = μ1- μ2

dengan variansi yg adalah jumlahannya:

σ2xs1-xs2 = σ1

2/n1+ σ22/n2

sehingga bisa dinyatakan bahwa variabel normal standard Z:

Akan memiliki probabilitas 1- α untuk terletalk antara –zα/2 dan zα/2 :

P (–zα/2<Z<zα/2) = 1-α

2

22

1

21

2121 )(

nn

xxz

Interval Kepercayaan Selisih Rata-Rata Populasi (σ diketahui)

Jika xs1dan xs2 adalah rata-rata sampel dengan ukuran n1 dan n2 yg diambil dari populasi dengan variansi σ1

2 dan σ22 maka Interval

kepercayaan dengan tingkat kepercayaan 1-α bagi selisih rata-rata populasi, diberikan oleh:

Contoh.

Dua buah mesin A dan B dibandingkan dlm konsumsi BBM-nya. Random sampling mesin A sejumlah 50 dan B sejumlah 75 dipakai. Ternyata rata-rata konsumsi BBM mesin A adalah 36 mil/galon dan mesin B 42 mile/galon. Carilah interval kepearcayaan 96% bagi μB- μA bilamana diketahui standard deviasi populasi bagi A= 6 dan B = 8 mil/galon

2

22

1

21

2/21212

22

1

21

2/21 )()()(nn

zxxnn

zxx

Interval Kepercayaan Selisih Rata-Rata Populasi (σ diketahui)

Diket.

XsA=36, XsB = 42; nA=50 dan nB =75. σA=6 dan σB=8

Interval kepercayaan 96% bagi μvB- μA :

3.43 < μB- μA < 8.57 .

Jadi probabilitasnya tinggi bsahwa sampel A ditarik dari populasi yg memang rata-ratanya lebih tinggi dibandingkan B

B

B

A

AABAB

B

B

A

AAB nn

zxxnn

zxx22

02.0

22

02.0 )()()(

50

36

75

6405.2)3642()(

50

36

75

6405.2)3642( AB

Interval Kepercayaan Selisih Rata-Rata Populasi (σ tak diketahui , sampel besar n>30)

Jika xs1dan xs2 adalah rata-rata sampel dengan ukuran n1 dan n2 (> 30) yg diambil dari populasi yg tidak diketahui variansinya, tapi variansi sampel diketahui S1

2 dan S22 maka Interval kepercayaan

dengan tingkat kepercayaan 1-α bagi selisih rata-rata populasi, diberikan oleh:

2

22

1

21

2/21212

22

1

21

2/21 )()()(n

S

n

Szxx

n

S

n

Szxx

Interval Kepercayaan Selisih Rata-Rata Populasi (σ tak diketahui tapi SAMA besar, sampel kecil n<30)

Jika xs1dan xs2 adalah rata-rata sampel kecil dengan ukuran n1 dan n2 (< 30) yg diambil dari populasi NORMAL yg tidak diketahui variansinya tapi diasumsikan variansinya SAMA, dengan variansi sampel diketahui S1

2 dan S22 maka Interval kepercayaan dengan tingkat

kepercayaan 1-α bagi selisih rata-rata populasi, diberikan oleh:

Dimana Sp adalah pooled variance yg besarnya adalah:

Dan tα/2 adalah variabel student t dengan derajat kebebasan v=n1+n2-2

212/2121

212/21

11)()(

11)(

nnStxx

nnStxx PP

2

)1()1(

21

222

2112

nn

SnSnS P

Contoh

Dalam sebuah studi tentang biodiversity index sebuah sungai. Dua set sampel independen diambil. Sampel pertama terdiri dari 12 buah sampel yg diambil dari hilir sungai, dan menghasilkan rata-rata biodiversity index = 3.11 dengan standard deviasi 0.771. Sedangkan sampel kedua terdiri dari 10 buah yg berasal dari hulu sungai menghasilkan rata-rata biodiversity index 2.04 dan standard deviasi 0.448. Asumsikan bahwa populasi data kedua sampel tersebut terdistribusi normal dan memiliki standard deviasi yg sama. Buatlah interval kepercayaan 90% bagi selisih rata-rata biodiversity index dari kedua populasi (hulu dan hilir) tsb.

SOlusi

Jawab:

Interval Kepercayaan Selisih Rata-Rata Populasi (σ tak diketahui dan BEDA)

Jika xs1dan xs2 adalah rata-rata sampel dengan ukuran n1 dan n2 (< 30) yg diambil dari populasi NORMAL yg tidak diketahui variansinya tapi diasumsikan variansinya BEDA, dengan variansi sampel diketahui S1

2 dan S22 maka Interval kepercayaan dengan

tingkat kepercayaan 1-α bagi selisih rata-rata populasi, diberikan oleh:

Dan tα/2 adalah variabel student t dengan derajat kebebasan v=

Sangat mungkin ν pecahan, dalam hal ini dibulatkan ke bawah!

2

22

1

21

2/21212

22

1

21

2/21 )()()(n

S

n

Stxx

n

S

n

Stxx

1

/1

/

2

2

222

1

2

12

1

2

2

22

1

21

nnS

nnS

nS

nS

Soal

Sebuah studi dilakukan untuk mempelajari kandungan phospor (mg/L) di sebuah sungai. Sampel-sampel dikumpulkan dari dua buah lokasi A dan B. Dari lokasi A dikumpulkan 15 sampel dan menghasilkan rata-rata kandungan phospor 3.84 mg/L dan standard deviasi 3.07 mg/L, sedangkan sampel dari lokasi B ada 12 sampel yg menghasilkan rata-rata 1.49 mg/L dan standard deviasi 0.80 mg/L. Asumsikan sampel-sampel tsb berasal dari populasi normal dengan variansi yg berbeda. Buatlah interval kepercayaan 95% dari selisih rata-rata kandungan phospor di kedua lokasi tsb.

Solusi

XAS =3.84 nA =15 SA = 3.07

XBS =1.49 nB =12 SB = 0.80

Variansi berbeda dan populasi normal. Interval kepercayaan 95% berarti memerlukan nilai t0.025 dengan derajat kebebasan v sbb:

1

/1

/

2

2

222

1

2

12

1

2

2

22

1

21

nnS

nnS

nS

nS

3.16

112

128.0

115

1507.3

128.0

1507.3

2222

222

Derajat kebebasan dibulatkan ke bawah v= 16. Nilai t0.025 untuk v=16 adalah t0.025 =2.120

Solusi

Interval kepercayaan bagi μA- μB adalah

2

22

1

21

2/21212

22

1

21

2/21 )()()(n

S

n

Stxx

n

S

n

Stxx

12

8.0

15

07.3120.2)49.184.3()(

12

8.0

15

07.3120.2)49.184.3(

22

21

22

Atau 0.6 < μA- μB < 4.10 sehingga nampaknya dengan interval kepercayaan 95% rata-rata populasi A lebih besar dibandingkan daripada rata-rata populasi B.

Pengamatan Berpasangan

Dalam suatu studi bisa jadi justru data yg berasal dari 1 populasi tidak independen dari populasi yg kedua. Mereka membentuk pasangan yg saling terkait. Sebagai contoh: studi bobot orang sebelum dan sesudah menjalani program diet. Maka data populasi berat sebelum diet justru terkait dengan berat setelah diet. Oleh karena itu untuk melihat efektivitas program dietnya yg dipelajari adalah selisih pasangan bobotnya (sebelum dan sesudah diet): d1, d2, …., dn Data selisih bobot ini diasumsikan berasal dari populasi normal dengan rata-rata selisih μD= μ1- μ2 dengan variansi σ2

D, dengan nilai variansi ini diestimasi memakai S2

D yg berasal dari sampel yg dipelajari.

Interval Kepercayaan Selisih Data Berpasangan

JIka pengamatan n buah data berpasangan yg diambil secara random, dan ds adalah rata-rata sampel selisih pasangan data dengan standard deviasi sampel Sd maka interval kepercayaan 100(1-α)% bagi selisih rata-rata populasi μD = μ1- μ2 adalah:

Dan tα/2 adalah variabel student t dengan derajat kebebasan v=n-1

n

Std

n

Std d

Dd

2/2/

Contoh

Dalam sebuah studi tentang level kandungan dioxin di dalam plasma darah dan jaringan lemak 20 orang veteran perang Vietnam USA dibandingkan.

Datanya sbb:

Veteran keDioxin di Plasma

Dioxin di Lemak Selisih =d   Veteran ke

Dioxin di Plasma

Dioxin di Lemak Selisih =d

1 2.5 4.9 -2.4   11 6.9 7 -0.1

2 3.1 5.9 -2.8   12 3.3 2.9 0.4

3 2.1 4.4 -2.3   13 4.6 4.6 0

4 3.5 6.9 -3.4   14 1.6 1.4 0.2

5 3.1 7 -3.9   15 7.2 7.7 -0.5

6 1.8 4.2 -2.4   16 1.8 1.1 0.7

7 6 10 -4   17 20 11 9

8 3 5.5 -2.5   18 2 2.5 -0.5

9 36 41 -5   19 2.5 2.3 0.2

10 4.7 4.4 0.3   20 4.1 2.5 1.6

Solusi

Veteran ke d d-ds (d-ds)^2

1 -2.4 -1.53 2.3409

2 -2.8 -1.93 3.7249

3 -2.3 -1.43 2.0449

4 -3.4 -2.53 6.4009

5 -3.9 -3.03 9.1809

6 -2.4 -1.53 2.3409

7 -4 -3.13 9.7969

8 -2.5 -1.63 2.6569

9 -5 -4.13 17.0569

10 0.3 1.17 1.3689

11 -0.1 0.77 0.5929

12 0.4 1.27 1.6129

13 0 0.87 0.7569

14 0.2 1.07 1.1449

15 -0.5 0.37 0.1369

16 0.7 1.57 2.4649

17 9 9.87 97.4169

18 -0.5 0.37 0.1369

19 0.2 1.07 1.1449

20 1.6 2.47 6.1009

Sum -17.4   168.422

average -0.87   8.4211

Perhitungan rata-rata d dan standard deviasinya:

87.020

1

k

kdd 220

1

2 )(1

1

k

kd ddn

S

8643.8120

22.1682

dS 9773.28643.8 dS

Solusi

Nilai t untuk interval kepercayaan 95% dengan derajat kebebasan v=20-1=19 adalah t0.025 = 2.093

Sehingga interval kepercayaan bagi selisih rata-rata kandungan dioxin tsb adalah:

Atau -2.2634 < μD< 0.5234

Jadi tak ada perbedaan antara kandungan dioxin di plasma darah dengan jaringan lemak.

n

Std

n

Std d

Dd

2/2/

20

9773.2093.287.0

20

9773.2093.287.0 D

Interval Kepercayaan Selisih Proporsi Populasi

Interval Kepercayaan Selisih Proporsi Populasi

Jika proporsi “sukses” di sampel random sampel n1 adalah p1 dan di sampel n2 adalah p2, sehingga proporsi “gagal” yg terkait adalah q1=1-p1 dan q2=1-p2.

Maka selisih p1-p2 akan terdistribusi normal dengan

rata-rata μp1-p2 = P1-P2, dan

Variansinya:

Maka variable Z berikut ini akan terdistribusi normal standard:

21

2121 )()(

pp

PPppZ

2

22

1

11221 n

qp

n

qppp

Interval Kepercayaan Selisih Proporsi Populasi

Maka interval kepercayaan 100(1-α)% untuk selisih proporsi populasi P1-P2 (yg menyatakan prosentasi “sukses”) diberikan oleh

2

22

1

112/2121

2

22

1

112/21 )()()(

n

qp

n

qpZppPP

n

qp

n

qpZpp

Asalkan n1p1 ,, n2p2 ≥ 5

Contoh

Dua buah metoda pembuatan spare-parts dibandingkan. Random sampel 1500 dari metoda A ternyata menghasilkan 75 spareparts yg cacat, sedangkan sampel random sebanyak 2000 dari metoda B menghasilkan 80 spareparts yg cacat. Buatlah interval kepercayaan 90% bagi selisih yg sesungguhnya rata-rata persentase spareparts yg cacat antara metoda A dan B.

Solusi

2

22

1

112/2121

2

22

1

112/21 )()()(

n

qp

n

qpZppPP

n

qp

n

qpZpp

xA = 75 (banyak cacat), nA=1500 , pA=xA/nA = 75/1500 = 0.05 qA=0.95

xB = 80 (banyak cacat), nB=2000 , pB=xB/nB = 80/2000 = 0.04 qB=0.96

Untuk interval kepercayaan 90% diperlukan nilai Z0.05 = 1.645.

Intervalnya adalah:

2000

96.0*04.0

1500

95.0*05.0645.1)04.005.0()(

2000

96.0*04.0

1500

95.0*05.0645.1)04.005.0( 21 PP

Atau -0.0017 <P1-P2< 0.0217. Dengan interval kepercayaan 90% tak ada perbedaan berarti persentase spareparts cacat yg dihasilkan oleh metoda A dan B.

2000

96.0*04.0

1500

95.0*05.0645.1)04.005.0(