MATA KULIAH
PERANCANGAN PERCOBAAN (*) **
No. Materi1 Review Statistika Dasar2 Pengenalan Perancangan Percobaan3 Percobaan Faktor Tunggal dalam RAL4 Percobaan Faktor Tunggal RKLT5 Percobaan Faktor Tunggal RBSL6 Pembandingan antar perlakuan
UTS7 Pembandingan antar perlakuan8 Pengujian Asumsi9 Percobaan faktorial dalam RAL10 Percobaan Faktorial dalam RKLT
11 Percobaan rancangan petak terbagi (RPT) dalam RAL
12 Percobaan rancangan petak terbagi dalam RKLT
13 Percobaan kelompok terbagi (RKT)14 Analisis Peragam (ANCOVA)
UU
MATERI PERKULIAHAN
3
Ketentuan Perkuliahan
Penilaian
• UTS (Kompilasi) : 50%Kompilasi dari nilai UTS, Kuis, Tugas, PBL, Kehadiran
• Ujian Utama : 50%
Tips & Triks
• Buku referensi
• Selalu mengikuti materi perkuliahan
• Mengulang & latihan untuk lebih memahami
ReviewStatistika Dasar
ReviewStatistika Dasar
PENDAHULUAN• Apa itu statistika?
– Statistika berasal dari kata statistik penduga parameter
– Ilmu yang mempelajari dan mengusahakan agar data menjadi informasi yang bermakna
Populasi dan Sampel
Populasi
X~N(,2)
Sampel
X~n(x,s2)
Acak Uji
PARAMETER
STATISTIK
Terminologi dalam StatistikaTerminologi dalam Statistika
A. Populasi: – Merupakan himpunan seluruh subjek yang dipelajari (diselidiki /
diinvestigasi) – All voters, all students, all plants, all animals. – Masing-masing kelompok tersebut disebut populasi– Sebuah populasi terdiri keseluruhan elemen/individu atau objek
yang memiliki karakteristik yang kita pelajari
B. Sampel:– Sejumlah elemen yang dipilih dari suatu populasi yang diamati
(diobservasi). – Suatu sampel yang diambil harus bersifat ‘representatif’, yaitu
menunjukkan karakteristik dari populasi sedekat mungkin
Populasi Sampel
Terminologi dalam StatistikaTerminologi dalam Statistika
C. Parameter Populasi: – Merupakan semua karakteristik yang diukur berkaitan
dengan suatu populasi.– Nilainya umumnya tak pernah diketahui karena
ukuran populasi yang biasanya sangat besar ataupuntak berhingga.
– Rata-rata dan simpangan baku suatu populasidinotasikan dengan µ (baca: myu) & σ (baca: sigma)
D. Statistik Sampel:– Merupakan semua karakteristik yang diukur berkaitan
dengan suatu data sampel.– Berfungsi penaksir (estimator) untuk parameter– Rata-rata dan simpangan baku suatu sampel
dinotasikan dengan x dan s– Agar dapat menjadi estimator yang valid bagi
parameter populasi, statistik sampel harus diperolehdari sampel representatif, yang dipilih secara acakdari populasi. Sampel demikian dinamakan sampelrandom (acak).
Konsep Peubah
• Definisi– Peubah merupakan karakteristik dari objek
yang sedang diamati, seperti tinggi tanaman, produksi, dll
• Skala pengukuran peubah– Nominal : mengklasifikasikan– Ordinal : mengklasifikasikan dan mengurutkan– Interval : mengklasifikasikan, mengurutkan dan
membedakan – Rasio : mengklasifikasikan, mengurutkan,
membedakan dan membandingkan
Statistika Deskripsi dan Eksplorasi
• Merupakan teknik penyajian dan peringkasan data sehingga menjadi informasi yang mudah dipahami.
• Penyajian data dapat dilakukan melalui:– Tabel– Gambar (histogram, plot, stem-leaf, box-plot)
• Peringkasan data dinyatakan dalam dua ukuran yaitu:– Pemusatan (Median, Modus, Kuartil, Mean, dll)– Penyebaran (Range, Interquartile Range, Ragam)
Penyajian DataData Pengamatan Tanaman
Obs Tinggi Pohon (m)
Diameter Pohon
(m) Varietas
1 3.5 0.25 A
2 4.0 0.40 A
3 2.8 0.20 B
4 3.2 0.21 C
5 3.6 0.30 C
6 4.2 0.35 C
7 2.9 0.22 B
8 2.5 0.18 B
9 3.8 0.38 A
10 4.6 0.41 A
11 2.2 0.15 A
12 3.4 0.28 D
13 4.2 0.37 D
14 4.8 0.39 D
15 5.0 0.40 D
Varietas Count CumCnt Percent CumPct
A 5 5 33.33 33.33
B 3 8 20.00 53.33
C 3 11 20.00 73.33
D 4 15 26.67 100.00
Varietas
Co
un
t
DCBA
5
4
3
2
1
0
Chart of Varietas
Category
A
B
C
D
Pie Chart of Varietas
Tinggi Pohon (m)
4.84.44.03.63.22.82.4
Dotplot of Tinggi Pohon (m)
Diameter Pohon (m)
Tin
gg
i Po
ho
n (
m)
0.400.350.300.250.200.15
5.0
4.5
4.0
3.5
3.0
2.5
2.0
Scatterplot of Tinggi Pohon (m) vs Diameter Pohon (m)
Penyajian Dengan Tabel dan Gambar
Stem-and-Leaf Display: Tinggi Pohon (m), Diameter Pohon (m)
Stem-and-leaf of Tinggi Pohon (m) N = 15
Leaf Unit = 0.10
1 2 2
4 2 589
6 3 24
(3) 3 568
6 4 022
3 4 68
1 5 0
Stem-and-leaf of Diameter Pohon (m) N = 15
Leaf Unit = 0.010
2 1 58
5 2 012
7 2 58
(1) 3 0
7 3 5789
3 4 001
Penyajian Dengan Stem-Leaf
Penyajian Dengan Box-plotD
ata
Diameter Pohon (m)Tinggi Pohon (m)
5
4
3
2
1
0
Boxplot of Tinggi Pohon (m), Diameter Pohon (m)
Peringkasan Data
(Pemusatan dan Penyebaran)Beberapa ukuran pemusatan, yaitu:
1. Modus: Nilai pengamatan yang paling sering muncul
2. Median: Pengamatan yang ditengah-tengah dari data terurut
3. Quartil: Nilai-nilai yang membagi data terurut menjadi 4 bagian yang sama
4. Mean: merupakan pusat massa (centroid) sehingga simpangan kiri dan simpangan kanan sama besar
Beberapa ukuran penyebaran, yaitu:
1. Range: besarnya penyebaran data dari data terkecil sampai data terbesar
2. Interquartile Range: besarnya penyebaran data yang diukur mulai quartile satu sampai quartile tiga atau besarnya penyebaran data dari 50% pengamatan ditengah
3. Ragam: merupakan rata-rata jarak kuadrat setiap titik pengataman terhadap nilai mean (rata-rata)
Langkah-langkah teknis
Median
Urutkan data dari kecil ke besar
Cari posisi median (nmed=(n+1)/2)
Nilai median
Jika nmed bulat, maka Median=X(n+1)/2
Jika nmed pecahan, maka Median=(X(n)/2+ X(n)/2+1)/2
(rata-rata dua pengamatan yang berada sebelum
dan setelah posisi median)
Kuartil (Quartile)
Metode Belah dua Urutkan data dari kecil ke besar
Cari posisi kuartil nq2=(n+1)/2
nq1=(nq2*+1)/2= nq3, nq2
* posisi kuartil dua terpangkas (pecahan dibuang)
Nilai kuartil 2 ditentukan sama seperti mencari nilai median. Kuartil 1 dan 3 prinsipnya sama seperti median tapi kuartil 1 dihitung dari kiri, sedangkan kuartil 3 dihitung dari kanan.
Metode Interpolasi Urutkan data dari kecil ke besar
Cari posisi kuartil nq1=(1/4)(n+1)
nq2=(2/4)(n+1)
nq3=(3/4)(n+1)
Nilai kuartil dihitung sebagai berikut: Xqi=Xa,i + hi (Xb,i-Xa,i)
Xa,i = pengamatan sebelum posisi kuartil ke-i, Xb,i = pengamatan setelah posisi kuartil ke-i dan hi adalah nilai pecahan dari posisi kuartil
Rata-rata (Mean) Populasi:
Sampel:
Wilayah (Range)W=Xmax-Xmin
Jarak antar kuartil (Interquartile range)JAK=q3-q1
N
xN
i
i 1
n
x
x
n
i
i 1
Ragam (Variance) Populasi
Sampel
Simpangan baku (standard deviation) Merupakan akar dari ragam yaitu simpangan baku populasi
dan s simpangan baku sampel
N
xN
i
i
1
2
2
1
1
2
2
n
xx
s
n
i
i
Descriptive Statistics: Tinggi Pohon (m), Diameter Pohon (m)
Variable N N* Mean StDev Variance Minimum Q1 Median
Tinggi Pohon (m) 15 0 3.647 0.837 0.700 2.200 2.900 3.600
Diameter Pohon ( 15 0 0.2993 0.0919 0.00845 0.1500 0.2100 0.3000
Variable Q3 Maximum Range IQR
Tinggi Pohon (m) 4.200 5.000 2.800 1.300
Diameter Pohon ( 0.3900 0.4100 0.2600 0.1800
Descriptive Statistics: Tinggi Pohon (m)
Variable Varietas N N* Mean StDev Variance Minimum Q1
Tinggi Pohon (m) A 5 0 3.620 0.890 0.792 2.200 2.850
B 3 0 2.733 0.208 0.0433 2.500 2.500
C 3 0 3.667 0.503 0.253 3.200 3.200
D 4 0 4.350 0.719 0.517 3.400 3.600
Variable Varietas Median Q3 Maximum Range IQR
Tinggi Pohon (m) A 3.800 4.300 4.600 2.400 1.450
B 2.800 2.900 2.900 0.400 0.400
C 3.600 4.200 4.200 1.000 1.000
D 4.500 4.950 5.000 1.600 1.350
Rancangan Pengumpulan Data
Kenapa ?
Untuk mendapatkan penduga yang tidak berbias, (misal systematic error)
Untuk meningkatkan presisi kesimpulan
Kesimpulan dapat digeneralisasi ke populasi target
Observasi :
Data dikumpulkan melalui pengamatan langsung
terhadap penomena yang terjadi dilapangan, yang
merupakan potret dari penomena yang sedang
diamati.
Survei merupakan salah satu bentuk khusus dari
observasi
Percobaan :
Data yang dikumpulkan merupakan respon dari
objek/individu/unit yang dikondisikan tertentu.
Ada dua jenis rancangan pengumpulan data
yang utama:
Pengujian Hipotesis
HIPOTESIS Suatu pernyataan / anggapan yang mempunyai nilai mungkin benar / salah atau suatu pernyataan /anggapan yang mengandung nilai ketidakpastian
CONTOH Besok akan turun hujan mungkin benar/salah
Penambahan pupuk meningkatkan produksi mungkin benar/salah
Varietas A lebih baik dibandingkan dengan varietas B mungkin benar/salah
dll
HIPOTESIS statistik dinyatakan dalam dua bentuk yaitu: H0 (hipotesis nol): suatu pernyataan / anggapan yang ingin kita tolak
H1 (hipotesis tandingan): pernyataan lain yang akan diterima jika H0 ditolak
Pengambilan keputusan akan memunculkan dua jenis kesalahan yaitu: Salah jenis I (Error type I) : kesalahan akibat menolak H0 padahal H0
benar
Salah jenis II (Error type II) : kesalahan akibat menerima H0 padahal H1 benar
Besarnya peluang kesalahan dapat ini dapat dihitung sebagai berikut: P(salah jenis I) = P(tolak H0/H0 benar) =
P(salah jenis II) = P(terima H0/H1 benar) =
H0 benar H0 salah
Tolak H0 Peluang salah jenis
I
(Taraf nyata; )
Kuasa pengujian
(1-)
Terima H0 Tingkat
kepercayaan
(1-)
Peluang salah jenis
II
()
Rangkuman
CONTOHSampel diambil secara acak dari populasi normal(;2 = 9),
berukuran 25.
Hipotesis yang akan diuji,
H0 : = 15
H1 : = 10
Tolak H0 jika
Berapakah besarnya kesalahan jenis I dan II ?
Jawab:
P(salah jenis I) = P(/ = 15) = P(z (12.5-15)/3/25))
= P(z - 4.167 ) 0
P(salah jenis II) = P(/ = 10) = P(z (12.5-10)/3/25))
= P(z 4.167 ) = 1 - P(z 4.167 ) 0
Beberapa langkah yang perlu diperhatikan dalam pengujian hipotesis:
(1) Tuliskan hipotesis yang akan diuji
Ada dua jenis hipotesis: Hipotesis sederhana
Hipotesis nol dan hipotesis alternatif sudah ditentukan pada nilai tertentu
H0 : = 0 vs H1 : = 1
H0 : 2 = 02 vs H1 : 2 = 1
2
H0 : P = P0 vs H1 : P = P1
Hipotesis majemukHipotesis nol dan hipotesis alternatif dinyatakan dalam interval nilai tertentu
b.1. Hipotesis satu arah
H0 : 0 vs H1 : < 0
H0 : 0 vs H1 : > 0
b.2. Hipotesis dua arah
H0 : = 0 vs H1 : 0
(2). Deskripsikan data sampel yang diperoleh (hitung rataan, ragam, standard error dll)
(3). Hitung statistik ujinya
Statistik uji yang digunakan sangat tergantung pada sebaran statistik dari penduga parameter yang diuji
CONTOH
H0: = 0 maka maka statistik ujinya bisa t-student atau normal baku (z)
atau
(4). Tentukan batas kritis atau daerah penolakan H0
Daerah penolakan H0 sangat tergantung dari bentuk hipotesis alternatif (H1)
CONTOH H1: < 0 Tolak H0 jika th < -t(; db)(tabel)
H1: > 0 Tolak H0 jika th > t(; db)(tabel)
H1: 0 Tolak H0 jika |th | > t(/2; db)(tabel)
(5). Tarik kesimpulan
ns
xth
/
0n
xzh
/
0
Hipotesis yang dapat diuji:
Hipotesis satu arah
H0 : 0 vs H1 : < 0
H0 : 0 vs H1 : > 0
Hipotesis dua arah
H0 : = 0 vs H1 : 0
Statistik uji:
Jika ragam populasi (2) diketahui :
Jika ragam populasi (2) tidak diketahui :
ns
xth
/
0
n
xzh
/
0
Daerah kritis pada taraf nyata () Besarnya taraf nyata sangat tergantung dari bidang yang
sedang dikaji
Daerah penolakan H0 sangat tergantung dari bentuk hipotesis alternatif (H1)
H1: < 0 Tolak H0 jika th < -t(; db=n-1)(tabel)
H1: > 0 Tolak H0 jika th > t(; db=n-1)(tabel)
H1: 0 Tolak H0 jika |th | > t(/2; db=n-1)(tabel)
Atau, jika nilai peluang nyata (p) dihitung,
H1: < 0 p=p(t<th) atau p=p(z<zh), Tolak H0 jika p<
H1: > 0 p=p(t>th) atau p=p(z>zh), Tolak H0 jika p<
H1: 0 p=p(|t|>|th|) atau p=p(|z|<|zh|), Tolak H0 jika p< /2
Tarik Kesimpulan
ANALISIS KORELASI DAN REGRESI
• Apa itu analisis
regresi?
Hubungan sebab akibat
antara dua peubah atau lebih
• Apa itu analisis
korelasi?
Tingkat keeratan hubungan
linier antara dua peubah atau
lebih
Koefisien Korelasi Pearson (r)
1
)(dan
1
)(
1
))((
22
n
yyS
n
xxS
n
yyxxS
SS
Sr
i
y
i
x
ii
xy
yx
xy
xy
Besaran koefesien korelasi
Contoh: Hubungan Biaya Promosi vs Penjualan
Produk
Perusahaan
Biaya
Promosi (X) Penjualan Xi-RX Yi-RY (Xi-RX)^2 (Yi-RY)^2 (Yi-RY)(Xi-RX)
1 40 385 6.5 -60.5 42.25 3660.25 -393.25
2 20 400 -13.5 -45.5 182.25 2070.25 614.25
3 25 395 -8.5 -50.5 72.25 2550.25 429.25
4 20 365 -13.5 -80.5 182.25 6480.25 1086.75
5 30 475 -3.5 29.5 12.25 870.25 -103.25
6 50 440 16.5 -5.5 272.25 30.25 -90.75
7 40 490 6.5 44.5 42.25 1980.25 289.25
8 20 420 -13.5 -25.5 182.25 650.25 344.25
9 50 560 16.5 114.5 272.25 13110.25 1889.25
10 40 525 6.5 79.5 42.25 6320.25 516.75
Jumlah 335 4455 0 0 1302.5 37722.5 4582.5
Rata-rata 33.5 445.5
Plot Biaya Promosi vs Penjualan Produk
Korelasi:
rxy = 0.653753
ANALISIS REGRESI
• Hubungan Antar Peubah:
• Model deterministik Y=f(X) ; misalnya: Y=10X
(Model tanpa unsur random atau hubungannya bersifat pasti)
• Model stokastik model yang melibatkan unsur random, dengan
kata lain model dipecah menjadi dua bagian yaitu bagian yang dapat dijelaskan dan bagian yang tidak dapat dijelaskan
Mis: IQ vs Prestasi, Berat vs Tinggi, Dosis Pupuk vs Produksi
Model regresi sederhana:
niXY iii ,...,2,1 ; 10
Regresi
Makna 0 & 1 ?
Regresi
Analisis Regresi
• Pendugaan terhadap koefisien regresi:
b0 penduga bagi 0 dan b1 penduga bagi 1
Bagaimana Pengujian terhadap model regresi ??
• parsial (per koefisien) uji-t
• bersama uji-F (Anova)
Bagaimana menilai kesesuaian model ??
R2 (Koef. Determinasi: % keragaman Y yang mampu dijelaskan oleh X)
xbyb
n
xx
n
yxxy
b
10
2
2
1 )(
))((
Metode
Kuadrat Terkecil
Contoh Data
Jarak Emisi
31 553
38 590
48 608
52 682
63 752
67 725
75 834
84 752
89 845
99 960
Percobaan dalam bidang lingkungan
Apakah semakin tua mobil semakin besar
juga emisi HC yang dihasilkan?
Diambil contoh 10 mobil secara acak,
kemudian dicatat jarak tempuh yang sudah
dijalani mobil (dalam ribu kilometer) dan
diukur Emisi HC-nya (dalam ppm)
Emisi = 382 + 5.39 Jarak
Plot antara Emisi Hc (ppm) dg
Jarak Tempuh Mobil (ribu kilometer)
10090807060504030
950
850
750
650
550
Jarak
Em
isi
Pendugaan Parameter
Mobil Jarak (X) Emisi (Y) Xi-RX Yi-RY (Xi-RX)^2 (Yi-RY)^2
(Yi-
RY)(Xi-
RX)
1 31 553 -33.6 -177.1 1128.96 31364.41 5950.56
2 38 590 -26.6 -140.1 707.56 19628.01 3726.66
3 48 608 -16.6 -122.1 275.56 14908.41 2026.86
4 52 682 -12.6 -48.1 158.76 2313.61 606.06
5 63 752 -1.6 21.9 2.56 479.61 -35.04
6 67 725 2.4 -5.1 5.76 26.01 -12.24
7 75 834 10.4 103.9 108.16 10795.21 1080.56
8 84 752 19.4 21.9 376.36 479.61 424.86
9 89 845 24.4 114.9 595.36 13202.01 2803.56
10 99 960 34.4 229.9 1183.36 52854.01 7908.56
Jumlah 646 7301 5.68E-14 -2.3E-13 4542.4 146050.9 24480.4
Rata-rata 64.6 730.1
Penduga Koefesien Regresi:
b1 = 5.38931
b0 = 381.9506
Model dugaan:
Emisi = 381.9506 + 5.38931 Jarak
Contoh output regresi dengan Minitab
Regression Analysis (Emisi Hc vs Jarak Tempuh Mobil)
The regression equation is Emisi = 382 + 5.39 Jarak
Predictor Coef StDev T P
Constant 381.95 42.40 9.01 0.000
Jarak 5.3893 0.6233 8.65 0.000
S = 42.01 R-Sq = 90.3% R-Sq(adj) = 89.1%
Analysis of Variance
Source DF SS MS F P
Regression 1 131932 131932 74.76 0.000
Error 8 14118 1765
Total 9 146051
Unusual Observations
Obs Jarak Emisi Fit StDev Fit Residual St Resid
8 84.0 752.0 834.7 18.0 -82.7 -2.18R
R denotes an observation with a large standardized residual
Pengujian Model
Bagaimana Pengujian kesesuaian model regresi ??
• parsial (per koefisien) uji-t
• bersama uji-F (Anova)
Bagaimana menilai keakuratan model ??
R2 Koef. Determinasi
(% keragaman Y yang mampu dijelaskan oleh X)
Pengujian Kesesuaian Model
n
i
ii
n
i
i
n
i
i yyyyyy1
2
1
2
1
2 )ˆ()ˆ()(
H0 : 1=0 vs H1: 10
ANOVA (Analysis of Variance) Uji F
JK total = JK regresi + JK error
Keragaman total = keragaman yang dapat dijelaskan oleh model +
keragaman yang tidak dapat dijelaskan oleh model
Sumber db JK KT F
Regresi 1 JKR KTR KTR/KTE
Error n - 2 JKE KTE
Total n - 1 JKT
Anova
F ~ F (1,n-2)
Perhatikan Ilustrasi Sebelumnya
Analysis of Variance
Source DF SS MS F P
Regression 1 131932 131932 74.76 0.000
Error 8 14118 1765
Total 9 146051
Pengujian Parameter Model
Secara Parsial
Pengujian Pengaruh X terhadap Y
Hipotesis: H0 : 1≤0 vs H1: 1>0
Statistik uji:
2
)ˆ(
)(
2
2
1
1
1
n
yys
xx
sS
S
bT
ii
i
b
b
Perhatikan Contoh sebelumnya
The regression equation is Emisi = 382 + 5.39 Jarak
Predictor Coef StDev T P
Constant 381.95 42.40 9.01 0.000
Jarak 5.3893 0.6233 8.65 0.000