pengukuran nilai pusat & dispersi - srava_chrisdes.staff...
TRANSCRIPT
DESKRIPSI DATA
1
Pengukuran Nilai Pusat & Dispersi
untuk data tunggal / data tidak terdistribusi
Srava Chrisdes Antoro, M.Si.
2
2 cara numerik untuk mendeskripsikan variabel kuantitatif:
Measure of location: Mengukur pusat penyebaran data
Tujuan: menunjukan sesuatu dengan tepat tentang pusat penyebaran data
Meliputi: mean (rata-rata), median, modus
Measure of dispersion: Mengukur variasi dari penyebaran data.
Meliputi: Jangkauan, deviasi mean (simpangan rata-rata), variansi (ragam), deviasi standar (simpangan baku)
3
Mengapa measure
of location (penge-tahuan tentang
rata-rata) saja
tidak cukup?
Karena kita bisa terarah
pada pengam-
bilan kesimpu-lan yang
salah
Contoh:
Rata-rata gaji direktur di perusahaan makanan adalah 50jt/bulan, dan rata-rata dari gaji direktur di perusahaan asuransi
adalah 50jt/bulan. Dari hal ini, seolah-olah bisa diambil kesimpulan bahwa distribusi dari gaji direktur sama. Padahal interval
gaji direktur di perusahaan makanan adalah 40jt-60jt/bulan, sedangkan interval gaji direktur dari perusahaan asuransi adalah dengan range 30jt-70jt/bulan. Ternyata distribusi penyebaran tidak sama, maka
diperlukan measuere of dispersion.
Mean populasi merupakan suatu parameter.
Parameter adalah sebarang karakter yang bisa diukur dalam
populasi.
4
1. MEAN POPULASI
Jumlah nilai dalam populasiMean populasi
Banyak nilai dalam populasi
X
N
Contoh 1
Ada 42 swalayan/minimarket/supermarket di Kota
Depok. Jarak antar swalayan/minimarket tersebut
adalah sebagai berikut (dalam km):
a) Mengapa data tersebut disebut data populasi?
b) Tentukan mean dari jarak antara swalayan
tersebut!5
11 4 10 4 9 3 8
2 2 5 6 1 2 2
1 4 7 5 2 2 5
10 3 14 1 10 3 5
3 7 1 3 7 8 10
1 1 3 3 1 2 1
Jawab:
a) Data tersebut merupakan data populasi karena
mempertimbangkan semua
swalayan/minimarket/ supermarket yang ada
di Kota Depok.
b) Mean dari jarak antar swalayan tersebut
adalah:
6
11 4 10 ... 2 1 1924,57
42 42
Mean dari sampel merupakan suatu statistik.
Statistik adalah sebarang karakter yang diukur berdasarkan data
pada sampel.
7
2. MEAN SAMPEL
Jumlah nilai dalam sampelMean sampel
Banyak nilai dalam sampel
Xx
n
Contoh 2
Seseorang sedang melakukan penelitian tentang
lamanya seseorang berbicara menggunakan
telepon/HP pada suatu hari tertentu. 12 orang
diambil secara random dan diperoleh data sebagai
berikut (dalam menit).
Tentukan mean dari data di atas!
8
90 77 94 89 119 112
91 110 92 100 113 83
Jawab:
Mean dari lamanya seseorang berbicara
menggunakan telepon/ HP adalah
9
90 77 ... 83 117097,5
12 12x
Karakter dari mean (aritmetika)Setiap himpunan dari data interval dan data rasio memiliki mean.
Semua nilai diikutsertakan dalam perhitungan mean.
Mean dari suatu data populasi atau sampel adalah tunggal.
Jumlah deviasi dari setiap nilai dari mean adalah 0.
10( ) 0X x
Contoh 3
Nilai : 3, 8, 4.
11
Mean = (3+8+4)/3 = 15/3 = 5
Deviasi = (3-5) + (8-5) + (4-5) = -2 + 3 + (-1) = 0
12
Kelemahan Mean
Jika ada salah satu nilai dalam sampel ataupun populasi yang terlalu tinggi atau terlalu rendah dibanding dengan nilai mayoritas lainnya, maka mean tidak lagi menjadi rata-rata yang tepat untuk data.
CONTOH: Pendapatan tahunan dari perusahaan percetakan adalah 1M, 1,5M, 2M, dan 8M.
Mean = (1M + 1,5M + 2M + 8M)/4 = 3,125M
Mean pada contoh ini tentunya tidak mewakili data yang ada, karena nyaris semua pendapatan berada dalam interval 1M – 2M, hanya ada 1 data yang terlalu tinggi.
Weighted mean sering juga diartikan sebagai rata-rata
berbobot.
13
3. Weighted MEAN
1 1 2 2
1 2
( )...
...
n nw
n
wXw x w x w xX
w w w w
14
Contoh 4
Suatu restoran menjual suatu minuman dengan ukuran
kecil, medium dan besar, yang harga masing-masingnya
adalah $0.90, $1.25 dan $1.50. Sebanyak 3 ukuran kecil, 4
ukuran medium dan 3 ukuran besar terjual.
Tentukan rata-rata dari harga minuman yang terjual di
restoran tersebut!
15
Jawab:
Rata-rata (weighted mean) dari harga minuman yang terjual
di restoran tersebut adalah:
3 0,90 4 1,25 3 1,5 12,201,22
3 4 3 10wX
16
4. MEDIANWhy Median is
necessary ?
Contoh: Seseorang akan menginap di suatu kamar hotel.
Seorang agen mengatakan bahwa rata-rata harga kamar di
hotel tersebut adalah 1,1jt/malam. Sedangkan, budget dari
orang tersebut max 750rb/malam. Apakah orang tersebut
masih akan mencari penyewaan kamar di hotel tersebut?
Tapi setelah mengetahui detil harga kamar hotel di kawasan
tersebut, bisa jadi orang tersebut akan berubah pikiran.
Harga sewa kamar hotel tersebut adalah standard room
600rb, Superior room 650rb, Deluxe room 700rb, Suite
room 800rb, dan Presidential room 2,75jt.
Karakter dari Median
17
Merupakan nilai tengah dari data setelah diurutkan dari nilai terkecil hingga yang terbesar atau sebaliknya.
Tidak dipengaruhi oleh nilai-nilai ekstrem (nilai yang terlalu besar ataupun yang terlalu kecil).
Median dapat dihitung untuk data ordinal, data interval, dan data rasio.
Jika banyaknya data adalah ganjil, maka median terdapat pada data.
Jika banyaknya data adalah genap, maka median merupakan rata-rata dari 2 nilai di tengahnya. Dengan kata lain, median bisa jadi bukan merupakan suatu nilai pada data.
19
Jawab:
Urutkan terlebih dahulu datanya dari yang terkecil hingga
terbesar.
1 3 3 5 5 7 9 9 10 17
Karena banyaknya data ada 10 (genap), maka mediannya
adalah rata-rata dari data ke-5 dan data ke-6, yaitu:
5 7 12median 6
2 2
20
5. MODUS
Karakter Modus:
- Dapat dihitung untuk semua ukuran data, yaitu data nominal,
data ordinal, data interval, dan data rasio.
- Nilai modus tidak dipengaruhi oleh nilai-nilai ekstrem,
misalnya nilai yang terlalu tinggi ataupun yang terlalu rendah
dari mayoritas nilai lainnya.
Kelemahan Modus:
- Kadang ada beberapa data, saat masing-masing
nilai muncul hanya 1 kali saja
- Ada beberapa data dengan modus lebih dari 1.
Nilai yang paling
sering muncul
21
Data FrekuensiFrekuensi
Kumulatif
1 8 8
2 7 15
3 7 22
4 3 25
5 4 29
6 1 30
7 3 33
8 2 35
9 1 36
10 4 40
11 1 41
14 1 42
TOTAL 42
Contoh 1 (tentang 42
swalayan di Kota Depok)
Menunjukkan frekuensi
terbanyak di antara nilai
lainnya, maka:
MODUS = 1.
MEDIAN terletak pada
data ke-21 dan data ke-
22, yaitu 3.
22
6. MEAN GEOMETRI
- Sangat berguna untuk menemukan rata-rata perubahan pada
persentase, rasio, indeks, dan rata-rata laju pertumbuhan
terhadap waktu.
- Mean geometri Mean aritmetika
Contoh 6
Asumsikan seseorang menerima kenaikan gaji sebesar 5%
pada tahun ini dan 15% pada tahun berikutnya. Tentukan
apakah rata-rata persentase kenaikan gajinya adalah 10%
(yang diperoleh dari (5%+15%)/2)?
23
Kenaikan gaji sebanyak 5% => gaji naik menjadi sebesar 1,05x.
Kenaikan gaji sebanyak 15% => gaji naik menjadi 1,15x.
Hasil tersebut menunjukkan rata-rata persentase kenaikan gaji
orang tersebut adalah 9,886%, BUKAN 10%.
21 2 1,05 1,15 1,2075 1,09886GM x x
Asumsikan pada mulanya gaji seseorang tersebut adalah sebesar 1jt/
bulan, maka
24
Gaji awal Kenaikan (%) Kenaikan (Rp)
Kenaikan gaji tahun ini 1.000.000,00 5% 50.000,00
Kenaikan gaji tahun depan 1.050.000,00 15% 157.500,00
207.500,00
Kenaikan gaji tahun ini 1.000.000,00 9,886% 98.860,00
Kenaikan gaji tahun depan 1.098.860,00 9,886% 108.633,30
207.493,30
Kenaikan gaji tahun ini 1.000.000,00 10% 100.000,00
Kenaikan gaji tahun depan 1.100.000,00 10% 110.000,00
210.000,00
1) Kenyataannya
2) Rata-rata persentase kenaikan gaji = 9,886%
3) Jika dianggap rata-rata persentase kenaikan gaji = 10%
TOTAL kenaikan gaji selama 2 tahun =
TOTAL kenaikan gaji selama 2 tahun =
TOTAL kenaikan gaji selama 2 tahun =
Lebih mendekati ke hasil yang sebenarnya
Contoh 7
Populasi di Las Vegas meningkat dari 258.295 jiwa
pada 1990 menjadi 607.876 jiwa pada tahun 2009,
atau terjadi kenaikan sebesar 349.581 jiwa atau
135,34% pada periode tersebut. Tentukan rata-rata
persentase laju pertumbuhan populasi per tahunnya
pada periode tersebut?
25
26
1990 – 2009 = 19 tahun, sehingga n = 19.
Artinya, rata-rata persentase laju pertumbuhan populasi per tahun
selama periode tersebut adalah 4,61%. Dengan kata lain, populasi
penduduk di Las Vegas meningkat dengan laju 4,61% per tahun dari
1990 ke 2009.
Jawab:
1) Karena mean, median, modus hanya membicarakan tentang pusat data, tapi tidak menceritakan tentang penyebaran data.
2) Jika nilai ukuran penyebaran data kecil, hal itu menunjukkan bahwa nilai-nilai pada data tidak terlalu jauh berbeda, yaitu hampir mendekati mean aritmetika, sehingga dalam hal ini nilai mean sangat dipertimbangkan untuk mewakili pusat data.
3) Jika nilai ukuran penyebaran data besar, maka nilai mean tidak bisa dipertimbangkan untuk mewakili pusat data.
4) Pengetahuan tentang penyebaran data berguna untuk membandingkan penyebaran dalam dua atau lebih distribusi.
5) Ukuran penyebaran data dapat digunakan untuk mengevaluasi apakah hasil pengukuran lokasi (mean, median, modus) benar-benar mewakili data/dapat dipertanggungjawabkan.
27
Mengapa perlu mempelajari
Dispersi/Penyebaran Data ?
28
1. RANGE (JANGKAUAN)hanya berdasarkan nilai terbesar atau nilai
terendah saja
Range = Nilai terbesar – Nilai terkecil
melibatkan semua nilai observasi pada
data
2. DEVIASI MEAN
X xMD
n
dengan:
nilai dari setiap observasi
mean aritmetika
banyaknya observasi pada sampel
X
x
n
a) Variansi Populasi
Proses menghitung variansi populasi:
- Mulai dengan menemukan nilai mean artimetika sehingga diperoleh
- Tentukan selisih setiap nilai X dengan mean sehingga diperoleh (X ),
kemudian kuadratkan nilai selisih tersebut sehingga diperoleh (X )2
- Jumlahkan semua kuadrat selisihnya sehingga diperoleh ∑(X )2
- Bagi hasil jumlah semua kuadrat selisih dengan banyaknya data dalam
populasi sehingga diperoleh 2.
29
3. VARIANSI & DEVIASI STANDAR
2
2( )X
N
Variansi populasi sangat sulit diinterpetasikan, karena
adanya kuadrat, tapi dapat disimpulkan bahwa jika nilai
variansi populasi makin kecil, maka nilai-nilai observasi pada
data dekat dengan pusat data (yaitu mean), sehingga nilai
observasi pada data tidak terlalu menyebar luas atau tidak
terlalu bervariasi.
Sedangkan, jika nilai observasi dalam populasi menyebar luas
dari mean, maka variansi populasi akan besar.
30
b) Deviasi Standar Populasi
c) Variansi Sampel
d) Deviasi Standar Sampel
31
2
2( )X
N
2
2( )
1
X xs
n
2
2( )
1
X xs s
n
32
2
2
dengan:
variansi populasi
deviasi standar populasi
variansi sampel
deviasi standar sampel
mean aritmetika dari populasi
mean aritmetika dari sampel
banyaknya observasi pada populasi
banyakny
s
s
x
N
n
a observasi pada sampel
nilai dari setiap observasiX
Deviasi standar biasanya digunakan untuk
membandingkan penyebaran dalam dua atau lebih
himpunan observasi.
Semakin kecil nilai deviasi standar, maka hal itu menunjukkan
makin dekatnya nilai-nilai observasi dengan mean-nya.
Sebaliknya, jika semakin besar nilai deviasi, maka hal itu
menunjukkan semakin bervariasinya nilai-nilai observasi.
33
Contoh 8
Upah rata-rata sejumlah sampel pegawai paruh
waktu di suatu perusahaan adalah:
$12, $20, $16, $18, $19
a. Hitunglah jangkauan dari data tersebut!
b. Berapakah deviasi mean dari sampel tersebut?
c. Hitunglah variansi dari sampel tersebut?
d. Berapakah deviasi standar dari sampel tersebut?
34
Jawab:
a. Jangkauan = 20 – 12 = 8
b. Hitung mean terlebih dahulu:
Deviasi meannya adalah:
35
12 20 16 18 19 8517
5 5x
12 17 20 17 16 17 18 17 19 17
5
5 3 1 1 2 122, 4
5 5
X xMD
n
36
2
2
2 2 2 2 2
( )
1
(12 17) (20 17) (16 17) (18 17) (19 17)
5 1
4010
4
X xs
n
2 10 3,16s s
c. Variansi sampelnya adalah:
d. Deviasi standar sampelnya adalah:
37
Carilah informasi mengenai bagaimana cara menentukan:
a. kuartil
b. desil
c. persentil
pada data tunggal/data tidak terdistribusi.
Tugas 1
38
Sepuluh pemuda yang tinggal di Ancol dipilih secara acak untuk
menilai rasa dari pizza sushi terbaru yang dilapisi tuna, nasi, dan
rumput laut pada skala 1 hingga 50. Berikut adalah penilaiannya.
34 39 40 46 33
31 34 14 15 45
Tugas 2
39
a) Hitunglah rata-rata (mean), median, dan modus dari data
tersebut.
b) Hitunglah simpangan rata-rata (deviasi mean) dari data
tersebut. Interpretasikan hasilnya dengan rata-rata (mean) yang
didapat pada poin (a).
c) Berapakah jangkauan (range) dari data tersebut?
d) Hitunglah variansi dan simpangan baku (deviasi standar) dari
data tersebut.
e) Tentukan kuartil pertama, kedua, dan ketiga dari data tersebut.
f) Tentukan desil ketiga dan ketujuh dari data tersebut.
g) Tentukan persentil ke-40 dari data tersebut.