eksplorasi data pemeriksaan data variabel tunggal · telah cukup simetris dan tidak terdapat nilai...
TRANSCRIPT
-
E k s p l o r a s i D a t a | 1
EKSPLORASI DATA
Pemeriksaan Data Variabel Tunggal
1.1 Pendahuluan Kumpulan data yang merupakan hasil pengukuran terhadap variabel
tertentu, pada umumnya tidak akan memiliki nilai yang persis sama satu
dengan yang lain. Nilai-nilai keberagaman dapat dilihat melalui
sebaran datanya sehingga sangat berguna dalam penentuan karakteristik
data tersebut. Ukuran numerik yang penting meliputi pemusatan data
(central tendency), sebaran data (dispersion) dan bentuk/pola dari
sebaran data (shape).
1.2 Ukuran Pemusatan
Salah satu aspek yang paling penting untuk menggambarkan sebaran
data adalah nilai pusat dari data pengamatan. Setiap pengukuran
aritmatika yang ditujukan untuk menggambarkan suatu nilai yang
mewakili nilai pusat atau nilai sentral dari suatu gugus data (himpunan
pengamatan) dikenal sebagai ukuran tendensi sentral.
Ukuran nilai pusat/tendensi sentral (average) merupakan nilai yang
mewakili dari suatu distribusi data, sehingga memiliki sifat-sifat
berikut:
mempertimbangkan semua elemen dalam data
ada yang sensitif oleh nilai-nilai pencilan (outlier)
memberikan gambaran tentang nilai pusat dari kumpulan data
Dari beberapa ukuran nilai pusat, rata-rata (arithmatic mean)
memenuhi semua sifat tersebut, khususnya bahwa rata-rata hitung tidak
tertimbang dipengaruhi oleh nilai pencilan. Sebagai contoh, jika nilai
amatan pengukuran adalah 2, 4, 5, 6, 6, 6, 7, 7, 8, 9 maka rata-rata
hitung tidak tertimbang, median dan modus semua bernilai sama,
yaitu 6. Jika nilai terakhir adalah 90 bukan 9, rata-rata hitung tidak
tertimbang akan menjadi 14.10, sedangkan median dan modus tidak
berubah. Dalam hal ini artinya untuk memberikan informasi tentang
nilai pusat dari sekumpulan data numerik diperlukan untuk memeriksa
terlebih dahulu adakah nilai pencilan dalam data, sebelum menentukan
ukuran statistik yang sesuai untuk menggambarkan karakteristik
datanya.
1.2.1 Rata-rata Hitung Tidak Tertimbang Rata-rata hitung tidak tertimbang adalah nilai yang mewakili himpunan
atau sekelompok data (a set of data). Rata-rata hitung tidak tertimbang
layak digunakan apabila sebaran data merata atau nilai antara data yang
satu dengan yang lainnya tidak jauh berbeda (homogen).
Rata-rata hitung (arithmatic mean) digunakan apabila:
1) skala pengukuran variabelnya interval atau rasio. 2) memiliki pola sebaran data yang relatif simetrik. 3) tidak terdapat nilai pencilan (outlier).
-
2 | E k s p l o r a s i D a t a
Contoh 1.1:
Pengeluaran rata-rata perbulan (dalam ratusan ribu) dari 6 rumah tangga
di suatu daerah adalah sebagai berikut:
Daerah 1 2 3 4 5 6 Rata - Rata
Perdesaan A 20 23 16 20 24 17 20
Perkotaan B 8 50 7 8 12 35 20
Data di atas dapat digambarkan sebagai berikut:
Rata-rata
Gambar 1. Letak nilai rata-rata pada data perdesaan A
Rata-rata
Gambar 2. Letak nilai rata-rata pada data perkotaan B
Pada contoh di atas, nilai rata-rata hitung tidak tertimbang akan relatif
mewakili data pada pedesaan A karena datanya cenderung
merata/homogen, sedangkan pada perkotaan B nilai rata-rata hitung
tidak tertimbang kurang mewakili keseluruhan data karena datanya
terpencar (heterogen) dengan jarak yang bervariasi.
Contoh 1.2 :
Hitunglah nilai rata-rata hitung tidak tertimbang dari nilai ujian
matematika kelas 3 SMU berikut ini:
2, 4, 5, 6, 6, 7, 7, 7, 8, 9
Jawab:
-
E k s p l o r a s i D a t a | 3
Apakah nilai rata-rata hitung tidak tertimbang ujian matematika
sebesar 6.10 sudah mewakili gugus data tersebut? Artinya diperlukan
pemeriksaan lebih lanjut untuk mengetahui pola sebaran data, apakah
telah cukup simetris dan tidak terdapat nilai pencilan.
Contoh 1.3 :
Misalkan suatu kelompok data yang terdiri dari 20 anggota mempunyai
rata-rata hitung tidak tertimbang 7.50. Tentukan rata-rata hitung tidak
tertimbang yang baru jika pada kelompok data tadi ditambahkan 3 buah
data baru: 5.50, 6.25 dan 8.75.
Penyelesaian:
Misalkan sampel 1 terdiri dari 20 anggota mempunyai rata-rata
X1 = 7,50
sampel 2 mempunyai 3 anggota mempunyai rata-rata
X2 = (5,50 + 6,25 + 8,75)/3 = 6,83. Jadi rata-rata gabungannya adalah:
X =
= 7,41
Apakah kelompok data sampel pertama menjadi berubah nilai rata-
ratanya setelah digabungkan dengan kelompok data sampel kedua?
Dalam hal ini perhatikanlah bagaimana pola sebaran data pada
kelompok data pertama dengan penambahan kelompok data kedua,
apakah pola sebaran datanya menjadi berubah dari sebelumnya?
adakah terdapat nilai pencilan sehingga dapat mempengaruhi
pengukuran nilai rata-rata hitung tidak tertimbang.
1.2.2 Median
Median adalah nilai yang terletak di tengah dari data yang telah
diurutkan. Nilai median dipengaruhi oleh banyaknya pengamatan,
tidak tergantung besarnya nilai pengamatan walaupun nilainya sangat
ekstrem, sehingga median cocok untuk mewakili data yang
sebarannya tidak homogen. Sebagai contoh nilai pusat pada data
perkotaan B cocok menggunakan median untuk menggambarkan
pengeluaran dari keenam rumah tangga tersebut.
Median digunakan bila:
1) skala pengukuran variabel adalah ordinal, interval atau rasio 2) pola sebaran data yang tidak simetrik 3) terdapat beberapa nilai pencilan
Contoh 1.4:
Hitunglah median dari nilai ujian matematika kelas 3 SMU berikut ini:
8, 4, 5, 6, 7, 6, 7, 7, 2, 9, 10
-
4 | E k s p l o r a s i D a t a
Jawab:
jumlah data amatan ganjil, yaitu n = 11
data setelah diurutkan: 2, 4, 5, 6, 6, 7, 7, 7, 8, 9, 10
banyaknya data (n) = 11
posisi Me = ½ (11+1) = 6
Nilai Median = 7 (data yang terletak pada urutan ke-6)
Contoh 1.5:
Hitunglah median dari nilai ujian matematika kelas 3 SMU berikut ini:
8, 4, 5, 6, 7, 6, 7, 7, 2, 9
Jawab:
jumlah data amatan genap, yaitu n = 10
data setelah diurutkan: 2, 4, 5, 6, 6, 7, 7, 7, 8, 9
posisi Me = ½ (10+1) = 5.5
Data tengahnya: 6 dan 7
Jadi nilai Median = ½ (6+7) = 6.5 (rata-rata dari 2 data yang terletak
pada urutan ke-5 dan ke-6)
1.2.3 Modus
Modus adalah nilai yang paling sering muncul dari sekumpulan data,
dan nilainya dapat dihitung untuk variabel dengan skala pengukuran
nominal, ordinal, interval, maupun rasio. Nilai modus tidak dipengaruhi
oleh nilai ekstrem. Modus biasanya digunakan untuk tujuan deskriptif
karena tidak mempertimbangkan sebaran data. Kalau nilai-nilai
pengamatan sangat bervariasi maka modus tidak sesuai untuk dalam
mengambarkan ukuran pemusatan data.
Contoh 1.6 :
Seorang agen intelijen negara memberi informasi kepada kepolisian
bahwa komplotan buronan yang selama ini mereka cari sering muncul
secara bersama-sama antara tanggal 5-10 di setiap bulannya. Dalam
satu bulan, mereka hanya muncul bersama-sama sebanyak 1 kali untuk
melakukan konsolidasi. Pihak kepolisian harus memutuskan sebuah
tanggal dimana pada tanggal tersebut akan dilakukan penggerebekan
terhadap para buronan tersebut. Pihak kepolisian tidak mungkin akan
selalu berjaga-jaga dengan membawa berbagai senjata dan kendaraan
khusus antara tanggal 5 hingga 10 di setiap bulannya di titik lokasi
tersebut karena hal ini akan membuat para buronan curiga dan kabur.
Data tanggal setiap bulan mengenai kemunculan para buronan yang
direkam selama 2 tahun adalah sebagai berikut:
6 5 5 5 6 6 9 5 5 7 8 5 7 5 7 5 5 7 7 5 6 5 10 5
Untuk itulah, kepala polisi memutuskan untuk menentukan modus
dari data tanggal tersebut sebagai tanggal dimana akan dilakukan
penggerebekan terhadap para buronan.
-
E k s p l o r a s i D a t a | 5
Nilai modus dari data tanggal tersebut adalah: 5 (kemunculan
terbanyak, sebanyak 12 kali dari 24 buah data tanggal amatan)
Dengan demikian pihak kepolisian akan melakukan penggerebekan
terhadap para buronan tepat pada tanggal 5.
1.3 Ukuran Penyebaran Ukuran penyebaran digunakan untuk mengetahui sebaran dari data.
Karena ukuran pemusatan tidak selalu mewakili sekelompok data,
maka data perlu diketahui ukuran sebarannya. Ukuran penyebaran atau
ukuran keragaman pengamatan dari nilai rata-ratanya disebut
simpangan (deviation/dispersi). Terdapat beberapa ukuran untuk
menentukan dispersi data pengamatan, seperti jangkauan/rentang
(range), simpangan kuartil (quartile deviation), simpangan rata-rata
(mean deviation), simpangan baku/standar deviasi (standard deviation),
dan ragam/varian (variance).
1.3.1 Rentang (Range) Range merupakan ukuran dari selisih antara nilai maksimum dengan
nilai minimum. Dari contoh 1, didapatkan range pedesaan A = 8 dan
range perkotaan B = 42. Nilai range mempunyai kelemahan dalam
mengukur sebaran data karena hanya memperhatikan dua buah nilai
terkecil dan terbesar dari sekumpulan data.
1.3.2 Varians Dan Standar Deviasi Varians dan standar deviasi adalah ukuran rata-rata hitung tidak
tertimbang posisi data terhadap rata-ratanya, sehingga menunjukkan
seberapa besar simpangan pengamatan terhadap rata-ratanya.
atau
Sedangkan Standar Deviasi Sampel memiliki formula:
s = atau
Dari contoh 1.1 didapatkan standar deviasi perdesaan A = 3.16 (rata-
rata=20), artinya secara umum data berada 3.16 di sekitar rata-ratanya
yaitu antara 16.84 dan 23.16. Standar deviasi perkotaan B = 18.14
(rata-rata=20), artinya secara umum data berada 18.14 di sekitar rata-
ratanya yaitu antara 1.86 dan 38.14. Karena standar deviasi perdesaan
A lebih kecil dari perkotaan B, maka dikatakan bahwa sebaran data
perdesaan A lebih homogen dari pada perkotaan B.
Jika nilai varian dan standar deviasi adalah nol artinya semua amatan
mempunyai nilai yang sama.
-
6 | E k s p l o r a s i D a t a
Contoh 1.7:
Diberikan data mengenai hasil perolehan nilai pada 2 Quiz yg
berbeda, sebagai berikut ini :
1 2 3 4 5 6 7 8 9 10 11
Quiz 1: 1 20 20 20 20 20 20 20 20 20 20
Quiz 2: 2 3 4 5 6 14 15 16 17 18 19
Quiz 1: rata-rata =18.27
Quiz 2: rata-rata = 10.82
No
Quiz 1
(xi)
Quiz 2
(xi)
1 1 -17.27 298.35 2 -8.82 77.76
2 20 1.73 2.98 3 -7.82 61.12
3 20 1.73 2.98 4 -6.82 46.49
4 20 1.73 2.98 5 -5.82 33.85
5 20 1.73 2.98 6 -4.82 23.21
6 20 1.73 2.98 14 3.18 10.12
7 20 1.73 2.98 15 4.18 17.49
8 20 1.73 2.98 16 5.18 26.85
9 20 1.73 2.98 17 6.18 38.21
10 20 1.73 2.98 18 7.18 51.58
11 20 1.73 2.98 19 8.18 66.94
Jumlah 328.1818 453.6364
Quiz 1:
Quiz 2:
Kesimpulan:
Berdasarkan nilai ragam dan standar deviasi, Quiz ke-2 lebih
bervariasi dibandingkan dengan Quiz ke-1. (terlihat bahwa
kesimpulan tentang keragaman data dengan varians ataupun standar
deviasi berbeda dengan kesimpulan berdasarkan range)
-
E k s p l o r a s i D a t a | 7
1.3.3 Koefisien Variasi
Koefisien variasi adalah perbandingan antara standar deviasi dengan
nilai rata-rata yang dinyatakan dengan persentase. Koefisien Variasi
digunakan untuk keperluan perbandingan dua kelompok nilai yang
bebas dari satuan data asli. Koefisien variasi adalah perbandingan
antara standar deviasi dengan rata-ratanya.
Dari contoh 1.1 didapatkan koefisien variasi pedesaan A = 15.8% dan
koefisien variasi B = 90.7%. Ini berarti sebaran data pedesaan A lebih
baik dari sebaran data perkotaan B.
Contoh 1.8 :
Perhatikan gugus data untuk Kelompok A dan Kelompok B
A 2 4 5 6 6 7 7 7 8 9
B 3 6 7 9 9 10 10 10 11 12
Kelompok A: Rata-rata = 6.1; s = 2.0
Kelompok B: Rata-rata = 8.7; s = 2.7
1.4 Pola Sebaran Data
Bentuk/Pola sebaran data dapat dikelompokkan menjadi simetris
(symmetric) dan tidak simetris (asymmetric/skewnees).
a) Rata-rata > median> modus : skewness positif atau menceng kiri b) Rata-rata = median : simetris c) Rata-rata < median < modus: skewness negatif atau menceng
kanan
Gambar 3. Macam Kemencengan (Skewness)
-
8 | E k s p l o r a s i D a t a
1.4.1 Diagram Dahan Dan Daun (Stem-And-Leaf Plot)
Diagram dahan dan daun adalah teknik yang cukup efektif untuk
menggambarkan pola sebaran bagi data yang berukuran kecil. Dengan
teknik ini gambaran distribusi data akan dapat diketahui dengan mudah.
Diagram dahan dan daun membagi data menjadi digit depan (leading)
dan satu digit belakang (trailing). Sebagai contoh apabila data
semuanya terdiri dari dua digit, maka digit depan merupakan puluhan
dan digit di belakangnya merupakan satuan. Jika data 47 berarti
dahan = 4 dan daun = 7, jika data 2 maka dahan = 0 dan daun = 2.
Contoh 1.9
Data pengeluaran rumah tangga di suatu daerah untuk 44 rumah tangga
(dalam ratusan ribuan) adalah sebagai berikut:
47, 11, 46, 33, 19, 42, 27, 22, 62, 10, 44, 2, 15, 21, 67, 20, 26, 25, 6, 53,
18, 3, 30, 7, 21, 25, 20, 40, 16, 8, 4, 10, 46, 31, 14, 15, 8, 10, 19, 17, 12,
16, 42, 16
Dari data di atas, maka digit depan (sebagai dahan) yang paling kecil
adalah 0 dan yang paling besar adalah 6
Diagram dahan dan daunnya sebagai berikut:
Dahan Daun
0 2 6 3 7 8 4 8
1 1 9 0 5 8 6 0 4 5 0 9 7 2 6 6
2 7 2 1 0 6 5 1 5 0
3 3 0 1
4 7 6 2 4 0 6 2
5 3
6 2 7
Gambar 4. Contoh Stem-And-Leaf
-
E k s p l o r a s i D a t a | 9
Dahan Daun
0L 2 3 4
0H 6 7 8 8
1L 1 0 5 0 4 5 0
1H 9 8 6 9 7 6
2L 2 1 0 5 1 5 0
2H 7 6
3L 3 0 1
3H
4L 2 4 0 2
4H 7 6 6
5L 3
5H
6L 2
6H 7
Gambar 5. Contoh Stem-and-leaf
Gambar 4 menunjukkan diagram dahan dan daun yang daunnya
merupakan nilai digit kedua dari data. Sedangkan Gambar 5
menunjukkan diagram dahan dan daun yang mana daunnya dibagi
menjadi 2, yaitu 5 ke bawah dan di atas lima, sehingga batangnya
dibagi menjadi 2 juga yaitu L (low) untuk daun 5 ke bawah dan
H (high) untuk daun di atas 5.
1.4.2 Kuantil
Kuantil merupakan ukuran yang sangat berguna untuk melihat
ketidaksimetrisan data kuantitatif yang berskala besar. Kadang-kadang
penggambaran ini menggunakan persentil (yang membagi data menjadi
100 kelompok), desil (yang membagi data ke dalam 10 kelompok) dan
kuartil (yang membagi data menjadi 4 kelompok). Untuk kepentingan
selanjutnya, di sini akan dibahas tentang kuartil.
Kuartil pertama (Q1), nilai yang membagi 25% data yang lebih kecil dan 75% data yang lebih besar.
Kuartil kedua (Q2), nilai yang membagi 50% data yang lebih kecil dan 50% data yang lebih besar.
Kuartil ketiga (Q3), nilai yang membagi 75% data yang lebih kecil dan 25% data yang lebih besar.
-
10 | E k s p l o r a s i D a t a
1.4.3 Diagram Kotak-Garis (Box Plot)
Box plot adalah representasi grafik dari sekelompok data yang memuat
5 ringkasan data yaitu median, Q1, Q3, minimum dan maksimum.
Untuk data yang simetris, me = (Q1 + Q3)/2 = (min + maks)/2,
sehingga cukup alasan untuk menganggap bahwa Q3 – me = me - Q1 =
(Q3 - Q1)/2.
Boxplot menggambarkan distribusi dari data, sehingga dari grafik ini
akan kelihatan kemencengan data, dan adanya pencilan.
Contoh 1.10
Berikut 20 amatan tentang penggunaan microcomputer selama
seminggu (dalam jam) oleh mahasiswa pada jurusan matematika di
suatu perguruan tinggi: 12, 16, 12, 13, 16, 14, 15, 15, 16, 17, 18, 14, 18,
19, 11, 15, 13, 15, 17, 14.
Diagram box plotnya sebagai berikut:
20.00
18.00
16.00
14.00
12.00
10.00
microcomputer
Gambar 6. Boxplot data pada contoh 1.10
Kalau data mengikuti sebaran normal, maka data berada pada interval
rata-rata ± 1.96 standar deviasi. Secara matematis pola data yang
simetris akan memenuhi ketentuan:
-
E k s p l o r a s i D a t a | 11
Berarti amatan yang berada di luar interval di atas dan median tidak
sama dengan separuh rentang antar kuartil akan merupakan amatan
pencilan.
Contoh 1.11
16.8 25.7 21.4 22.7 28.1 17.5 14.4 20.9
13.1 15.8 21.7 26.2 18.7 20.2 24.6 24.2
14.6 16.9 14.9 26.7 20.2 21.6 15.1 6.9
22.6 12.9 14.1 25.8 17.9 17.7 18.6 20.3
24.4 16.6 20.5 19.7 17.3 18.0 13.7 17.3
Distribusi datanya sebagai berikut: Diagram Dahan dan Daun
data Stem-and-Leaf Plot
Frequenc
1,00
3,00
6,00
8,00
4,00
8,00
2,00
5,00
2,00
1,00
Stem width: 10,00
Each leaf: 1 case(s)
30.00
25.00
20.00
15.00
10.00
5.00
VAR00002
Gambar 7. Boxplot data pada contoh 1.7
y Stem & Leaf
(=
-
12 | E k s p l o r a s i D a t a
3.
Untuk lebih memperjelas pemeriksaan pola sebaran data diberikan
penyajian visual dengan diagram dahan-daun dan diagram kotak-garis
pada contoh 1.11.
Terlihat pola sebaran data relatif simetris dengan sebuah amatan
pencilan yang nilainya sangat kecil dibandingkan sekumpulan data
lainnya.
1.5 Eksplorasi Data dengan SPSS for Windows
Untuk mendapatkan output eksplorasi data menggunakan SPSS
for Windows, langkah-langkahnya adalah sebagai berikut:
1. Aktifkan datanya 2. Klik menu Analyze → Decriptive Statistics → Explore
Gambar 8. Windows SPSS pada saat memilih Analyze →
Decriptive Statistics → Explore
4. Maka akan muncul window seperti di bawah ini
Gambar 9. kotak Dialog Explore
-
E k s p l o r a s i D a t a | 13
Dependent List, adalah daftar variabel yang akan dianalisis
Factor List, adalah daftar variabel yang akan mengelompokkan
output dari variabel yang dianalisis, yaitu pengeluaran rumah
tangga berdasarkan daerah (kota dan desa). Berarti factor list-nya
adalah daerah.
Label Cases by, isian variabel yang akan ditampilkan pada output
untuk masing-masing data, misalkan nomor rumah tangga.
Display, bisa dipilih salah satu dari tiga opsi yang ada. Both: ditampilkan statistik dan ploting datanya. Statistics: akan
ditampilkan output statistik saja. Plots: hanya ditampilkan ploting datanya saja.
Statistics, berisi output statistik sebagai berikut:
Gambar 10. kotak dialog Explore: Statistics
Descriptives, menampilkan output mean, median, modus, 5%
trimmed mean, standar error, variancs, standar deviasi, minimum,
maksimum, range, interquartile range, skewness, standar error
skewness, kurtosis dan standard error kurtosis.
M-estimators, menampilkan output robust maximum-likelihood estimators of central tendency.
Outliers, menampilkan output lima data terkecil dan lima data terbesar. Pada outputnya akan ditampilkan nilai extreme.
Percentiles, akan menampilkan output persentil: 5, 10, 25, 50, 75,
90, 95 dan Tukey's hinges.
Plots, berisi output ploting data sebagai berikut:
Gambar 11. Kotak dialog Explore : Plots
-
14 | E k s p l o r a s i D a t a
Boxplots, organisasi output boxplot. Factor level together: boxplot dikelompokkan berdasarkan faktor. Dependents
together, boxplot dikelompokkan berdasarkan dependent variabel untuk faktor yang sama. None: tidak menampilkan
boxplot
Descriptive, menampilkan plot descriptive. Steam and-leaf,
menampilkan output steam-and-leaf. Histogram, menampilkan histogram data
Normalty plot with test, menampilkan output uji kenormalan.
Option, perlakuan analisis dengan mempertimbangkan missing
value
Gambar 12. Kotak Dialog Explore : Options
Exclude cases listwise, missing value tidak diikutkan dalam analisis.
Exclude cases pairwise, output menyertakan hasil analisis dengan missing value dan tidak dengan missing value.
Report values, mendefinisikan missing value sebagai data tersendiri.
-
E k s p l o r a s i D a t a | 15
Contoh 1.12:
Perhatikan contoh data berikut:
47, 11, 46, 33, 19, 42, 27, 22, 62, 10, 44, 2, 15, 21, 67, 20, 26, 25, 6, 53,
18, 3, 30, 7, 21, 25, 20, 40, 16, 8, 4, 10, 46, 31, 14, 15, 8, 10, 19, 17, 12,
16, 42, 16,
Output SPSS-nya adalah:
Explore
Case Processing Summary
Cases
Valid Missing Total
N Percent N Percent N Percent
data6 44 100,0% 0 ,0% 44 100,0%
Descriptives
Statistic
Std.
Error
data6 Mean 23,77 2,423
95% Confidence
Interval for Mean
Lower Bound 18,89
Upper Bound 28,66
5% Trimmed Mean 22,74
Median 19,50
Variance 258,319
Std. Deviation 16,072
Minimum 2
Maximum 67
Range 65
Interquartile Range 21
Skewness ,944 ,357
Kurtosis ,250 ,702
Percentiles
Percentiles
5 10 25 50 75 90 95
Weighted
Average
(Definition 1)
data6 3,25 6,50 11,25 19,50 32,50 46,50 59,75
-
E k s p l o r a s i D a t a | 17
Percentiles
Percentiles
5 10 25 50 75 90 95
Weighted
Average
(Definition 1)
data6 3,25 6,50 11,25 19,50 32,50 46,50 59,75
Tukey's Hinges data6 11,50 19,50 32,00
Tests of Normality
Kolmogorov-Smirnova Shapiro-Wilk
Statistic df Sig. Statistic Df Sig.
data6 ,159 44 ,007 ,916 44 ,003
a. Lilliefors Significance Correction
Gambar 13. Histogram data contoh 1.12
-
18 | E k s p l o r a s i D a t a
Stem-and-Leaf Plot
Frequency Stem & Leaf
7,00 0 . 2346788
15,00 1 . 000124556667899
9,00 2 . 001125567
3,00 3 . 013
7,00 4 . 0224667
1,00 5 . 3 1,00 6 . 2
1,00 Extremes (>=67)
Stem width: 10
Each leaf: 1 case(s)
Gambar 14. Normal Q-Q plot dari data pada contoh 1.12
-
E k s p l o r a s i D a t a | 19
Gambar 15. Detrend Normal Q-Q plot data pada contoh 1.12
Gambar 16. Box-Plot Data Pada Contoh 1.12