dasar+statistik
TRANSCRIPT
-
7/30/2019 Dasar+Statistik
1/20
MATERI
KULIAH AKADEMI METEOROLOGI KLIMATOLOGI & GEOFISIKA
STATISTIK DASAR
(UNTUK KLIMATOLOGI)
Oleh : Drs. Soetamto, Msi, Ir. Antoyo Setyadipratikto
I. PENDAHULUAN
Ilmu statistik adalah ilmu yang berhubungan dengan metode untuk pengumpulan data,penyajian, analisa serta penarikan kesimpulannnya. Karena klimatologi berhubungan
dengan data-data yang telah terjadi ( historical data ) , agar data-data ini menghasilkan
informasi yang lebih jelas digunakan ilmu statistik.
Metoda statistik ini dapat dibedakan menjadi 2, yaitu :
Statistik deskriptif ( descriptive statistics ) yang juga disebut statistik deduktif
( deductive statistics ), yaitu statistik yang hanya menggambarkan dan menganalisa
data yang ada tanpa menarik kesimpulan atau tujuan lain lebih lanjut. Penyajian
datanya dapat dalam bentuk tabel, grafik dan sebagainya.
Statistik induktif ( inductive statistics ) atau statistik inferens ( statistical inference ) ,
yaitu statistik yang bertujuan untuk menganalisis karakteristik menarik kesimpulan-
kesimpulan dari hasil deskriptifnya, lebih jauh statistik induktif ini berhubungan
dengan peramalan ( forecasting).
II. VARIABEL DALAM STATISTIK
Variabel dalam statistik adalah set dari nilai yang sering juga disebut domain. Notasi
variabel adalah huruf besar, seperti : A, B, X, Y dsb.
Jika variabel hanya berisi satu nilai disebut konstanta.
Varaiabel dalam statistik dapat dibedakan menjadi 2, yaitu :
1
-
7/30/2019 Dasar+Statistik
2/20
Variabel kontinyu, yaitu variabel yang anggotanya bilangan real temasuk
didalamnya bilangan-bilangan ratio. ( Gambar . 1 ).
Gambar 1. Garis bilangan variabel kontinyu X. R = Himpunan bilangan Real.
Contoh :
- Data curah hujan ( mm ,1 desimal ) : 0, 2.4, 36.4, 0, 87.9, ........
- Suhu udara ( Celcius ) : -3.4, 2,7, 11.2, -1.2, 17.4 .......- Tekanan udara ( mb ) ; 1011.5, 1013.2 , 1010.9 .............
Variabel diskrit, yaitu variabel yang anggotanya hanya bilangan bulat .
( Gambar . 2 ).
Gambar 2. Garis bilangan variabel diskrit X. B = Himpunan Bulat.
Contoh :- Data curah hujan ( mm , 0 desimal ) : 0, 2, 36, 0, 88, .............
- Hari hujan : 5, 7, 0, 4, ......................
- Data banyaknya siklon tropis : 2, 3, 5, 7, 3, ..................
- Jumlah penduduk : 1023, 789, 2134, .........
Catatan : data curah hujan dimungkinkan continyu atau diskrit.
2
-
7/30/2019 Dasar+Statistik
3/20
Data hari hujan , siklon tropis dan jumlah penduduk tidak dimungkinkan
kontinyu, karena tidak ada data : 1,2 , 2,6, 787,2 untuk hari hujan, siklon tropis
maupun jumlah penduduk.
III. DISTRIBUSI FREKWENSI
Distribusi frekwensi dapat diartikan sebagai pengelompokkan data kedalam kategori-
kategori atau kelas-kelas. Banyaknya data yang berada dalam kelas masing-masing
disebut frekwensi. Distribusi frekwensi ini dimaksudkan untuk lebih mudah menganalisis
data dimaksud.
III.1 JENIS DISTRIBUSI FREKWENSI
Distribusi frekwensi dapat dibedakan menjadi :
a. Distribusi frekwensi tunggal : jika kategori atau kelas untuk mendistribusikan
data bernilai tunggal.
Contoh :
Data curah hujan (mm) : 0, 16, 4, 5, 15, 0, 11, 6, 12, 7, 12, 34, 19,
18, 17, 21, 10, 27, 6, 10, 10, 23, 17, 27, 6, 16,
21, 11, 12, 22, 16.
Distribusi frekwensi tunggalnya :
No. Nilai FrekwensiFrekwensi
kumulatitf
1 0 2 22 4 1 3
3 5 1 4
4 6 3 7
5 7 1 8
6 10 3 11
7 11 2 13
8 12 3 16
9 15 1 17
10 16 3 20
11 17 2 22
3
-
7/30/2019 Dasar+Statistik
4/20
12 18 1 23
13 19 1 24
14 21 2 26
15 22 1 27
16 23 1 28
17 27 2 30
18 34 1 31
Jumlah 31
Tabel 1. Frekwensi tunggal
b. Distribusi frekwensi data yang dikelompokkan ( interval ).
Distribusi frekwensi data yang dikelompokkan ini digunakan untuk data yang
banyak sekali dengan nilai-nilai yang sangat veriatif. Karena distribusi
frekwensi data yang dikelompokkan ini paling sering digunakan, maka istilah
distribusi frekwensi sering ditujukan untuk distribusi frekwensi data yang
dikelompokkan ini.
Pengelompkan nilai-nilainya sangat tergantung pada kondisi data serta
keperluannya, namun secara umum ada teori yang telah diturunkan oleh
H.A. Sturges, sebagai berikut :
Menentukan jumlah kelas :
k = 1 + 3.322 log n .......1
k = banyaknya kelas.
n = banyaknya data.
Contoh : lihat data hujan diatas.
n = banyaknya data = 31, maka banyaknya kelas :
k = 1 + 3.322 log 31 = 1 + 4.95 = 1 + 5 = 6
Menentukan jarak kelas ( range ) :
4
-
7/30/2019 Dasar+Statistik
5/20
:
R = nilai maksimum nilai minimum ................ 2
R = jarak kelas.
Contoh : lihat data hujan diatas.
Nilai maksimum = 34, nilai minimum = 0, maka :
. R = 34 0 = 34
Menentukan interval kelas :
........................................................ 3
i = interval kelas.
R= range kelas , k = jumlah kelas.
Contoh : lihat data hujan diatas.
R = 34, k = 6, maka :
. i = 34 / 6 = 5,666 .
Karena i umumnya diambil harga bulat, maka i = 5, atau i = 6
Umumnya untuk kelaziman interval kelas diambil nilai 5, atau
kelipatannya.
Jika diambil interval kelas = 5, maka distribusi dari data diatas
sebagai berikut :
Distribusi frekwensi data yang dikelompokkan :
5
-
7/30/2019 Dasar+Statistik
6/20
No Kelas FrekwensiFrekwensi
kumulatif
1 0 - 4 3 3
2 5 9 5 8
3 10 14 8 16
4 15 19 8 24
5 20 24 4 28
6 25 29 2 307 30 - 34 1 31
Jumlah 31
Tabel 2. Frekwensi data yang dikelompokkan.
c. Distribusi frekwensi lainnya hanya berkaitan dengan teknik penyajiannya,
seperti : Distribusi Frekwensi Relatif , Distribusi Frekwensi Kumulatif. Karenakedua distribusi diatas kurang banyak digunakan dalam klimatologi maka tidak
dibahas dalam tulisan ini.
III.2. GRAFIK DISTRIBUSI FREKWENSI
Teknik penyajian distribusi frekwensi dalam bentuk grafik, diantaranya :
Histogram frekwensi, poligon frekwensi serta ogive.
Contoh-contoh grafik berdasar data tabel 2, yaitu :
- Histogram (Gambar 3a ) , pada histogram, batas balok ( bar ) adalah tepi kelas.
Tepi kelas ke 1 = (4 + 5) / 2 = 4.5
Tepi kelas ke 2 = (9 + 10) / 2 = 9.5 dan seterusnya
Catatan : tepi kelas ada 2, yaitu tepi kelas atas dan tepi kelas bawah, tepi kelas
atas interfal kelas ke 1 merupakan tepi kelas bawah interval kelas ke 2.
6
-
7/30/2019 Dasar+Statistik
7/20
Gambar 3a. Grafik histogram.
- Poligon (Gambar 3b ) , pada poligon batas nilai ditetapkan dari nilai tengah kelas.
Nilai tengah kelas ke 1 = ( 0 + 4 ) / 2 = 2
Nilai tengah kelas ke 2 = ( 5 + 9 ) / 2 = 7 dan seterusnya.
Gambar 3b. Grafik poligon.
IV. TEORI KECENDERUNGAN MEMUSAT ( TENDENCY CENTRAL )
7
-
7/30/2019 Dasar+Statistik
8/20
Teori ini diturunkan berdasar data-data empiris di alam umumnnya berkecenderungan
memusat ke sebuah nilai. Nilai nilai inilah yang ditetapkn sebagai ukuran tendensi
memusat ( measure of central tendency ). Ukuran tendensi pusat yang sering
digunakan dalam statistik, diantaranya :
Rata rata hitung ( mean ).
Nilai tengah ( median ).
Nilai yang paling sering muncul ( mode ).
Selain ini ada ukuran tendensi pusat untuk tujuan-tujuan khusus, seperti : rata- rata
ukur dan rata-rata harmonis.
IV. 1. RATA RATA HITUNG
Rata rata hitung ( mean ) dengan notasi , mempunyai formula :
a. Rata rata hitung data yang tidak dikelompokkan :
...................................................................... 4
= rata rata hitung
n = banyaknya data
i = 1, 2, 3, .................................. , n
Contoh : lihat dat tabel. 1
= 1 / 31 ( 0 + 16 + 4 + 5 + 15 + ...................... + 16 )
= 1 / 31 x ( 431 ) = 13,9032
b. Rata rata hitung data yang dikelompokkan :
8
-
7/30/2019 Dasar+Statistik
9/20
................ 5
= rata rata hitung
mi = nilai tengah interval ke i
fi = frekwensi kelas ke i
k = jumlah kelasn = banyaknya data
i = 1, 2, 3, .................................. , k
Contoh : lihat data tabel. 2
= 1 / 31 ( 2x3 + 7x5 + 12x8 + 17x8 + 22x4 + 27x2 + 32x1 )
= 14,419
IV. 2. NILAI TENGAH ( MEDIAN )
Median adalah nilai yang membagi distribusi frekwensi menjadi 2 bagian yang
sama. Notasi median Md.
Karena median membagi seluruh data menjadi 2 sama banyak, maka sebelum
menentukan median seluruh data harus diurutkan mulai dari kecil hingga yang
besar.
Kemudian letak median dihitung berdasar formula :
a. Median data yang tidak dikelompokkan:
- jika jumlah data ganjil, letak median ditentukan berdasar formula :
9
-
7/30/2019 Dasar+Statistik
10/20
.................................. 6
- jika jumlah data ganjil, letak median ditentukan berdasar formula :
............................. 7
K1 , K2 = letak median
n = jumlah data
Md = Median
Contoh : lihat data hujan.
1. Jika jumlah data ganjil
Data setelah diurutkan menjadi :
0, 0, 4, 5, 6, 6, 6, 7, 10, 10, 10, 11, 11, 12, 12, 12, 15, 16, 16, 16,
17, 17, 18, 19, 21, 21, 22, 23, 27, 27, 34.
n = Jumlah data = 31 ganjil, maka :
K1 = letak median = ( 31 +1 ) /2 = 16
Jadi median = data yang terletak pada urutan ke 16.
Md = 12
1. Jika jumlah data genap ( data hujan dikurangi 1, yaitu data ke 5 ( 6 ).
10
-
7/30/2019 Dasar+Statistik
11/20
Data setelah diurutkan menjadi :
0, 0, 4, 5, 6, 6, 7, 10, 10, 10, 11, 11, 12, 12, 12, 15, 16, 16, 16,
17, 17, 18, 19, 21, 21, 22, 23, 27, 27, 34.
n = Jumlah data = 30 genap, maka :
K1 = ( 30 ) / 2 = 15 ; K2 = ( 32 ) / 2 = 16
Jadi median = ( data ke 15 + data ke 16 ) / 2.
Md = (12 + 15 ) = 13.5
b. Median data yang dikelompokkan
Formula median untuk data yang dikelompokkan, adalah :
................................ 8
Md = Median.
B = Tepi kelas bawah dari interval dimana median terletak.
n = Jumlah data.
f = Frekwensi kumulatif yang bersesuaian dengan tepi kelas dalam
interval dimana median terletak.
fm = Frekwensi kumulatif yang bersesuaian dengan tepi kelas atas
dalam interval dimana median terletak.
i = Interval kelas.
Contoh : dari data tabel 2
11
-
7/30/2019 Dasar+Statistik
12/20
Median = 9.5 + [ ( 15.5 -8 ) / ( 16 8 ) ] x 5 = 9.5 + 4.6875 = 14.1875.
Gambar 4. Contoh perhitungan median data yang dikelompokkan.
IV.3. MODUS
Modus adalah nilai yang paling sering muncul, atau frekwensi terbanyak. Jika set
data hanya mempunyai satu modus disebut unimodal,jikamempunyai 2 modus
disebut bimodal, sedang jika mempunyai modus lebih dari 2 disebut multimodal.
a. Modus data yang tidak dikelompokkan.
Menentukan modus data yang tidak dikelompokkan sangatlah mudah, yaitu
dengan melihat frekwensi terbesarnya.
Contoh : lihat data tabel 1.
Modus 1 = 6
Modus 2 = 10
Modus 3 = 12Modus 4 = 16
b. Modus data yang dikelompokkan.
12
-
7/30/2019 Dasar+Statistik
13/20
..................................... 9
Mo = Modus
B = Tepi bawah kelas dimana kelas modus terletak.
1 = Slisih frekwensi kelas modus terletak dengan kelas sebelumnya.
2 = Slisih frekwensi kelas modus terletak dengan kelas sesudahnya.
i = Interval kelas.
.
Jika data hanya memiliki satu modus, contoh perhitungannya sebagai berikut :
Gambar 5. Contoh perhitungan modus data yang dikelompokkan.
Modus 1 = 9.5 + [3 / ( 3 + 4 ) ] x 5 = 9.5 + 2.1428 = 11.6428
V. SEBARAN DATA ( DISPERSI )
13
-
7/30/2019 Dasar+Statistik
14/20
Dispersi adalah sebaran data, parameter parameter yang digunakan untuk mengukur
sebaran data, diantaranya :
V. 1. RANGE
Range ialah jarak data, dengan formula selisih data maksimum dengan minimum.
Contoh : dari tabel 1.
Range = 34 0 = 34
V. 2. VARIASI ( VARIANCE) DAN SIMPANGAN BAKU ( STANDARD DEVIATION)
Pengukuran dispersi yang paling sering digunakan dalam statistik adalah, varians
dan deviasi stndar. Ukuran sebaran ini dihitung dari nilai rata-rata hitung.
Formula varians dan deviasi standar, sebagai berikut :
a. Varians dan Standar Deviasi untuk data yang tidak dikelompokkan :
Untuk n > 100
................................ 11.a
Untuk n < 100
...................................11.b
Untuk n > 100
14
-
7/30/2019 Dasar+Statistik
15/20
.................................. 12.a
Untuk n < 100
12.b.
S2
= Varians ; S = Deviasi Standar
= rata-rata hitung ; n = jumlah data
Xi = data ke i ; i = 1, 2, 3, .....................n
Pada umumnya saat ini perhitungan varians dan standar deviasi dilakukan melalui
Program-program yang tersedia di komputer.
Contoh : lihat data tabel 1.
Dari perhitungan didapat :
Varians =......
Standar Deviasi = ..............
b. Varians dan Standar Deviasi untuk data yang dikelompokkan :
15
-
7/30/2019 Dasar+Statistik
16/20
..........................13.a
......................... 13.b
S2
= Varians ; S = Deviasi Standar
= rata-rata hitung ; n = jumlah data
Xi = titik tengah kelas ke i ; fi = jumlah frekwensi ke i
i = 1, 2, 3, .....................n
Contoh : lihat data tabel 2.
Dari perhitungan didapat :
Varians =......
Standar Deviasi = ..............
VI. ANALISA BIVARIAT
Salah satu analisis yang sering dilakukan dalam klimatologi adalah analisa
hubungan anatara 2 variabel ( bivariat ).
Analisis ini dapat dilakukan melalui berbagai cara, diantaranya :
SCATER PLOT ANALISIS
16
-
7/30/2019 Dasar+Statistik
17/20
Analisis ini dilakukan dengan cara memplot kedua variabel dalam satu grafik,
dan hasilnya dianalisis sebagai berikut :
Gambar 6a. Variabel 1 berhubungan Gambar 6b. Variabel 1 berhubungan
Linear dengan variabel 2 linear dengan variabel 2
( korelasi positif ). ( korelasi negatif ).
Gambar 7a. Variabel 1 berhubungan Gambar 7b. Variabel 1 berhubungan
Tidak Linear (kuadrat ) tidak linear (kuadrat)
dengan variabel 2. dengan variabel 2.
17
-
7/30/2019 Dasar+Statistik
18/20
Gambar 8. Tidak ada hubungan antara
variabel 1 dengan variabel 2.
KORELASI PEARSON
Jika scater plot korelasi yang didapat lebih bersifat kualitatif, maka untuk
mendapatkan gambaran kuantitatifnya.
Salah satu metoda untuk menganalisis tingkat hubungan antara 2 variabel,iyalah korelasi Pearson, yang formulanya :
.. 14.
r = korelasi Pearson
n = jumlah data
Xi = variabel pertama ke i
Yi = variabel kedua ke i
18
-
7/30/2019 Dasar+Statistik
19/20
Nilai r adalah berkisar antara -1 hingga +1, tingkat kuat / tidaknya hubungan
antara dua variabel dapat dilihat dari besarnya nilai r tanpa melihat tandanya ,
sbb :
r= 0 .. tidak ada hubungan v lemah
. v
. v
r= 0,5 .. ada hubungan sedang v makin kuat
. v
. v
r= 1,0 .hubungan sempurna v kuat
Sifat hubungan ditentukan oleh tanda r, sbb :
r negatif ( > 0 ) , berarti hubungan terbalik : jika Y naik X turun , dan jika
Y turun X naik.
r positif ( > 0 ) , berarti hubungan sebanding : jika Y naik X naik , dan jika
jika Y turun X turun.
19
-
7/30/2019 Dasar+Statistik
20/20
Daftar Pustaka :
1. Anto Dajan ( 1986 ). Pengantar Metode Statistik, Jilid I. LP3ES, Jakarta.
2. Allen L. Edwards ( 1966 ). Statistical Methods for the Behavioral Sciences. Holt,Rinehart and Winston, New York.
3. Albert E. Waugh ( 1952 ). Element of Statistical Method, third edition.
McGraw Hill Book Company, New York.
4. David G. Kleinbaum, Lawrence L. Kupper ( 1978 ) . Applied Regression Analysis and
Other Multivariate Method, Duxbury Press, Massachusetts.
5. Frederick K. Lutgens , Edward J. Tarbuck ( 1998 ). The Atmosphere : An
Introduction to Meteorology. Prenticed - Hall, Inc. Upper Saddle River, New Jersey
07458.
6. Takahashi , Syunji., 2002. : Statistical Methode for Long Range Forecast,
Climate Prediction Division, Japan Meteorological Agency, Bahan Presentasi pada :
Workshop on Climate System Monitoring, Diagnosis and Prediction in the Asia-
Pacifik Region., Tokyo.
7. Takano, Kiyoharu., 2002. : Probabilistic Forecast,
Climate Prediction Division, Japan Meteorological Agency, Bahan Presentasi pada :
Workshop on Climate System Monitoring, Diagnosis and Prediction in the Asia-
Pacifik., Region, Tokyo.
8. Tomoaki, Ose., 2002. : Dynamical Longe Range Forecast,
Climate Prediction Division, Japan Meteorological Agency, Bahan Presentasi pada :
Workshop on Climate System Monitoring, Diagnosis and Prediction in the Asia
Pacifik Region, Tokyo.
9. Wilks, Daniel.S., 1995 : Statistical Methods in the Atmospheric Sciences,
Academic Press, San Diego.
20