dasar+statistik

7/30/2019 Dasar+Statistik

1/20

MATERI

KULIAH AKADEMI METEOROLOGI KLIMATOLOGI & GEOFISIKA

STATISTIK DASAR

(UNTUK KLIMATOLOGI)

Oleh : Drs. Soetamto, Msi, Ir. Antoyo Setyadipratikto

I. PENDAHULUAN

Ilmu statistik adalah ilmu yang berhubungan dengan metode untuk pengumpulan data,penyajian, analisa serta penarikan kesimpulannnya. Karena klimatologi berhubungan

dengan data-data yang telah terjadi ( historical data ) , agar data-data ini menghasilkan

informasi yang lebih jelas digunakan ilmu statistik.

Metoda statistik ini dapat dibedakan menjadi 2, yaitu :

Statistik deskriptif ( descriptive statistics ) yang juga disebut statistik deduktif

( deductive statistics ), yaitu statistik yang hanya menggambarkan dan menganalisa

data yang ada tanpa menarik kesimpulan atau tujuan lain lebih lanjut. Penyajian

datanya dapat dalam bentuk tabel, grafik dan sebagainya.

Statistik induktif ( inductive statistics ) atau statistik inferens ( statistical inference ) ,

yaitu statistik yang bertujuan untuk menganalisis karakteristik menarik kesimpulan-

kesimpulan dari hasil deskriptifnya, lebih jauh statistik induktif ini berhubungan

dengan peramalan ( forecasting).

II. VARIABEL DALAM STATISTIK

Variabel dalam statistik adalah set dari nilai yang sering juga disebut domain. Notasi

variabel adalah huruf besar, seperti : A, B, X, Y dsb.

Jika variabel hanya berisi satu nilai disebut konstanta.

Varaiabel dalam statistik dapat dibedakan menjadi 2, yaitu :

1


2/20

Variabel kontinyu, yaitu variabel yang anggotanya bilangan real temasuk

didalamnya bilangan-bilangan ratio. ( Gambar . 1 ).

Gambar 1. Garis bilangan variabel kontinyu X. R = Himpunan bilangan Real.

Contoh :

- Data curah hujan ( mm ,1 desimal ) : 0, 2.4, 36.4, 0, 87.9, ........

- Suhu udara ( Celcius ) : -3.4, 2,7, 11.2, -1.2, 17.4 .......- Tekanan udara ( mb ) ; 1011.5, 1013.2 , 1010.9 .............

Variabel diskrit, yaitu variabel yang anggotanya hanya bilangan bulat .

( Gambar . 2 ).

Gambar 2. Garis bilangan variabel diskrit X. B = Himpunan Bulat.

Contoh :- Data curah hujan ( mm , 0 desimal ) : 0, 2, 36, 0, 88, .............

- Hari hujan : 5, 7, 0, 4, ......................

- Data banyaknya siklon tropis : 2, 3, 5, 7, 3, ..................

- Jumlah penduduk : 1023, 789, 2134, .........

Catatan : data curah hujan dimungkinkan continyu atau diskrit.

2


3/20

Data hari hujan , siklon tropis dan jumlah penduduk tidak dimungkinkan

kontinyu, karena tidak ada data : 1,2 , 2,6, 787,2 untuk hari hujan, siklon tropis

maupun jumlah penduduk.

III. DISTRIBUSI FREKWENSI

Distribusi frekwensi dapat diartikan sebagai pengelompokkan data kedalam kategori-

kategori atau kelas-kelas. Banyaknya data yang berada dalam kelas masing-masing

disebut frekwensi. Distribusi frekwensi ini dimaksudkan untuk lebih mudah menganalisis

data dimaksud.

III.1 JENIS DISTRIBUSI FREKWENSI

Distribusi frekwensi dapat dibedakan menjadi :

a. Distribusi frekwensi tunggal : jika kategori atau kelas untuk mendistribusikan

data bernilai tunggal.

Contoh :

Data curah hujan (mm) : 0, 16, 4, 5, 15, 0, 11, 6, 12, 7, 12, 34, 19,

18, 17, 21, 10, 27, 6, 10, 10, 23, 17, 27, 6, 16,

21, 11, 12, 22, 16.

Distribusi frekwensi tunggalnya :

No. Nilai FrekwensiFrekwensi

kumulatitf

1 0 2 22 4 1 3

3 5 1 4

4 6 3 7

5 7 1 8

6 10 3 11

7 11 2 13

8 12 3 16

9 15 1 17

10 16 3 20

11 17 2 22

3


4/20

12 18 1 23

13 19 1 24

14 21 2 26

15 22 1 27

16 23 1 28

17 27 2 30

18 34 1 31

Jumlah 31

Tabel 1. Frekwensi tunggal

b. Distribusi frekwensi data yang dikelompokkan ( interval ).

Distribusi frekwensi data yang dikelompokkan ini digunakan untuk data yang

banyak sekali dengan nilai-nilai yang sangat veriatif. Karena distribusi

frekwensi data yang dikelompokkan ini paling sering digunakan, maka istilah

distribusi frekwensi sering ditujukan untuk distribusi frekwensi data yang

dikelompokkan ini.

Pengelompkan nilai-nilainya sangat tergantung pada kondisi data serta

keperluannya, namun secara umum ada teori yang telah diturunkan oleh

H.A. Sturges, sebagai berikut :

Menentukan jumlah kelas :

k = 1 + 3.322 log n .......1

k = banyaknya kelas.

n = banyaknya data.

Contoh : lihat data hujan diatas.

n = banyaknya data = 31, maka banyaknya kelas :

k = 1 + 3.322 log 31 = 1 + 4.95 = 1 + 5 = 6

Menentukan jarak kelas ( range ) :

4


5/20

:

R = nilai maksimum nilai minimum ................ 2

R = jarak kelas.


Nilai maksimum = 34, nilai minimum = 0, maka :

. R = 34 0 = 34

Menentukan interval kelas :

........................................................ 3

i = interval kelas.

R= range kelas , k = jumlah kelas.


R = 34, k = 6, maka :

. i = 34 / 6 = 5,666 .

Karena i umumnya diambil harga bulat, maka i = 5, atau i = 6

Umumnya untuk kelaziman interval kelas diambil nilai 5, atau

kelipatannya.

Jika diambil interval kelas = 5, maka distribusi dari data diatas

sebagai berikut :

Distribusi frekwensi data yang dikelompokkan :

5


6/20

No Kelas FrekwensiFrekwensi

kumulatif

1 0 - 4 3 3

2 5 9 5 8

3 10 14 8 16

4 15 19 8 24

5 20 24 4 28

6 25 29 2 307 30 - 34 1 31

Jumlah 31

Tabel 2. Frekwensi data yang dikelompokkan.

c. Distribusi frekwensi lainnya hanya berkaitan dengan teknik penyajiannya,

seperti : Distribusi Frekwensi Relatif , Distribusi Frekwensi Kumulatif. Karenakedua distribusi diatas kurang banyak digunakan dalam klimatologi maka tidak

dibahas dalam tulisan ini.

III.2. GRAFIK DISTRIBUSI FREKWENSI

Teknik penyajian distribusi frekwensi dalam bentuk grafik, diantaranya :

Histogram frekwensi, poligon frekwensi serta ogive.

Contoh-contoh grafik berdasar data tabel 2, yaitu :

- Histogram (Gambar 3a ) , pada histogram, batas balok ( bar ) adalah tepi kelas.

Tepi kelas ke 1 = (4 + 5) / 2 = 4.5

Tepi kelas ke 2 = (9 + 10) / 2 = 9.5 dan seterusnya

Catatan : tepi kelas ada 2, yaitu tepi kelas atas dan tepi kelas bawah, tepi kelas

atas interfal kelas ke 1 merupakan tepi kelas bawah interval kelas ke 2.

6


7/20

Gambar 3a. Grafik histogram.

- Poligon (Gambar 3b ) , pada poligon batas nilai ditetapkan dari nilai tengah kelas.

Nilai tengah kelas ke 1 = ( 0 + 4 ) / 2 = 2

Nilai tengah kelas ke 2 = ( 5 + 9 ) / 2 = 7 dan seterusnya.

Gambar 3b. Grafik poligon.

IV. TEORI KECENDERUNGAN MEMUSAT ( TENDENCY CENTRAL )

7


8/20

Teori ini diturunkan berdasar data-data empiris di alam umumnnya berkecenderungan

memusat ke sebuah nilai. Nilai nilai inilah yang ditetapkn sebagai ukuran tendensi

memusat ( measure of central tendency ). Ukuran tendensi pusat yang sering

digunakan dalam statistik, diantaranya :

Rata rata hitung ( mean ).

Nilai tengah ( median ).

Nilai yang paling sering muncul ( mode ).

Selain ini ada ukuran tendensi pusat untuk tujuan-tujuan khusus, seperti : rata- rata

ukur dan rata-rata harmonis.

IV. 1. RATA RATA HITUNG

Rata rata hitung ( mean ) dengan notasi , mempunyai formula :

a. Rata rata hitung data yang tidak dikelompokkan :

...................................................................... 4

= rata rata hitung

n = banyaknya data

i = 1, 2, 3, .................................. , n

Contoh : lihat dat tabel. 1

= 1 / 31 ( 0 + 16 + 4 + 5 + 15 + ...................... + 16 )

= 1 / 31 x ( 431 ) = 13,9032

b. Rata rata hitung data yang dikelompokkan :

8


9/20

................ 5

= rata rata hitung

mi = nilai tengah interval ke i

fi = frekwensi kelas ke i

k = jumlah kelasn = banyaknya data

i = 1, 2, 3, .................................. , k

Contoh : lihat data tabel. 2

= 1 / 31 ( 2x3 + 7x5 + 12x8 + 17x8 + 22x4 + 27x2 + 32x1 )

= 14,419

IV. 2. NILAI TENGAH ( MEDIAN )

Median adalah nilai yang membagi distribusi frekwensi menjadi 2 bagian yang

sama. Notasi median Md.

Karena median membagi seluruh data menjadi 2 sama banyak, maka sebelum

menentukan median seluruh data harus diurutkan mulai dari kecil hingga yang

besar.

Kemudian letak median dihitung berdasar formula :

a. Median data yang tidak dikelompokkan:

- jika jumlah data ganjil, letak median ditentukan berdasar formula :

9


10/20

.................................. 6

- jika jumlah data ganjil, letak median ditentukan berdasar formula :

............................. 7

K1 , K2 = letak median

n = jumlah data

Md = Median

Contoh : lihat data hujan.

1. Jika jumlah data ganjil

Data setelah diurutkan menjadi :

0, 0, 4, 5, 6, 6, 6, 7, 10, 10, 10, 11, 11, 12, 12, 12, 15, 16, 16, 16,

17, 17, 18, 19, 21, 21, 22, 23, 27, 27, 34.

n = Jumlah data = 31 ganjil, maka :

K1 = letak median = ( 31 +1 ) /2 = 16

Jadi median = data yang terletak pada urutan ke 16.

Md = 12

1. Jika jumlah data genap ( data hujan dikurangi 1, yaitu data ke 5 ( 6 ).

10


11/20

Data setelah diurutkan menjadi :

0, 0, 4, 5, 6, 6, 7, 10, 10, 10, 11, 11, 12, 12, 12, 15, 16, 16, 16,

17, 17, 18, 19, 21, 21, 22, 23, 27, 27, 34.

n = Jumlah data = 30 genap, maka :

K1 = ( 30 ) / 2 = 15 ; K2 = ( 32 ) / 2 = 16

Jadi median = ( data ke 15 + data ke 16 ) / 2.

Md = (12 + 15 ) = 13.5

b. Median data yang dikelompokkan

Formula median untuk data yang dikelompokkan, adalah :

................................ 8

Md = Median.

B = Tepi kelas bawah dari interval dimana median terletak.

n = Jumlah data.

f = Frekwensi kumulatif yang bersesuaian dengan tepi kelas dalam

interval dimana median terletak.

fm = Frekwensi kumulatif yang bersesuaian dengan tepi kelas atas

dalam interval dimana median terletak.

i = Interval kelas.

Contoh : dari data tabel 2

11


12/20

Median = 9.5 + [ ( 15.5 -8 ) / ( 16 8 ) ] x 5 = 9.5 + 4.6875 = 14.1875.

Gambar 4. Contoh perhitungan median data yang dikelompokkan.

IV.3. MODUS

Modus adalah nilai yang paling sering muncul, atau frekwensi terbanyak. Jika set

data hanya mempunyai satu modus disebut unimodal,jikamempunyai 2 modus

disebut bimodal, sedang jika mempunyai modus lebih dari 2 disebut multimodal.

a. Modus data yang tidak dikelompokkan.

Menentukan modus data yang tidak dikelompokkan sangatlah mudah, yaitu

dengan melihat frekwensi terbesarnya.

Contoh : lihat data tabel 1.

Modus 1 = 6

Modus 2 = 10

Modus 3 = 12Modus 4 = 16

b. Modus data yang dikelompokkan.

12


13/20

..................................... 9

Mo = Modus

B = Tepi bawah kelas dimana kelas modus terletak.

1 = Slisih frekwensi kelas modus terletak dengan kelas sebelumnya.

2 = Slisih frekwensi kelas modus terletak dengan kelas sesudahnya.

i = Interval kelas.

.

Jika data hanya memiliki satu modus, contoh perhitungannya sebagai berikut :

Gambar 5. Contoh perhitungan modus data yang dikelompokkan.

Modus 1 = 9.5 + [3 / ( 3 + 4 ) ] x 5 = 9.5 + 2.1428 = 11.6428

V. SEBARAN DATA ( DISPERSI )

13


14/20

Dispersi adalah sebaran data, parameter parameter yang digunakan untuk mengukur

sebaran data, diantaranya :

V. 1. RANGE

Range ialah jarak data, dengan formula selisih data maksimum dengan minimum.

Contoh : dari tabel 1.

Range = 34 0 = 34

V. 2. VARIASI ( VARIANCE) DAN SIMPANGAN BAKU ( STANDARD DEVIATION)

Pengukuran dispersi yang paling sering digunakan dalam statistik adalah, varians

dan deviasi stndar. Ukuran sebaran ini dihitung dari nilai rata-rata hitung.

Formula varians dan deviasi standar, sebagai berikut :

a. Varians dan Standar Deviasi untuk data yang tidak dikelompokkan :

Untuk n > 100

................................ 11.a

Untuk n < 100

...................................11.b

Untuk n > 100

14


15/20

.................................. 12.a

Untuk n < 100

12.b.

S2

= Varians ; S = Deviasi Standar

= rata-rata hitung ; n = jumlah data

Xi = data ke i ; i = 1, 2, 3, .....................n

Pada umumnya saat ini perhitungan varians dan standar deviasi dilakukan melalui

Program-program yang tersedia di komputer.


Dari perhitungan didapat :

Varians =......

Standar Deviasi = ..............

b. Varians dan Standar Deviasi untuk data yang dikelompokkan :

15


16/20

..........................13.a

......................... 13.b

S2

= Varians ; S = Deviasi Standar

= rata-rata hitung ; n = jumlah data

Xi = titik tengah kelas ke i ; fi = jumlah frekwensi ke i

i = 1, 2, 3, .....................n


Dari perhitungan didapat :

Varians =......

Standar Deviasi = ..............

VI. ANALISA BIVARIAT

Salah satu analisis yang sering dilakukan dalam klimatologi adalah analisa

hubungan anatara 2 variabel ( bivariat ).

Analisis ini dapat dilakukan melalui berbagai cara, diantaranya :

SCATER PLOT ANALISIS

16


17/20

Analisis ini dilakukan dengan cara memplot kedua variabel dalam satu grafik,

dan hasilnya dianalisis sebagai berikut :

Gambar 6a. Variabel 1 berhubungan Gambar 6b. Variabel 1 berhubungan

Linear dengan variabel 2 linear dengan variabel 2

( korelasi positif ). ( korelasi negatif ).

Gambar 7a. Variabel 1 berhubungan Gambar 7b. Variabel 1 berhubungan

Tidak Linear (kuadrat ) tidak linear (kuadrat)

dengan variabel 2. dengan variabel 2.

17


18/20

Gambar 8. Tidak ada hubungan antara

variabel 1 dengan variabel 2.

KORELASI PEARSON

Jika scater plot korelasi yang didapat lebih bersifat kualitatif, maka untuk

mendapatkan gambaran kuantitatifnya.

Salah satu metoda untuk menganalisis tingkat hubungan antara 2 variabel,iyalah korelasi Pearson, yang formulanya :

.. 14.

r = korelasi Pearson

n = jumlah data

Xi = variabel pertama ke i

Yi = variabel kedua ke i

18


19/20

Nilai r adalah berkisar antara -1 hingga +1, tingkat kuat / tidaknya hubungan

antara dua variabel dapat dilihat dari besarnya nilai r tanpa melihat tandanya ,

sbb :

r= 0 .. tidak ada hubungan v lemah

. v

. v

r= 0,5 .. ada hubungan sedang v makin kuat

. v

. v

r= 1,0 .hubungan sempurna v kuat

Sifat hubungan ditentukan oleh tanda r, sbb :

r negatif ( > 0 ) , berarti hubungan terbalik : jika Y naik X turun , dan jika

Y turun X naik.

r positif ( > 0 ) , berarti hubungan sebanding : jika Y naik X naik , dan jika

jika Y turun X turun.

19


20/20

Daftar Pustaka :

1. Anto Dajan ( 1986 ). Pengantar Metode Statistik, Jilid I. LP3ES, Jakarta.

2. Allen L. Edwards ( 1966 ). Statistical Methods for the Behavioral Sciences. Holt,Rinehart and Winston, New York.

3. Albert E. Waugh ( 1952 ). Element of Statistical Method, third edition.

McGraw Hill Book Company, New York.

4. David G. Kleinbaum, Lawrence L. Kupper ( 1978 ) . Applied Regression Analysis and

Other Multivariate Method, Duxbury Press, Massachusetts.

5. Frederick K. Lutgens , Edward J. Tarbuck ( 1998 ). The Atmosphere : An

Introduction to Meteorology. Prenticed - Hall, Inc. Upper Saddle River, New Jersey

07458.

6. Takahashi , Syunji., 2002. : Statistical Methode for Long Range Forecast,

Climate Prediction Division, Japan Meteorological Agency, Bahan Presentasi pada :

Workshop on Climate System Monitoring, Diagnosis and Prediction in the Asia-

Pacifik Region., Tokyo.

7. Takano, Kiyoharu., 2002. : Probabilistic Forecast,


Workshop on Climate System Monitoring, Diagnosis and Prediction in the Asia-

Pacifik., Region, Tokyo.

8. Tomoaki, Ose., 2002. : Dynamical Longe Range Forecast,


Workshop on Climate System Monitoring, Diagnosis and Prediction in the Asia

Pacifik Region, Tokyo.

9. Wilks, Daniel.S., 1995 : Statistical Methods in the Atmospheric Sciences,

Academic Press, San Diego.

20

dasar+statistik

Documents