dasar+statistik

Upload: mimie-kamarudin

Post on 14-Apr-2018

213 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/30/2019 Dasar+Statistik

    1/20

    MATERI

    KULIAH AKADEMI METEOROLOGI KLIMATOLOGI & GEOFISIKA

    STATISTIK DASAR

    (UNTUK KLIMATOLOGI)

    Oleh : Drs. Soetamto, Msi, Ir. Antoyo Setyadipratikto

    I. PENDAHULUAN

    Ilmu statistik adalah ilmu yang berhubungan dengan metode untuk pengumpulan data,penyajian, analisa serta penarikan kesimpulannnya. Karena klimatologi berhubungan

    dengan data-data yang telah terjadi ( historical data ) , agar data-data ini menghasilkan

    informasi yang lebih jelas digunakan ilmu statistik.

    Metoda statistik ini dapat dibedakan menjadi 2, yaitu :

    Statistik deskriptif ( descriptive statistics ) yang juga disebut statistik deduktif

    ( deductive statistics ), yaitu statistik yang hanya menggambarkan dan menganalisa

    data yang ada tanpa menarik kesimpulan atau tujuan lain lebih lanjut. Penyajian

    datanya dapat dalam bentuk tabel, grafik dan sebagainya.

    Statistik induktif ( inductive statistics ) atau statistik inferens ( statistical inference ) ,

    yaitu statistik yang bertujuan untuk menganalisis karakteristik menarik kesimpulan-

    kesimpulan dari hasil deskriptifnya, lebih jauh statistik induktif ini berhubungan

    dengan peramalan ( forecasting).

    II. VARIABEL DALAM STATISTIK

    Variabel dalam statistik adalah set dari nilai yang sering juga disebut domain. Notasi

    variabel adalah huruf besar, seperti : A, B, X, Y dsb.

    Jika variabel hanya berisi satu nilai disebut konstanta.

    Varaiabel dalam statistik dapat dibedakan menjadi 2, yaitu :

    1

  • 7/30/2019 Dasar+Statistik

    2/20

    Variabel kontinyu, yaitu variabel yang anggotanya bilangan real temasuk

    didalamnya bilangan-bilangan ratio. ( Gambar . 1 ).

    Gambar 1. Garis bilangan variabel kontinyu X. R = Himpunan bilangan Real.

    Contoh :

    - Data curah hujan ( mm ,1 desimal ) : 0, 2.4, 36.4, 0, 87.9, ........

    - Suhu udara ( Celcius ) : -3.4, 2,7, 11.2, -1.2, 17.4 .......- Tekanan udara ( mb ) ; 1011.5, 1013.2 , 1010.9 .............

    Variabel diskrit, yaitu variabel yang anggotanya hanya bilangan bulat .

    ( Gambar . 2 ).

    Gambar 2. Garis bilangan variabel diskrit X. B = Himpunan Bulat.

    Contoh :- Data curah hujan ( mm , 0 desimal ) : 0, 2, 36, 0, 88, .............

    - Hari hujan : 5, 7, 0, 4, ......................

    - Data banyaknya siklon tropis : 2, 3, 5, 7, 3, ..................

    - Jumlah penduduk : 1023, 789, 2134, .........

    Catatan : data curah hujan dimungkinkan continyu atau diskrit.

    2

  • 7/30/2019 Dasar+Statistik

    3/20

    Data hari hujan , siklon tropis dan jumlah penduduk tidak dimungkinkan

    kontinyu, karena tidak ada data : 1,2 , 2,6, 787,2 untuk hari hujan, siklon tropis

    maupun jumlah penduduk.

    III. DISTRIBUSI FREKWENSI

    Distribusi frekwensi dapat diartikan sebagai pengelompokkan data kedalam kategori-

    kategori atau kelas-kelas. Banyaknya data yang berada dalam kelas masing-masing

    disebut frekwensi. Distribusi frekwensi ini dimaksudkan untuk lebih mudah menganalisis

    data dimaksud.

    III.1 JENIS DISTRIBUSI FREKWENSI

    Distribusi frekwensi dapat dibedakan menjadi :

    a. Distribusi frekwensi tunggal : jika kategori atau kelas untuk mendistribusikan

    data bernilai tunggal.

    Contoh :

    Data curah hujan (mm) : 0, 16, 4, 5, 15, 0, 11, 6, 12, 7, 12, 34, 19,

    18, 17, 21, 10, 27, 6, 10, 10, 23, 17, 27, 6, 16,

    21, 11, 12, 22, 16.

    Distribusi frekwensi tunggalnya :

    No. Nilai FrekwensiFrekwensi

    kumulatitf

    1 0 2 22 4 1 3

    3 5 1 4

    4 6 3 7

    5 7 1 8

    6 10 3 11

    7 11 2 13

    8 12 3 16

    9 15 1 17

    10 16 3 20

    11 17 2 22

    3

  • 7/30/2019 Dasar+Statistik

    4/20

    12 18 1 23

    13 19 1 24

    14 21 2 26

    15 22 1 27

    16 23 1 28

    17 27 2 30

    18 34 1 31

    Jumlah 31

    Tabel 1. Frekwensi tunggal

    b. Distribusi frekwensi data yang dikelompokkan ( interval ).

    Distribusi frekwensi data yang dikelompokkan ini digunakan untuk data yang

    banyak sekali dengan nilai-nilai yang sangat veriatif. Karena distribusi

    frekwensi data yang dikelompokkan ini paling sering digunakan, maka istilah

    distribusi frekwensi sering ditujukan untuk distribusi frekwensi data yang

    dikelompokkan ini.

    Pengelompkan nilai-nilainya sangat tergantung pada kondisi data serta

    keperluannya, namun secara umum ada teori yang telah diturunkan oleh

    H.A. Sturges, sebagai berikut :

    Menentukan jumlah kelas :

    k = 1 + 3.322 log n .......1

    k = banyaknya kelas.

    n = banyaknya data.

    Contoh : lihat data hujan diatas.

    n = banyaknya data = 31, maka banyaknya kelas :

    k = 1 + 3.322 log 31 = 1 + 4.95 = 1 + 5 = 6

    Menentukan jarak kelas ( range ) :

    4

  • 7/30/2019 Dasar+Statistik

    5/20

    :

    R = nilai maksimum nilai minimum ................ 2

    R = jarak kelas.

    Contoh : lihat data hujan diatas.

    Nilai maksimum = 34, nilai minimum = 0, maka :

    . R = 34 0 = 34

    Menentukan interval kelas :

    ........................................................ 3

    i = interval kelas.

    R= range kelas , k = jumlah kelas.

    Contoh : lihat data hujan diatas.

    R = 34, k = 6, maka :

    . i = 34 / 6 = 5,666 .

    Karena i umumnya diambil harga bulat, maka i = 5, atau i = 6

    Umumnya untuk kelaziman interval kelas diambil nilai 5, atau

    kelipatannya.

    Jika diambil interval kelas = 5, maka distribusi dari data diatas

    sebagai berikut :

    Distribusi frekwensi data yang dikelompokkan :

    5

  • 7/30/2019 Dasar+Statistik

    6/20

    No Kelas FrekwensiFrekwensi

    kumulatif

    1 0 - 4 3 3

    2 5 9 5 8

    3 10 14 8 16

    4 15 19 8 24

    5 20 24 4 28

    6 25 29 2 307 30 - 34 1 31

    Jumlah 31

    Tabel 2. Frekwensi data yang dikelompokkan.

    c. Distribusi frekwensi lainnya hanya berkaitan dengan teknik penyajiannya,

    seperti : Distribusi Frekwensi Relatif , Distribusi Frekwensi Kumulatif. Karenakedua distribusi diatas kurang banyak digunakan dalam klimatologi maka tidak

    dibahas dalam tulisan ini.

    III.2. GRAFIK DISTRIBUSI FREKWENSI

    Teknik penyajian distribusi frekwensi dalam bentuk grafik, diantaranya :

    Histogram frekwensi, poligon frekwensi serta ogive.

    Contoh-contoh grafik berdasar data tabel 2, yaitu :

    - Histogram (Gambar 3a ) , pada histogram, batas balok ( bar ) adalah tepi kelas.

    Tepi kelas ke 1 = (4 + 5) / 2 = 4.5

    Tepi kelas ke 2 = (9 + 10) / 2 = 9.5 dan seterusnya

    Catatan : tepi kelas ada 2, yaitu tepi kelas atas dan tepi kelas bawah, tepi kelas

    atas interfal kelas ke 1 merupakan tepi kelas bawah interval kelas ke 2.

    6

  • 7/30/2019 Dasar+Statistik

    7/20

    Gambar 3a. Grafik histogram.

    - Poligon (Gambar 3b ) , pada poligon batas nilai ditetapkan dari nilai tengah kelas.

    Nilai tengah kelas ke 1 = ( 0 + 4 ) / 2 = 2

    Nilai tengah kelas ke 2 = ( 5 + 9 ) / 2 = 7 dan seterusnya.

    Gambar 3b. Grafik poligon.

    IV. TEORI KECENDERUNGAN MEMUSAT ( TENDENCY CENTRAL )

    7

  • 7/30/2019 Dasar+Statistik

    8/20

    Teori ini diturunkan berdasar data-data empiris di alam umumnnya berkecenderungan

    memusat ke sebuah nilai. Nilai nilai inilah yang ditetapkn sebagai ukuran tendensi

    memusat ( measure of central tendency ). Ukuran tendensi pusat yang sering

    digunakan dalam statistik, diantaranya :

    Rata rata hitung ( mean ).

    Nilai tengah ( median ).

    Nilai yang paling sering muncul ( mode ).

    Selain ini ada ukuran tendensi pusat untuk tujuan-tujuan khusus, seperti : rata- rata

    ukur dan rata-rata harmonis.

    IV. 1. RATA RATA HITUNG

    Rata rata hitung ( mean ) dengan notasi , mempunyai formula :

    a. Rata rata hitung data yang tidak dikelompokkan :

    ...................................................................... 4

    = rata rata hitung

    n = banyaknya data

    i = 1, 2, 3, .................................. , n

    Contoh : lihat dat tabel. 1

    = 1 / 31 ( 0 + 16 + 4 + 5 + 15 + ...................... + 16 )

    = 1 / 31 x ( 431 ) = 13,9032

    b. Rata rata hitung data yang dikelompokkan :

    8

  • 7/30/2019 Dasar+Statistik

    9/20

    ................ 5

    = rata rata hitung

    mi = nilai tengah interval ke i

    fi = frekwensi kelas ke i

    k = jumlah kelasn = banyaknya data

    i = 1, 2, 3, .................................. , k

    Contoh : lihat data tabel. 2

    = 1 / 31 ( 2x3 + 7x5 + 12x8 + 17x8 + 22x4 + 27x2 + 32x1 )

    = 14,419

    IV. 2. NILAI TENGAH ( MEDIAN )

    Median adalah nilai yang membagi distribusi frekwensi menjadi 2 bagian yang

    sama. Notasi median Md.

    Karena median membagi seluruh data menjadi 2 sama banyak, maka sebelum

    menentukan median seluruh data harus diurutkan mulai dari kecil hingga yang

    besar.

    Kemudian letak median dihitung berdasar formula :

    a. Median data yang tidak dikelompokkan:

    - jika jumlah data ganjil, letak median ditentukan berdasar formula :

    9

  • 7/30/2019 Dasar+Statistik

    10/20

    .................................. 6

    - jika jumlah data ganjil, letak median ditentukan berdasar formula :

    ............................. 7

    K1 , K2 = letak median

    n = jumlah data

    Md = Median

    Contoh : lihat data hujan.

    1. Jika jumlah data ganjil

    Data setelah diurutkan menjadi :

    0, 0, 4, 5, 6, 6, 6, 7, 10, 10, 10, 11, 11, 12, 12, 12, 15, 16, 16, 16,

    17, 17, 18, 19, 21, 21, 22, 23, 27, 27, 34.

    n = Jumlah data = 31 ganjil, maka :

    K1 = letak median = ( 31 +1 ) /2 = 16

    Jadi median = data yang terletak pada urutan ke 16.

    Md = 12

    1. Jika jumlah data genap ( data hujan dikurangi 1, yaitu data ke 5 ( 6 ).

    10

  • 7/30/2019 Dasar+Statistik

    11/20

    Data setelah diurutkan menjadi :

    0, 0, 4, 5, 6, 6, 7, 10, 10, 10, 11, 11, 12, 12, 12, 15, 16, 16, 16,

    17, 17, 18, 19, 21, 21, 22, 23, 27, 27, 34.

    n = Jumlah data = 30 genap, maka :

    K1 = ( 30 ) / 2 = 15 ; K2 = ( 32 ) / 2 = 16

    Jadi median = ( data ke 15 + data ke 16 ) / 2.

    Md = (12 + 15 ) = 13.5

    b. Median data yang dikelompokkan

    Formula median untuk data yang dikelompokkan, adalah :

    ................................ 8

    Md = Median.

    B = Tepi kelas bawah dari interval dimana median terletak.

    n = Jumlah data.

    f = Frekwensi kumulatif yang bersesuaian dengan tepi kelas dalam

    interval dimana median terletak.

    fm = Frekwensi kumulatif yang bersesuaian dengan tepi kelas atas

    dalam interval dimana median terletak.

    i = Interval kelas.

    Contoh : dari data tabel 2

    11

  • 7/30/2019 Dasar+Statistik

    12/20

    Median = 9.5 + [ ( 15.5 -8 ) / ( 16 8 ) ] x 5 = 9.5 + 4.6875 = 14.1875.

    Gambar 4. Contoh perhitungan median data yang dikelompokkan.

    IV.3. MODUS

    Modus adalah nilai yang paling sering muncul, atau frekwensi terbanyak. Jika set

    data hanya mempunyai satu modus disebut unimodal,jikamempunyai 2 modus

    disebut bimodal, sedang jika mempunyai modus lebih dari 2 disebut multimodal.

    a. Modus data yang tidak dikelompokkan.

    Menentukan modus data yang tidak dikelompokkan sangatlah mudah, yaitu

    dengan melihat frekwensi terbesarnya.

    Contoh : lihat data tabel 1.

    Modus 1 = 6

    Modus 2 = 10

    Modus 3 = 12Modus 4 = 16

    b. Modus data yang dikelompokkan.

    12

  • 7/30/2019 Dasar+Statistik

    13/20

    ..................................... 9

    Mo = Modus

    B = Tepi bawah kelas dimana kelas modus terletak.

    1 = Slisih frekwensi kelas modus terletak dengan kelas sebelumnya.

    2 = Slisih frekwensi kelas modus terletak dengan kelas sesudahnya.

    i = Interval kelas.

    .

    Jika data hanya memiliki satu modus, contoh perhitungannya sebagai berikut :

    Gambar 5. Contoh perhitungan modus data yang dikelompokkan.

    Modus 1 = 9.5 + [3 / ( 3 + 4 ) ] x 5 = 9.5 + 2.1428 = 11.6428

    V. SEBARAN DATA ( DISPERSI )

    13

  • 7/30/2019 Dasar+Statistik

    14/20

    Dispersi adalah sebaran data, parameter parameter yang digunakan untuk mengukur

    sebaran data, diantaranya :

    V. 1. RANGE

    Range ialah jarak data, dengan formula selisih data maksimum dengan minimum.

    Contoh : dari tabel 1.

    Range = 34 0 = 34

    V. 2. VARIASI ( VARIANCE) DAN SIMPANGAN BAKU ( STANDARD DEVIATION)

    Pengukuran dispersi yang paling sering digunakan dalam statistik adalah, varians

    dan deviasi stndar. Ukuran sebaran ini dihitung dari nilai rata-rata hitung.

    Formula varians dan deviasi standar, sebagai berikut :

    a. Varians dan Standar Deviasi untuk data yang tidak dikelompokkan :

    Untuk n > 100

    ................................ 11.a

    Untuk n < 100

    ...................................11.b

    Untuk n > 100

    14

  • 7/30/2019 Dasar+Statistik

    15/20

    .................................. 12.a

    Untuk n < 100

    12.b.

    S2

    = Varians ; S = Deviasi Standar

    = rata-rata hitung ; n = jumlah data

    Xi = data ke i ; i = 1, 2, 3, .....................n

    Pada umumnya saat ini perhitungan varians dan standar deviasi dilakukan melalui

    Program-program yang tersedia di komputer.

    Contoh : lihat data tabel 1.

    Dari perhitungan didapat :

    Varians =......

    Standar Deviasi = ..............

    b. Varians dan Standar Deviasi untuk data yang dikelompokkan :

    15

  • 7/30/2019 Dasar+Statistik

    16/20

    ..........................13.a

    ......................... 13.b

    S2

    = Varians ; S = Deviasi Standar

    = rata-rata hitung ; n = jumlah data

    Xi = titik tengah kelas ke i ; fi = jumlah frekwensi ke i

    i = 1, 2, 3, .....................n

    Contoh : lihat data tabel 2.

    Dari perhitungan didapat :

    Varians =......

    Standar Deviasi = ..............

    VI. ANALISA BIVARIAT

    Salah satu analisis yang sering dilakukan dalam klimatologi adalah analisa

    hubungan anatara 2 variabel ( bivariat ).

    Analisis ini dapat dilakukan melalui berbagai cara, diantaranya :

    SCATER PLOT ANALISIS

    16

  • 7/30/2019 Dasar+Statistik

    17/20

    Analisis ini dilakukan dengan cara memplot kedua variabel dalam satu grafik,

    dan hasilnya dianalisis sebagai berikut :

    Gambar 6a. Variabel 1 berhubungan Gambar 6b. Variabel 1 berhubungan

    Linear dengan variabel 2 linear dengan variabel 2

    ( korelasi positif ). ( korelasi negatif ).

    Gambar 7a. Variabel 1 berhubungan Gambar 7b. Variabel 1 berhubungan

    Tidak Linear (kuadrat ) tidak linear (kuadrat)

    dengan variabel 2. dengan variabel 2.

    17

  • 7/30/2019 Dasar+Statistik

    18/20

    Gambar 8. Tidak ada hubungan antara

    variabel 1 dengan variabel 2.

    KORELASI PEARSON

    Jika scater plot korelasi yang didapat lebih bersifat kualitatif, maka untuk

    mendapatkan gambaran kuantitatifnya.

    Salah satu metoda untuk menganalisis tingkat hubungan antara 2 variabel,iyalah korelasi Pearson, yang formulanya :

    .. 14.

    r = korelasi Pearson

    n = jumlah data

    Xi = variabel pertama ke i

    Yi = variabel kedua ke i

    18

  • 7/30/2019 Dasar+Statistik

    19/20

    Nilai r adalah berkisar antara -1 hingga +1, tingkat kuat / tidaknya hubungan

    antara dua variabel dapat dilihat dari besarnya nilai r tanpa melihat tandanya ,

    sbb :

    r= 0 .. tidak ada hubungan v lemah

    . v

    . v

    r= 0,5 .. ada hubungan sedang v makin kuat

    . v

    . v

    r= 1,0 .hubungan sempurna v kuat

    Sifat hubungan ditentukan oleh tanda r, sbb :

    r negatif ( > 0 ) , berarti hubungan terbalik : jika Y naik X turun , dan jika

    Y turun X naik.

    r positif ( > 0 ) , berarti hubungan sebanding : jika Y naik X naik , dan jika

    jika Y turun X turun.

    19

  • 7/30/2019 Dasar+Statistik

    20/20

    Daftar Pustaka :

    1. Anto Dajan ( 1986 ). Pengantar Metode Statistik, Jilid I. LP3ES, Jakarta.

    2. Allen L. Edwards ( 1966 ). Statistical Methods for the Behavioral Sciences. Holt,Rinehart and Winston, New York.

    3. Albert E. Waugh ( 1952 ). Element of Statistical Method, third edition.

    McGraw Hill Book Company, New York.

    4. David G. Kleinbaum, Lawrence L. Kupper ( 1978 ) . Applied Regression Analysis and

    Other Multivariate Method, Duxbury Press, Massachusetts.

    5. Frederick K. Lutgens , Edward J. Tarbuck ( 1998 ). The Atmosphere : An

    Introduction to Meteorology. Prenticed - Hall, Inc. Upper Saddle River, New Jersey

    07458.

    6. Takahashi , Syunji., 2002. : Statistical Methode for Long Range Forecast,

    Climate Prediction Division, Japan Meteorological Agency, Bahan Presentasi pada :

    Workshop on Climate System Monitoring, Diagnosis and Prediction in the Asia-

    Pacifik Region., Tokyo.

    7. Takano, Kiyoharu., 2002. : Probabilistic Forecast,

    Climate Prediction Division, Japan Meteorological Agency, Bahan Presentasi pada :

    Workshop on Climate System Monitoring, Diagnosis and Prediction in the Asia-

    Pacifik., Region, Tokyo.

    8. Tomoaki, Ose., 2002. : Dynamical Longe Range Forecast,

    Climate Prediction Division, Japan Meteorological Agency, Bahan Presentasi pada :

    Workshop on Climate System Monitoring, Diagnosis and Prediction in the Asia

    Pacifik Region, Tokyo.

    9. Wilks, Daniel.S., 1995 : Statistical Methods in the Atmospheric Sciences,

    Academic Press, San Diego.

    20