İstatistik ve olasılık ders notları

Upload: ender-bueken

Post on 12-Jul-2015

2.268 views

Category:

Documents


11 download

TRANSCRIPT

I. STATSTK VE OLASILIKDo. Dr. rfan Yolcubal Kocaeli niversitesi Jeoloji Mh. Blm

Ders KitabStatistical analysis of Geological data (Koch G. S., ve Link, R. F., 1980. Dover Publications) A data-based approach to statistics (Iman, R. L., 1994) Basic statistics for Business and Economics (Lind, D. A., and Mason, R. D., 1997) statistik Analiz Metotlar (Prof. Dr. Bilge Aloba)

1

DEERLENDRMEDevam zorunlu (% 70) 2 Snav (Ara vize + Final) dev Grup almas OK dev kopyalamak yasak

DERS PROGRAMIData toplama ve sunum ekilleri rnek vs. Poplasyon kavramlar Data toplama teknikleri Data sunum ekilleri Pasta diyagramlar Histogramlar Bar grafikler Kmlatif rlatif sklk grafikleri Dalm grafikleri (X-Y)

Datalarn DeerlendirilmesiTarifsel istatistik Analitik ve analitik olmayan ortalamalar standart sapma, varyans, standart hata, gvenilirlik aral vb

2

DERS PROGRAMI devamOlaslk ve Olaslk dalmlar (Probability density functions) Binom Logaritmik Normal Poisson

Tahmin ve Hipotez testi t-test z-testi Varyans analizi (ANOVA)

Korelasyon ve Regresyon Linear regresyon Jeolojide rnekleme ve jeolojik datalardaki deikenlik

STATSTK NEDR?statistik ksaca, data analizini kapsayan matematik biliminin alt bir daldr. Datalarn toplanmas, derlenmesi, zetlenmesi,sunumu, analizi ve ayn zamanda verilerden geerli bir sonu karlmas istatistik dalnn balca ilgi alanlardr.

3

STATSTN UYGULAMA ALANIstatistiksel metotlar, Jeolojide olduu gibi, modern yaamn byk bir alannda da, datalarn deerlendirilmesinde ve analizinde yaygn bir ekilde kullanlmaktadr.Japon rnlerini dnyada popler yapan kalite-kontrol tekniklerinin uygulanmasnda Ozon tabakasndaki incelmenin tahmininde Nfus saymnda TOP 40 hit listesinin belirlenmesinde Hava tahminlerinde TV reytinglerin belirlenmesinde Kiisel bilgisayarnzdaki paralarn performanslarnn gelitirilmesinde Seim tahminlerinde Risk analizinde Ve daha bir ok alanda

STATSTK TRLERTarifsel (Descriptive) istatistik: nmerik verileri derlemek, dzenlemek, ve zetlemek iin kullanlan prosedrler Tmevarmsal (Inferential) istatistik: rneklemeye dayanarak bir poplasyon hakknda bilgi elde etmek iin kullanlan metotlar

4

DATALARIN TOPLANMASI: Kavramlarrnek (Sample) : nceleme yaplan poplasyonun bir blm Poplasyon: Hakknda bilgi edinilmeye allan birimlerin ( kiiler, nesneler, deneysel sonular, vb. gibi) toplamn oluturmakta.

Deiken TrleriKantitatif (Quantitative) Deiken:Saysal lekte ifade edilir. Miktar hakknda bilgi verir. Hesabnzdaki bakiye, pilin mr, snftaki rencilerin says vb.

Kualitatif (Qualitative)Deiken :Nmerik olmayan deikenlerdir. Doum yeri, gz rengi, rk, vb

5

Deikenlerin Snflandrlmas

DATA TOPLANMASIrneklemeye gemeden nce inceleme yaplan poplasyonun iyi bir ekilde belirlenmesi gerekmektedir. Uygun rnekleme teknii ve protokol: Toplanan rneklerin incelenen poplasyonu tam anlamyla yanstmas gerekmektedir.

6

DATA TOPLANMASITm poplasyonu incelemek (Saym) yerine neden rneklemeyi kullanyoruz?Dk maliyet Zaman Dikkatlice alnm rnekler baz durumlarda bir saymdan daha doru bilgi verebilir. Baz durumlarda imkansz olabilir. rnlerin yok edilerek test ediliinden rnekleme tek bana yeterli olabilir.

RNEKLEME PLANININ AMAIYksek kalite: Toplanan verilerin doruluk derecesi Savunabilirlik: Plann geerlilii ile ilgili dokmantasyonun mevcut olmas Tekrarlanabilirlik: rnekleme plann takip ederek verilerin tekrar retilebilmesi Temsil edici olmas: ncelenen poplasyonu tamamyla temsil etmesi Faydal olmas: Toplanan veriler plann amacna ulamasnda kullanlabilir olmas

7

RNEKLEME PLANIrnekleme plannn hazrlannda rneklerin nerede ve ne zaman alnacana karar vermek gerekmektedir. rneklerin says, lokasyonu, ve zaman rnekleme btesini amadan istatistiksel olarak geerli bir rnek almaya yeterli olmaldr. Bunu salamak iin uygun bir rnekleme stratejisi belirlemek gerekmektedir.

RNEKLEME EKLLERRasgele (Random): Her rnein ayn saydaki gzlemde eit olaslkla olarak seilebilmesi Sistematik: Karara dayal (Judgemental):

8

RNEKLEME EKLLERNE BR RNEK

Karara dayal

Rasgele

Sistematik

rnekleme Hatas (Sampling Error)statistiksel anlamda hatadan ziyade rneklerin birbirlerinden olan doal deikenliklerini temsil etmektedir. Tm toplanan rneklerde bir tane ortak zellik bulunmakta: rneklerin hibirisinin tamamyla tm poplasyonu temsil etmemesi Dolaysyla, rneklemeye dayal tahminler ile poplasyonun gerek karakteristii arasnda daima farkllk olacaktr.

9

VER GRAFKLEME TRLERPasta diyagramlar (Pie Charts) Bar grafikler Histogramlar Kartezyen (X-Y) grafikleri Frekans Dalm grafikleri

Pasta DiyagramlarFarkl yada kantitatif datalarn oran yada yzde ekilde sunulmasnda kullanlr.

10

BAR GRAFKLER

Dey bar grafikleri:niversite mezunu erkek ve bayanlarn ya gruplarna gre gelir dalmn gsteren bar grafiklerine bir rnek

11

X-Y GRAFKLER

II. VERLERN ORGANZE EDLMES VE SUNULMASI

12

TasnifBir kitlenin veya grubun zelliklerine gre yapsn ortaya karabilmek amacyla, elde edilen bilgileri bir vasf veya vasflar bakmndan eitli klara ayrarak ayn kk ait birimleri kmeler halinde bir araya getirme ilemine denir. Veri saysnn snrl olduu durumlarda uygulanabilir.

Tasnife rnek: 100 kiilik bir snftaki rencileri ya vasfna gre tasnif edersek

13

GruplamaEer tasnif edilecek veri says ok fazla ise bunlar tasnif yoluyla kmelere ayrmak mmkn olsa bile anlaml ve ilemlere elverili olmayabilir. Byle durumlarda bir vasfn birbirine yakn olan klarn gruplar halinde toplamaya, yani gruplamaya bavurulabilir.

Gruplamaya rnek: Dnyadaki 29 en byk ehir nfus itibariyle gruplanarak bir frekans dalm veya blnmesi eklinde ifade edilebilir.

14

Gruplamaya rnek:(Hatal) Bir endstri dalnda faaliyet gsteren iletmelerde altrlan ii saysna gre gruplamak istersek

FREKANS DAILIMLARI YADA BLNMELER (Frequency Distributions) Verilerin her bir snf aralna den gzlem saysn(frekans) gsterecek ekilde gruplandrlmas ilemi.

15

Snf aral, Snf snrlar, snf orta noktas kavramlarSnf aral: Snfn alt ve st snrlar arasndaki fark Snf snrlar:Snfa ait minimum ve maksimum snr deerleri Snf orta noktas veya noktas: Snfn alt ve st snrlarn ortalamas

Frekans Dalmnn oluturulmas rnek: Bir tatn yl iindeki sat fiyatlarnn organize edilmemi hali: Ham data

16

Snf Saysnn Belirlenmesi

Snf Aralnn Belirlenmesi

17

FREKANS DAILIM TABLOSU:

FREKANS DAILIM GRAFG (HSTOGRAM)

18

FREKANS DAILIMLARININ OLUTURULMASINDA DKKAT EDLEEK HUSUSLARFrekans dalmlarnn oluturulmasnda mmkn olduu kadar eit snf aralklar seilmeli Eit olmayan snf aralklar frekans dalmlar grafik edilirken sorun yaratabilirler. Fakat baz durumlarda (ok sayda bo snf oluturmaktan kanmak iin) eit olmayan snf aralkl frekans dalmlarnn oluturulmasnda kullanlabilir.

Uygun olarak seilmemi snf saysna gre oluturulmu frekans dalmlar, verinin frekans dalm hakknda faydal bilgiler sunmayabilir. rnek:

19

Nispi frekans dalmlar (relative frequency distributions)Bir ok durumda bir snfn mutlak frekansndan ok toplam iindeki nispi frekansn bilmek gerekmektedir. Snfn nispi frekans, o snfn frekansnn toplam frekansa orandr.

20

Nispi frekans dalm

21

KMLATF FREKANS DAILIMLARIKmlatif frekans dalmlarnn en nemli zellikleri belirli bir dzeyin altnda veya stnde bulunan birimlerin frekansn gsterebilmeleridir. Kmlatif frekans dalmlar snf aralklar farkl serilerin kyaslanmasn kolaylatrr. Kyaslamann salkl olabilmesi iin nceden mutlak frekanslarn nispi frekanslara evrilmesi gerekir.

Kmlatif frekans dalmlarnn oluturulmas: rnek:Bir snftaki rencilerin boy uzunluklarnn frekans dalmlar

22

Kmlatif Frekans Dalmlar

23

FREKANS POLGONLARIBu grafiklerde snf aral yerine snf orta noktasnn snf frekansna gre dalm izgisel olarak grafiklenir. Frekans poligonlarnn histogramlara gre bir avantaj 2 veya daha fazla frekans dalm grafiinin kolaylkla birbirleri ile karlatrlmasna imkan tanmasdr ( Frekans dalmlarnn snf says ve aral ayn olmak koulu ile)

24

II. Merkezi Eilim lleriDo. Dr. rfan Yolcubal Kocaeli niv. Jeoloji Mh. Bl.

Analitik OrtalamalarBir rneklemede tm veri deerlerini dikkate alan merkezi eilim lleridir.Aritmetik ortalama Arlkl ortalama Geometrik ortalama Harmonik ortalama

1

Aritmetik Ortalama (Aritmetic mean)Gruplanmam yani ham veriler iin aritmetik ortalama, tm veri deerlerinin toplamnn toplam veri saysna orandr.

X =

Xi =1

n

N

=

X 1 + X 2 + X 3 + ....... X n N

X : Aritmetik ortalamaN: Toplam veri says X: veri deeri

Tekrarlanan gzlemlerin veri deerlerinin hesabBir rnekte gzlem deerleri bir ok kez tekrarlanabilir. rnein, 20 kiilik bir snfta istatistik dersinden geen rencilerin notu u ekilde sralanmaktadr: 5, 5, 5, 5, 5, 6, 6, 6, 7, 7, 8, 8, 8, 9, 9, 9, 10, 10, 10, 10 Bu snfn istatistik dersinin aritmetik ortalamas nedir?

X = n =

1 n

fi

k

i =1

fi X

i

k

i =1

fi: bir rnekteki Xi`nin frekans k: rnekteki gzlem says Xi: i.gzlem deeri n=toplam veri says

X =

( 5 * 5 ) + ( 3 * 6 ) + ( 2 * 7 ) + ( 3 * 8 ) + ( 3 * 9 ) + ( 4 * 10 ) = 7 .4 20

2

Aritmetik Ortalamann zellikleriBir serideki her bir veri deerinin aritmetik ortalamadan olan sapmalarnn toplam daima sfrdr.

( X X ) = 0rnek: 3, 8, ve 4 deerlerin aritmetik ortalamas 5`dir.

( X X ) = (3 5) + (8 5) + (4 5) = 2 + 3 1 = 0Aritmetik ortalamann hesaplannda veri setindeki tm veri deerleri kullanlr. Bir veri setinin yalnzca bir aritmetik ortalamas vardr.

Aritmetik Ortalamann DezavantajAritmetik ortalamann dezavantaj, veri setindeki ar deerlerden kolay etkilenmesidir. Bir veri setindeki verilerden bir ka ok yksek yada dk deerler ieriyor ise, aritmetik ortalama, veri setinin merkezi eilim lmn temsil etmek iin uygun olmayabilir. rnek: 5 rencinin bir snavda alm olduu notlar 70, 70, 70, 70, ve 100`dir. Aritmetik ortalama 76 olacaktr. Bu aritmetik ortalama veri setinin iyi bir ekilde temsil etmemektedir.

Ak snf aralkl frekans dalm tablolarnda aritmetik ortalama uygun deildir.

3

Arlkl Ortalama(Weighted Mean)Aritmetik ortalamada, her bir veri deerinin neminin eit olduu varsaylmaktadr. Fakat baz deerlerin nemi dierlerinden farkl olabilir. Bu durumlarda arlkl ortalama kullanlr.

X

W

=

X 1W 1 + X 2W 2 + X 3W 3 + ........ + X n W n W 1 + W 2 + W 3 + .......... + W n X =

Wi =1 n i =1

n

i

X

i

W

W

W: Her bir veri deerinin arln yani nemini ifade etmektir. X W : Arlkl ortalama

Arlkl Ortalama`ya rnekBir renci matematik dersinden 6, edebiyat dersinden 7, mzik dersinden 10 ve ngilizce dersinden 9 almtr. Bu rencinin ders ortalamasn hesaplayalm. Ders kredileri: Matematik:3, edebiyat: 2, mzik:1, ngilizce: 1

XW =

(6 * 3) + (7 * 2) + (9 *1) + (10 *1) 51 = = 7.3 3 + 2 +1+1 7

X=

6 + 7 + 9 + 10 =8 4

4

Arlkl Ortalama: rnek 2Sarar normal perakende sat fiyat zerinden ($400) 95 adet Kl marka takm elbiseyi satmtr. Bahar indiriminde ayn takm elbiseyi 200 dolara indirerek 126 adet, en son indirimde de 100 dolara 79 adet takm elbise satmtr. Sarar takm elbisesinin arlkl ortalama fiyat nedir? Sarar her bir takm elbiseye birim fiyat olarak $200 demitir. Sararn bu sattaki toplam kazanc ne kadardr?

rnek 2

X X

W

=

W

( 95 * 400 ) + ( 126 * 200 ) + ( 79 * 100 ) 95 + 126 + 79 71100 = = $ 237 300 = $ 37 = $ 12100

Birim Kazan : 237 200 Toplam Kazan : 37 * 300

5

Geometrik Ortalama (Geometric Mean) Geometrik ortalama iktisat ve iletme alanlarnda yaygn olarak kullanlan bir ortalama trdr. Geometrik ortalama zellikle 1) deiim oranlarnn (yzde, oran, vb.) ortalamasnn hesaplanmasnda 2) bir zaman aral ierisindeki bir retimin yada satn art miktarnn ortalamasnn belirlenmesinde yaygn olarak kullanlmaktadr.

G .O . =

n

( X 1 )( X 2 )( X 3 ).......( X n )

Not: Eer veri deerlerinden bir 0 yada negatif deerlikli ise Geometrik ortalama hesaplanamaz.

log G .O . =

1 n

log X

i

Veri says ok olduu durumlarda hesaplar kolaylatrmak amacyla logaritmalardan yararlanlmaktadr.

Geometrik Ortalama: rnek 1Bir inaat irketinin drt projedeki ortalama kr yzdeleri 3, 2, 4, Ve 6`dr. Bu irketin ortalama kr nedir?G .O . = 4 3 * 2 * 4 * 6 = 4 144 = % 3 .46 X = 3+ 2+ 4+6 = % 3 .75 4

Geometrik ortalama daha tutucu bir kar deeri vermektedir. nk ar deerlerden aritmetik ortalamaya gre o kadar fazla etkilenmemektedir. Bu nedenle geometrik ortalama ya aritmetik ortalamaya eit olacaktr yada kk olacaktr.

6

Geometrik Ortalama: rnek 2Trkiye'nin nfusu 1990 ylnda 50.7 milyondan 1995 ylnda 56.5 milyona ykselmitir. Bu 5 yl iinde nfusun ortalama art hz ne olmutur?

G.O. = n 1

bir periyotun sonundaki deger 1 bir periyotun baslangicindeki deger

n : periyot araligi

G .O . =

5 1

56 . 5 1 = 50 . 7

4

1 . 11 1 = % 2 . 47

Harmonik Ortalama(Harmonic mean)

Baz zel durumlarda bavurulan bir ortalama olup hz, fiyat, verimlilik gibi oransal olarak belirtilebilen baz deiken deerlerin ortalamalarnn hesaplannda kullanlr.H = N = 1 1 1 1 + + + .... + X1 X2 X3 Xn N

1 Xi

Deikenlerden birinin sabit, dierinin ise deiken olduu durumlarda bavurulan bir ortalamadr. Veri deerlerinde sfr bulunmas yada veri deerlerinin farkl iaret tamalar durumunda harmonik ortalama kullanlmaz.

7

Harmonik Ortalama: rnekki kasaba arasndaki mesafe gidite saatte 75 km. hzla, dnte ise 50 km hzla kat edilmektedir. Bu durumda ortalama hz nedir? ki kasaba arasndaki mesafe 150 km varsaylr ise gidi iin gerekli sre 150/75: 2 saat, dn iin ise 150/50: 3 saat Burada mesafe unsuru sabit fakat zaman unsuru ise sabit olmadndan harmonik ortalama kullanlmtr.

H =

2 1 1 + 75 50

= 60 km

X=

75 + 50 = 62.5km 2

ANALTK OLMAYAN MERKEZ ELM LLER

Bir rnekteki btn veri deerlerini dikkate almayan merkezi eilim lleridir. Medyan (Median) Mod (Mode)

8

Medyan (Ortanca)Baz durumlarda rnein bir yada iki tane ok yksek yada dk deerler ierebileceinden bahsetmitik. Bu gibi durumlarda aritmetik ortalama rnein merkezi eilimini yanstmaz. Byle problemlerde medyan deeri kullanlarak rnein merkezi eilimi llebilir.Veri deerleri bykten ke yada kkten bye sralandktan sonra, tam ortadaki yani veri dizisini 2 eit frekansa ayran deerdir. Dzenlenmemi verilerde medyan`n yerini kolaylkla tespit etmek iin aadaki formlden yararlanlabilir.

medyan degerinin yeri = n = toplam veri sayisi

n +1 2

Medyan: rnek1

Bir klinikte pansuman iin denen miktarlar aadaki gibi sralanmaktadr: 65, 29, 30, 25, 32, 35 TL. Medyan fiyat nedir? 25 29 30 Medyan : (30+32)/2= 31 TL. 32 35 65

9

Medyan: rnek 2

Yuvack Kalc konutlarndaki kira fiyatlar aadaki gibi sralanmaktadr: 120,100, 110, 115, 125, 105, 70 TL. Ortalama kira fiyat nedir.

Medyan: rnek 2

70 100 105 110 115 120 125

Medyan

10

Medyann zellikleri

Her bir veri setinin tek bir medyan vardr. Veri setindeki ar deerlerden etkilenmedii iin verilerin merkezi eiliminin belirlenmesinde aritmetik ortalamaya nazaran daha doru bir bilgi sunar. Aritmetik ortalamann aksine ak snf aralkl frekans dalmlarnn merkezi eiliminin lmnde kullanlabilirler.

ModBir veri setindeki btn deerleri dikkate almayan (hassas olmayan) bir baka merkezi eilim lmdr. Mod, bir data setinde en sk olarak gzlenen veri deeridir.

11

Mod: rnekler

4, 6. 5, 8, 7, 10, 9, 11

Mod ?

4, 6, 5, 4, 7, 5.5, 4, 6.5, 7, 8, 4, 6, 4, 5, 4, 4 Mod ? 4, 6, 4, 5, 6, 5, 6, 6, 5, 6, 5, 5 Mod ?

Gruplanm Verilerde Aritmetik Ortalama, Medyan, Mod

Baz durumlarda veri deerleri gruplandrlp, frekans dalmlar oluturulmu olabilir ve ham veriler mevcut bulunmayabilir. Bu gibi durumlarda aritmetik ortalama, medyan ve mod frekans dalm tablolarndan hesaplanabilir. Bu deerler gerek ham verilerden hesaplanan deerlerden farkl olabilir.

12

Aritmetik Ortalamann Frekans Dalmndan Hesaplan

X=

fXN

X: her bir snfn orta noktas f: her bir snf frekans N: Toplam veri says yada frekanslarn toplam deeri

rnekNet geliri (milyon $) 2-5 5-8 8-11 11-14 14-17 thalat says 1 4 10 3 2

Net gelirin aritmetik ortalamasn hesaplaynz?

13

Net geliri (milyon $) 2-5 5-8 8-11 11-14 14-17 Toplam

thalat says (f) 1 4 10 3 2 20

Snf orta noktas (X) 3.5 6.5 9.5 12.5 15.5

fX 3.5 26 95 37.5 31 193

X=

fXN

=

193 = 9.65 20

Frekans Dalmndan Medyann Hesaplan

N CF Medyan = L + 2 (i ) fL: Medyan snfn alt snr N: Toplam frekans deeri CF: Medyan snfndan nceki snflarn frekanslarnn toplam f: medyan snfnn frekans i: medyan snfnn aral

14

Net geliri (milyon $) 2-5 5-8 8-11 11-14 14-17 Toplam

thalat says (f) 1 4 10 3 2 20

Snf orta noktas (X) 3.5 6.5 9.5 12.5 15.5

CF 1 5 15 18 20

20 5 medyan = 8000000+ 2 (3000000) 10 medyan = 9500000

Frekans Dalmndan Modun Hesaplan

Frekans dalm eklinde gruplanm veriler iin mod, frekans says en fazla olan snfn orta noktas deeridir. Eer frekans dalmnda 2 snf maksimum frekansa sahip ise bu tr dalmlara bimodal dalmlar denilmektedir.

15

Bir rnn sat fiyatn gruplandrlm ekli.

Net sat ($ dolar) 1-4 4-7 7-10 10-13 13 ve daha fazlas

Toplam yzdesi 13 14 40 23 10

Net satn medyan ve modu hesaplaynz? Bu tr tablolara ne ad verilmektedir.

Bir Frekans Dalm Grafiinde Aritmetik ortalama, medyan, mod arasndaki iliki

Aritmetik ortalama= mod=medyan Simetrik frekans dalm erileri

16

Bir Frekans Dalm Grafiinde Aritmetik ortalama, medyan, mod arasndaki iliki

Mod X Med Asimetrisi negatif olan Frekans dalmlar(sola arpk)

X Med Asimetrisi pozitif olan frekans Dalmlar(saa arpk)

Mod

Tek modlu ve asimetrileri ok fazla olmayan veriler iin Aadaki iliki kullanlabilir. Aritmetik ortalama-Mod= 3(Aritmetik Ort-Medyan)

17

III. DAILMA YADA DEKENLK LLER (MEASURE OF DISPERSION)

Do. Dr. rfan Yolcubal Kocaeli niv. Jeoloji Mh. Bl.

Dalma (deikenlik) llerinin analizinin nedeniBir veri setinin merkezi eilim lsnn deerlendirilmesi 2 veya daha fazla veri setinin dalmnn karlatrlmas

1

Dalma yada deikenlik lleriDeikenlik aral (Range) Ortalama sapma (mean deviation) Varyans (Variance) Standard sapma (Standard deviation)

Gruplanmam verilerde dalmn lmDeikenlik aral (Range): Bir veri serisindeki en yksek deer ile en dk deer arasndaki farka eittir.R= Maksimum deer- Minimum deer

2

Deikenlik aral (Range)Seri 1 2 3 6 7 8 10 Seri 2 5 5 5 6 7 8

X=6R=10-2=8

X=6R=8-5=3

Gruplanm verilerde deikenlik aralnn(Range) belirlenmesiSaatlik cret(lira) Frekans

5-10 10-15 15-20 20-25

10 21 9 5

R= 25-5=20 TL

3

Ortalama yada Mutlak Ortalama Sapma (Mean Deviation or Mean Absolute Deviation)

Bir poplasyondaki tm veri deerlerinin poplasyonun aritmetik ortalamasndan olan mutlak sapmalarnn aritmetik ortalamasdr.

O.S . =

X X N

X X = mutlak sapma

Ortalama Sapma (Gruplanmam Verilerde)15, 16, 18, 21, 25 deerlerinden meydana gelmi serinin ortalama sapmasn hesaplayalm. Veriler 15 16 18 21 25X X X X

15-19 16-19 18-19 21-19 25-19 TOPLAM

4 3 1 2 6 16

O. S . =

16 = 3.2 5

4

Ortalama sapma (Gruplanm Verilerde)Snf frekans (f) 7 14 16 9 5 51 Snf orta noktas (X) 15 25 35 45 55

fx105 350 560 405 275 1695

X X15-33.2 25-33.2 35-33.2 45-33.2 55-33.2

X X f X X18.2 8.2 1.8 11.8 21.8 127.4 114.8 28.8 106.2 109 486.2

10-20 20-30 30-40 40-50 50-60 Toplam

X=

fX = 1695 = 33.2N 51

O. S . =

f

X X 486.2 = = 9.53 51 N

Varyans (Variance) ve Standart sapma (Standard deviation)Varyans, bir veri setindeki tm veri deerlerinin, ortalamadan olan sapmalarn karesinin aritmetik ortalamasdr.

2

X X = NPoplasyona ait

(

)

2

2 =

X X N 1

(

)

2

rneklemeye ait

5

Standart SapmaBir veri setinin varyansnn karekkne eittir.

=

X X N

(

)

2

X X = N 1

(

)

2

Poplasyona ait

rneklemeye ait

Standart sapma ve varyansn zellikleriBir serideki deerlere bir sabitin (ann) eklenmesi veya bu deerlerden bir sabitin karlmas ile serinin varyans ve standart sapmas deimez.

2 ( X a) = 2 ( X ) 2 ( X + a) = 2 ( X )

Bir serideki deerlerin her birinin belirli bir sabit ( c ) ile arplmas sonucu meydana kan serinin varyans, orijinal serinin varyansnn sabitin karesi ile arpmna eittir. Ancak standart sapmas, orijinal serinin standart sapmasnn sabitin kendisi ile arpmna eit olmaktadr.

2 (cX ) = c 2 2 ( X ) ( cX ) = c ( X )

6

Standart Sapma ve Varyans (Gruplanmam verilerde) 22, 25, 28, 30, ve 35 deerlerinden oluan poplasyonun varyans ve standart sapmasn hesaplayalm.

X 22 25 28 30 35

(X X)

( X X )2

X=

-6 -3 0 2 7X) = 0

36 9 0 4 49

140 = 28 5

X = 140 ( X

(X

98 = = 196 . 5 = 196 = 443 . .2

X ) 2 = 98

Standard Sapma ve Varyans Hesab (Gruplanm verilerde)- Poplasyon rneisnflar frekans (f) Snf orta noktas (X) fX2 (X X) (X X)

f ( X X )2

0-200 200-400 400-600 600-800 Toplam 32

8 11 7 6

100 300 500 700

800 3300 3500 4200 11800

-270 -70 130 330

72900 4900 16900 108900

583200 53900 118300 653400 1408800

X=

11800 1408800 = 370 2 = = 44025 32 32

= 44025 = 20982 .7

Gruplanm verilerin varyans ve standart sapmasSnflandrlm verilerde, snf orta noktas her zaman bu ksmn arlkl orta noktas olmayacandan, ham verilere gre gruplandrlm deerlerde daha yksek varyans deeri bulunur. Bunu nlemek iin Sheppard dzeltmesi yaplr.

Sh=c2/12 c=snf aral Sh=sheppard dzeltmesi Dzeltilmi varyans = 2-Sh

VaryansTek bir veri seti iin varyans deerinin yorumlanmas zordur. Deikenlik aral ve ortalama sapmada olduu gibi varyans, 2 veya daha fazla data setindeki verilerin deikinlik derecelerin karlatrlmasnda kullanlr.

8

Simetrik frekans dalm grafiklerinde standart sapma ve aritmetik ortalama arasndaki iliki

-3 -2 -1 X 1 2 3 %68 %95 %99.7

X 1

X 2X 3

Nisbi Dalma(Relative Dispersion)Deiim katsays (Coefficient of variation): % olarak ifade edilir. Bir data setinin standart sapmasnn aritmetik ortalamasna orandr.

Degisim Katsayisi(%) =

X

*100

Birimleri farkl olan farkl 2 data setinin kyaslanmasnda (cm, TL) Birimleri ayn fakat ortalamalar birbirinden ok farkl olan data setlerin kyaslanmasnda deiim katsays kullanlr.

X = 500000, = 50000 X = 12000, = 2000

50000 * 100 = 10% 500000 2000 Degisim katsayisi = * 100 = 16.7% 12000 Degisim katsayisi =

9

Gruplanmam verilerde arpklkFrekans dalm grafiklerinin arpklk derecesini tarif etmektedir.

(x x) k =i

3

n 3

arplk genellikle 3 ile +3 deerleri arasnda deimektedir.

Simetrik arpklk=0

Pozitif arpklk

Negatif arpklk

Gruplanm verilerde arpklk

k =

fi xi x fi 3

(

)

3

Carpiklik =

3(X medyan)

eklinde de hesaplanabilir.

10

Gruplanmam verilerde Kurtosis (Basklk-Sivrilik)Frekans dalm erisinin yksekliini belirten bir parametre.

(x x) Kur =i

4

Ham verilerde Gruplanm verilerde

ni

4

f (x x) Kur = fi 4 i

4

Kur=3 (mesokurtik, yada normal dalm) Kur>3 (Leptokurtik, sivri-orta ksmlar u ksmlara gre daha yi boylanm yada sivrilemi can erisi Kur