İstatİstİksel verİlerİn toplanmasi ve dÜzenlenmesİ · yasemİn 73 esma 86 fatma 93 ......

29
2.SUNUM

Upload: others

Post on 24-Apr-2021

9 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: İSTATİSTİKSEL VERİLERİN TOPLANMASI VE DÜZENLENMESİ · YASEMİN 73 ESMA 86 FATMA 93 ... seçilmemesine ve hesaplama iùlemlerinin kolaylığı için büyük seçilmemesine dikkat

2.SUNUM

Page 2: İSTATİSTİKSEL VERİLERİN TOPLANMASI VE DÜZENLENMESİ · YASEMİN 73 ESMA 86 FATMA 93 ... seçilmemesine ve hesaplama iùlemlerinin kolaylığı için büyük seçilmemesine dikkat

Belirli bir amaç için toplanmış verileri anlamlı haline getirmenin farklı yolları vardır.

Verileri sözel ifadelerle açıklama

Verileri tablolar halinde düzenleme

Verileri grafiklerle gösterme

Veriler üzerinde hesaplamalar yaparak istatistiksel ölçüler (ortalama gibi) elde etme

9/20/2017 2 Yrd. Doç. Dr. Sedat Şen

Page 3: İSTATİSTİKSEL VERİLERİN TOPLANMASI VE DÜZENLENMESİ · YASEMİN 73 ESMA 86 FATMA 93 ... seçilmemesine ve hesaplama iùlemlerinin kolaylığı için büyük seçilmemesine dikkat

Veriler üzerinde her zaman ilk yapılacak işlem veri değerlerini sıraya dizmektir. Bu sıralama işlemi büyükten küçüğe olabileceği gibi küçükten büyüğe olacak şekilde de yapılabilir.

Üzerinde herhangi bir işlem yapılmamış veriye ham veri denir.

9/20/2017 3 Yrd. Doç. Dr. Sedat Şen

Page 4: İSTATİSTİKSEL VERİLERİN TOPLANMASI VE DÜZENLENMESİ · YASEMİN 73 ESMA 86 FATMA 93 ... seçilmemesine ve hesaplama iùlemlerinin kolaylığı için büyük seçilmemesine dikkat

ÖĞRENCİ PUAN ÖĞRENCİ PUAN ÖĞRENCİ PUAN

AHMET 42 FATMA 97 NURCAN 98

AHMET 81 GÜLLÜ 86 ÖMER 88

AYBERK 61 HACER 98 RAHİME 93

AYŞE 93 HASAN 75 SAİT 36

AYŞEGÜL 84 HAZARE 79 SALİH 69

BEDİA 80 İMRAN 88 SEDAT 71

BETÜL 84 KEMAL 79 SONGÜL 86

BÜŞRA 93 KÜBRA 93 TUBA 93

CUMA 81 MEDİNE 79 TUBA 95

ELİF 87 MEHMET 52 ÜMRAN 87

ESMA 86 MEHMET 69 YASEMİN 73

FATMA 91 MEHMET 84 ZEYNEP 77

FATMA 93 MERVE 85 ZEYNEP 86

Yrd. Doç. Dr. Sedat Şen 4

Hiçbir şekilde işlenmemiş üzerinde herhangi bir işlem yapılmamış puanlardan oluşan veriye ham veri denir.

9/20/2017

Page 5: İSTATİSTİKSEL VERİLERİN TOPLANMASI VE DÜZENLENMESİ · YASEMİN 73 ESMA 86 FATMA 93 ... seçilmemesine ve hesaplama iùlemlerinin kolaylığı için büyük seçilmemesine dikkat

İlgilenilen değişkenin almış olduğu değerlerin küçükten büyüğe veya büyükten küçüğe sıralanmasıyla oluşan seriye “basit seri” denir.

Ancak, gözlem sayısının çok fazla olduğu basit seri ile hangi değer çevresinde

yığılma olduğunu görmek zordur. Bu nedenle, basit serinin frekans veya gruplandırılmış seriye dönüştürülmesi daha yararlı olabilir.

9/20/2017 5 Yrd. Doç. Dr. Sedat Şen

Page 6: İSTATİSTİKSEL VERİLERİN TOPLANMASI VE DÜZENLENMESİ · YASEMİN 73 ESMA 86 FATMA 93 ... seçilmemesine ve hesaplama iùlemlerinin kolaylığı için büyük seçilmemesine dikkat

Verilerin düzenlenmesi, puanların büyükten küçüğe ya da küçükten büyüğe doğru

sıralanması yoluyla yapılır. Puanlar sıralandıktan

sonra puan dizisinin üst ve alt sınırları rahatça belirlenir.

Puanlar 36 ile 98 arasında değişiklik göstermekte ve bazı puanlar birden fazla

gözlenmektedir.

Yrd. Doç. Dr. Sedat Şen

ÖĞRENCİ PUAN ÖĞRENCİ PUAN ÖĞRENCİ PUAN

SAİT 36 BEDİA 80 ÖMER 88

AHMET 42 AHMET 81 İMRAN 88

MEHMET 52 CUMA 81 FATMA 91

AYBERK 61 MEHMET 84 KÜBRA 93

MEHMET 69 BETÜL 84 TUBA 93

SALİH 69 AYŞEGÜL 84 AYŞE 93

SEDAT 71 MERVE 85 RAHİME 93

YASEMİN 73 ESMA 86 FATMA 93

HASAN 75 GÜLLÜ 86 BÜŞRA 93

ZEYNEP 77 ZEYNEP 86 TUBA 95

KEMAL 79 SONGÜL 86 FATMA 97

HAZARE 79 ELİF 87 HACER 98

MEDİNE 79 ÜMRAN 87 NURCAN 98

6 9/20/2017

Page 7: İSTATİSTİKSEL VERİLERİN TOPLANMASI VE DÜZENLENMESİ · YASEMİN 73 ESMA 86 FATMA 93 ... seçilmemesine ve hesaplama iùlemlerinin kolaylığı için büyük seçilmemesine dikkat

Puanlar Frekans Yüzde

36 1 2.56

42 1 2.56

52 1 2.56

61 1 2.56

69 2 5.13

71 1 2.56

73 1 2.56

75 1 2.56

77 1 2.56

79 3 7.69

80 1 2.56

81 2 5.13

84 3 7.69

85 1 2.56

86 4 10.26

87 2 5.13

88 2 5.13

91 1 2.56

93 6 15.38

95 1 2.56

97 1 2.56

98 2 5.13

Yrd. Doç. Dr. Sedat Şen 7 9/20/2017

Page 8: İSTATİSTİKSEL VERİLERİN TOPLANMASI VE DÜZENLENMESİ · YASEMİN 73 ESMA 86 FATMA 93 ... seçilmemesine ve hesaplama iùlemlerinin kolaylığı için büyük seçilmemesine dikkat

İlgilenilen değişkenin almış olduğu farklı değerlerin küçükten büyüğe sıralanması ve bu değerlerin karşıısına kaç kez tekrar ettiğinin (frekansı) yazılmasıyla oluşturulan istatistik serisine “frekans serisi” denir.

9/20/2017 8 Yrd. Doç. Dr. Sedat Şen

Page 9: İSTATİSTİKSEL VERİLERİN TOPLANMASI VE DÜZENLENMESİ · YASEMİN 73 ESMA 86 FATMA 93 ... seçilmemesine ve hesaplama iùlemlerinin kolaylığı için büyük seçilmemesine dikkat

Öğrenci Yaş

Ahmet 20

Ayşe 20

Fatma 22

Mehmet 23

Derya 22

Gökhan 21

Hakan 22

Zeynep 23

Yunus 23

Zehra 23

9/20/2017 9 Yrd. Doç. Dr. Sedat Şen

Page 10: İSTATİSTİKSEL VERİLERİN TOPLANMASI VE DÜZENLENMESİ · YASEMİN 73 ESMA 86 FATMA 93 ... seçilmemesine ve hesaplama iùlemlerinin kolaylığı için büyük seçilmemesine dikkat

Yaş Frekans

20 2

21 1

22 3

23 4

9/20/2017 10 Yrd. Doç. Dr. Sedat Şen

Page 11: İSTATİSTİKSEL VERİLERİN TOPLANMASI VE DÜZENLENMESİ · YASEMİN 73 ESMA 86 FATMA 93 ... seçilmemesine ve hesaplama iùlemlerinin kolaylığı için büyük seçilmemesine dikkat

İlgilenilen değişken değerlerinin, belirlenen sınıflara (aralıklara) ayrılması ve bu sınıflara giren gözlem sayısının ayrı bir sütuna yerleştirilmesiyle oluşan seriye “gruplandırılmış seri” denir.

Frekans serisini, gruplandırılmış seri haline dönüştürürken sınıf aralığı büyüklüğü Sturges Kuralı ya da araştırmacının görüşüne bağlı olarak belirlenir.

Sınıf aralığının keyfî olarak belirlenmesinde göz önüne alınması gereken kriter birbirine yakın gözlem değerlerinin bir araya getirilmesidir. Genellikle, en az 5 en fazla 20 sınıf sayısı önerilir.

9/20/2017 11 Yrd. Doç. Dr. Sedat Şen

Page 12: İSTATİSTİKSEL VERİLERİN TOPLANMASI VE DÜZENLENMESİ · YASEMİN 73 ESMA 86 FATMA 93 ... seçilmemesine ve hesaplama iùlemlerinin kolaylığı için büyük seçilmemesine dikkat

Elde edilen frekans tablosu uzunsa, bundan anlam çıkarmayı ve ilgili istatistiksel işlemleri kolaylaştırmak için, gözlenen ölçümleri teker teker sıralama yerine gruplama adı verilen bir işlem uygulanır. Gruplamanın amacı ardışık ölçümleri bir grup ya da kategoride toplamaktır. Bu sayede hem tabloyu kısaltabiliriz hem de istatistiksel hesaplamaları kolaylaştırabiliriz. Verileri gruplamaya karar verdikten sonra yapılacak ilk iş grup sayısına ve grup aralığına karar vermektir.

9/20/2017 12 Yrd. Doç. Dr. Sedat Şen

Page 13: İSTATİSTİKSEL VERİLERİN TOPLANMASI VE DÜZENLENMESİ · YASEMİN 73 ESMA 86 FATMA 93 ... seçilmemesine ve hesaplama iùlemlerinin kolaylığı için büyük seçilmemesine dikkat

Frekans tablosunda hem puanlar sıralanır, hem de puandan kaç tane olduğu sayılarak frekanslar bulunur. Ancak hem puan dağılımının hem genel durumu daha iyi görebilmek hem de hesaplamaları kolaylaştırmak için verilerin gruplandırılması gerekmektedir.

Verileri gruplandırırken öncelikle grup sayısı saptanır. Grup sayısının puan dağılımının gerçek özelliklerinin kaybolmaması için küçük seçilmemesine ve hesaplama işlemlerinin kolaylığı için büyük seçilmemesine dikkat edilmelidir. Ayrıca grup sayısının tek olması, puan dağılımında simetri sağladığı için, puanların 7,9,11 ve 13 gibi tek sayıda gruba ayrılması tavsiye edilir.

Yrd. Doç. Dr. Sedat Şen 13 9/20/2017

Page 14: İSTATİSTİKSEL VERİLERİN TOPLANMASI VE DÜZENLENMESİ · YASEMİN 73 ESMA 86 FATMA 93 ... seçilmemesine ve hesaplama iùlemlerinin kolaylığı için büyük seçilmemesine dikkat

Veriyi gruplandırma yaparken:

Frekans tablosunun yaklaşık olarak kaç grup ya da kategoriden oluşması istendiği saptanır

Gözlenen en büyük ölçümden en küçük ölçüm çıkarılır.

En büyük ölçümle en küçük ölçüm arasındaki fark grup sayısına bölünür.

9/20/2017 14 Yrd. Doç. Dr. Sedat Şen

Page 15: İSTATİSTİKSEL VERİLERİN TOPLANMASI VE DÜZENLENMESİ · YASEMİN 73 ESMA 86 FATMA 93 ... seçilmemesine ve hesaplama iùlemlerinin kolaylığı için büyük seçilmemesine dikkat

Seçilecek olan aralık katsayısının durumu istatistiksel işlemleri etkiler. Aralık katsayısının çarpma ve bölme gibi işlemleri kullanacaksak kolaylık sağlaması açısından tam sayı olması daha iyidir.

9/20/2017 15 Yrd. Doç. Dr. Sedat Şen

Page 16: İSTATİSTİKSEL VERİLERİN TOPLANMASI VE DÜZENLENMESİ · YASEMİN 73 ESMA 86 FATMA 93 ... seçilmemesine ve hesaplama iùlemlerinin kolaylığı için büyük seçilmemesine dikkat

Puan Aralığı

Çetele Frekans Toplamlı Frekans

36-44 // 2 2

45-53 / 1 3

54-62 / 1 4

63-71 /// 3 7

72-80 /////// 7 14

81-89 ////////////// 14 28

90-98 //////////// 11 39

Yrd. Doç. Dr. Sedat Şen

(98-36)/7=8.9 aralık genişliği olarak hesaplanır. Bu katsayının 9 alınması uygun olur.

16

Puan Dağılımını 7 gruba ayırmak istiyoruz

9/20/2017

Page 17: İSTATİSTİKSEL VERİLERİN TOPLANMASI VE DÜZENLENMESİ · YASEMİN 73 ESMA 86 FATMA 93 ... seçilmemesine ve hesaplama iùlemlerinin kolaylığı için büyük seçilmemesine dikkat

Çalışmalarda, bazen istatistik serilerinde belli bir “değerden az” veya “değerden çok” gözlem sayılarına kolayca ulaşılmak istenebilir. Bu durumda, “birikimli seriler” söz konusudur. Gruplandırılmış seride her sınıfın frekansına, izleyen sınıfların frekansları eklenerek (veya toplam frekanstan eksiltilerek) oluşturulan seriye birikimli seri; birikimli seride her sınıfa karşı gelen frekansa da birikimli frekans ya da toplamlı frekans denir.

Birikimli seriler “-den az” ve “-den çok” olmak üzere iki şekilde oluşturulur.

Eğer, seride frekanslar eklenerek küçükten büyüğe doğru oluşturuluyorsa “-den az” serisi; büyükten küçüğe doğru eksiltilerek oluşturuluyorsa “-den çok” serisi söz konusudur.

9/20/2017 17 Yrd. Doç. Dr. Sedat Şen

Page 18: İSTATİSTİKSEL VERİLERİN TOPLANMASI VE DÜZENLENMESİ · YASEMİN 73 ESMA 86 FATMA 93 ... seçilmemesine ve hesaplama iùlemlerinin kolaylığı için büyük seçilmemesine dikkat

Aylık harcama Frekans Birikimli frekans

100-107’den az 3 3

108-114’den az 10 13

115-121’den az 12 25

122-128’den az 18 43

9/20/2017 18 Yrd. Doç. Dr. Sedat Şen

Page 19: İSTATİSTİKSEL VERİLERİN TOPLANMASI VE DÜZENLENMESİ · YASEMİN 73 ESMA 86 FATMA 93 ... seçilmemesine ve hesaplama iùlemlerinin kolaylığı için büyük seçilmemesine dikkat

Puanlar Frekans Toplamlı Frekans

36 1 1

42 1 2

52 1 3

61 1 4

69 2 6

71 1 7

73 1 8

75 1 9

77 1 10

79 3 13

80 1 14

81 2 16

84 3 19

85 1 20

86 4 24

87 2 26

88 2 28

91 1 29

93 6 35

95 1 36

97 1 37

98 2 39 Yrd. Doç. Dr. Sedat Şen 19 9/20/2017

Toplamlı frekansın en altındaki değer sınıf mevcudunu verir. Bu veriye göre sınıf mevcudu 39’dur.

Page 20: İSTATİSTİKSEL VERİLERİN TOPLANMASI VE DÜZENLENMESİ · YASEMİN 73 ESMA 86 FATMA 93 ... seçilmemesine ve hesaplama iùlemlerinin kolaylığı için büyük seçilmemesine dikkat

Yaş Frekans Birikimli Frekans

20 2 2

21 1 3

22 3 6

23 4 10

Tabloya göre 21 ve 21 yaş altındaki öğrenci sayısı 3’tür. Tabloya göre 21 yaş altındaki öğrenci sayısı 2’dir.

9/20/2017 20 Yrd. Doç. Dr. Sedat Şen

Page 21: İSTATİSTİKSEL VERİLERİN TOPLANMASI VE DÜZENLENMESİ · YASEMİN 73 ESMA 86 FATMA 93 ... seçilmemesine ve hesaplama iùlemlerinin kolaylığı için büyük seçilmemesine dikkat

iki veya daha fazla değişkene göre aldığı değerleri birlikte gösteren serilere “bileşik seri” denir. Değişken sayısı birden fazla olduğu için bu durumda değişkenlerden herhangi birine göre gözlem değerleri küçükten büyüğe doğru sıralanır ve diğer değişken değerleri de yeni sıralamaya göre düzenlenir. Bileşik seriler de basit, frekans ve gruplandırılmış seri olarak gösterilebilir.

9/20/2017 21 Yrd. Doç. Dr. Sedat Şen

Page 22: İSTATİSTİKSEL VERİLERİN TOPLANMASI VE DÜZENLENMESİ · YASEMİN 73 ESMA 86 FATMA 93 ... seçilmemesine ve hesaplama iùlemlerinin kolaylığı için büyük seçilmemesine dikkat

Boy (cm) Kilo (kg)

160 45

162 49

164 48

165 52

168 75

170 65

171 75

175 80

Bu tablo boy uzunluğuna göre sıralanmıştır.

9/20/2017 22 Yrd. Doç. Dr. Sedat Şen

Page 23: İSTATİSTİKSEL VERİLERİN TOPLANMASI VE DÜZENLENMESİ · YASEMİN 73 ESMA 86 FATMA 93 ... seçilmemesine ve hesaplama iùlemlerinin kolaylığı için büyük seçilmemesine dikkat

Günlük hayatta olsun, bilimsel çalışmalarda olsun, ilgilenilen olaya ilişkin sayılar

veya serilerin grafikle gösterimi daha yaygın olarak kullanılmaktadır. Çünkü, sayılara veya serilere bakıldığında görülemeyen birçok artış, azalış, eğilim gibi davranışlar grafik gösterimle kolayca görülebilir.

Pasta grafiği Çubuk grafiği Histogram Çizgi grafiği Serpilme grafiği

9/20/2017 23 Yrd. Doç. Dr. Sedat Şen

Page 24: İSTATİSTİKSEL VERİLERİN TOPLANMASI VE DÜZENLENMESİ · YASEMİN 73 ESMA 86 FATMA 93 ... seçilmemesine ve hesaplama iùlemlerinin kolaylığı için büyük seçilmemesine dikkat

2 1

1

3

7

14

11

Frekans

36-44

45-53

54-62

63-71

72-80

81-89

90-98

9/20/2017 24 Yrd. Doç. Dr. Sedat Şen

Page 25: İSTATİSTİKSEL VERİLERİN TOPLANMASI VE DÜZENLENMESİ · YASEMİN 73 ESMA 86 FATMA 93 ... seçilmemesine ve hesaplama iùlemlerinin kolaylığı için büyük seçilmemesine dikkat

Yrd. Doç. Dr. Sedat Şen

39 öğrencinin ölçme ara sınavından aldığı puanların gruplandırılmış halini gösteren çizgi grafiği

25

Frekans

Puan 0

2

4

6

8

10

12

14

16

36-44 45-53 54-62 63-71 72-80 81-89 90-98

9/20/2017

Page 26: İSTATİSTİKSEL VERİLERİN TOPLANMASI VE DÜZENLENMESİ · YASEMİN 73 ESMA 86 FATMA 93 ... seçilmemesine ve hesaplama iùlemlerinin kolaylığı için büyük seçilmemesine dikkat

Altın fiyatlarını gösteren 6 aylık grafik

9/20/2017 26 Yrd. Doç. Dr. Sedat Şen

Page 27: İSTATİSTİKSEL VERİLERİN TOPLANMASI VE DÜZENLENMESİ · YASEMİN 73 ESMA 86 FATMA 93 ... seçilmemesine ve hesaplama iùlemlerinin kolaylığı için büyük seçilmemesine dikkat

Yrd. Doç. Dr. Sedat Şen

39 öğrencinin ölçme ara sınavından aldığı puanların gruplandırılmış halini gösteren bar grafiği

27

Puan

Frekans

0

2

4

6

8

10

12

14

16

36-44 45-53 54-62 63-71 72-80 81-89 90-98

9/20/2017

Page 28: İSTATİSTİKSEL VERİLERİN TOPLANMASI VE DÜZENLENMESİ · YASEMİN 73 ESMA 86 FATMA 93 ... seçilmemesine ve hesaplama iùlemlerinin kolaylığı için büyük seçilmemesine dikkat

Bu da aynı verinin histogram grafiği ile gösterilmesi.

Yrd. Doç. Dr. Sedat Şen 28 9/20/2017

0

2

4

6

8

10

12

14

16

36-44 45-53 54-62 63-71 72-80 81-89 90-98

F

r

e

k

a

n

s

Puan Grubu

Histogram

Frekans

Page 29: İSTATİSTİKSEL VERİLERİN TOPLANMASI VE DÜZENLENMESİ · YASEMİN 73 ESMA 86 FATMA 93 ... seçilmemesine ve hesaplama iùlemlerinin kolaylığı için büyük seçilmemesine dikkat

Bileşik serilerde değişkenler arasındaki ilişkiyi gösteren grafiğe serpilme grafiği (diyagram›) denir. Serpilme grafiğinde yatay eksende değişkenlerden biri, düşey eksende bir diğeri olmak üzere, istatistik birimine ilişkin iki değişken için sayı çifti işaretlenir. İşaretlenen bu noktaların dağılması (serpilmesi) değişkenler arasındaki ilişki hakkında görsel olarak bilgi verir.

45 49 48

52

75

65

75 80

0

10

20

30

40

50

60

70

80

90

155 160 165 170 175 180

K

i

l

o

Boy

Boy-Kilo Grafiği

Kilo

Linear (Kilo)

9/20/2017 29 Yrd. Doç. Dr. Sedat Şen