Μια Στατιστική Έρευνα Διακρίνεται σε 3 Στάδια:
DESCRIPTION
Μια Στατιστική Έρευνα Διακρίνεται σε 3 Στάδια:. 1 ο : Συλλογή Στατιστικού υλικού 2 ο : Επεξεργασία και παρουσίαση του υλικού 3 ο : Ανάλυση και εξαγωγή χρήσιμων συμπερασμάτων. Στατιστική είναι ένα σύνολο αρχών και μεθοδολογιών για:. - PowerPoint PPT PresentationTRANSCRIPT
Μια Στατιστική Έρευνα ΔιακρίνεταιΜια Στατιστική Έρευνα Διακρίνεται
σε 3 Στάδια:σε 3 Στάδια:1ο: Συλλογή Στατιστικού υλικού
2ο: Επεξεργασία και παρουσίαση του
υλικού
3ο: Ανάλυση και εξαγωγή χρήσιμων
συμπερασμάτων
Στατιστική είναι ένα σύνολο αρχών και μεθοδολογιών για:
• Το σχεδιασμό της διαδικασίας συλλογής δεδομένων (Σχεδιασμός Πειραμάτων-Experimental Design)
• Τη συνοπτική και αποτελεσματική παρουσίαση τους (Περιγραφική Στατιστική-Descriptive Statistics)
• Την ανάλυση και εξαγωγή αντίστοιχων συμπερασμάτων
(Επαγωγική Στατιστική-Inferential Statistics)
R.A. Fisher (1890-1962)
ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ11
π.χ. το ύψος, το βάρος, οι απουσίες, η ομάδα αίματος
και το φύλο των μαθητών της Γ΄ Λυκείου
• Πληθυσμός (population)
Ένα σύνολο στοιχείων τα οποία μας ενδιαφέρει να εξετάσουμε ως προς ένα ή περισσότερα χαρακτηριστικά τους.
οι μαθητές της Γ Λυκείου
• Μονάδες ή άτομα του πληθυσμού
Τα στοιχεία του πληθυσμού
ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ22
• Μεταβλητές (variables)
Τα χαρακτηριστικά ως προς τα οποία εξετάζουμε έναν πληθυσμό.
Συμβολίζονται με κεφαλαία γράμματα X, Y, Ζ .....
1)το ύψος, 2)το βάρος, 3)η ομάδα αίματος, 4)οι
απουσίες, 5)το φύλλο
• Τιμές της Μεταβλητής
Οι δυνατές τιμές που μπορεί να πάρει μια
μεταβλητή
ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ33
Οι Μεταβλητές διακρίνονται σε:
► Ποιοτικές ή Κατηγορικές μεταβλητές:
των οποίων οι τιμές τους δεν είναι αριθμοί
η ομάδα αίματος, το φύλλο
ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ44
…και σε:
► Ποσοτικές μεταβλητές: των οποίων οι τιμές τους είναι αριθμοί και διακρίνονται
σε: Διακριτές μεταβλητές: που παίρνουν μόνο
«μεμονωμένες» τιμές
Ο αριθμός των απουσιών Συνεχείς μεταβλητές: που μπορούν να πάρουν
οποιαδήποτε τιμή ενός διαστήματος πραγματικών αριθμών
Το ύψος, το βάρος
ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ55
Συλλογή Στατιστικών ΔεδομένωνΜε απογραφή:Εξετάζουμε όλα τα άτομα του πληθυσμού ως προς το χαρακτηριστικό που μας ενδιαφέρει
Με Δειγματοληψία:Μαζεύουμε πληροφορίες από μια μικρή ομάδα ή υποσύνολο του πληθυσμού. Κάνουμε τις παρατηρήσεις μας στο δείγμα αυτό και μετά γενικεύουμε τα συμπεράσματα για ολόκληρο τον πληθυσμό. Προσοχή, όμως.....
ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ66
•Για να είναι αξιόπιστα τα συμπεράσματα, το δείγμα πρέπει να είναι αντιπροσωπευτικό.
Αντιπροσωπευτικό δείγμα:
Όταν έχει επιλεγεί κατά τέτοιο τρόπο, ώστε κάθε μονάδα του πληθυσμού να έχει την ίδια δυνατότητα να επιλεγεί.
Στατιστικοί πίνακεςΣτατιστικοί πίνακεςΟι πίνακες διακρίνονται σε :
i. Γενικούς πίνακες
περιέχουν όλες τις πληροφορίες που προκύπτουν από μία στατιστική έρευνα και αποτελούν πηγές στατιστικών πληροφοριών στη διάθεση επιστημόνων-ερευνητών για την εξαγωγή συμπερασμάτων.
ii.Ειδικούς πίνακες
οι οποίοι είναι συνοπτικοί και σαφείς. Συνήθως τα στοιχεία έχουν ληφθεί από τους γενικούς πίνακες.
3 4 5 8 9 7 6 8 7 10
8 7 6 5 9 3 8 5 6 6
6 3 5 6 4 2 9 8 7 7
1 6 3 1 5 8 1 2 3 4
5 6 7 9 10 9 8 7 6 5
Η βαθμολογία 50 φοιτητών στις εξετάσεις ενός μαθήματος είναι: (Άσκηση 1, σελ. 78)
Πίνακας Κατανομής Συχνοτήτων & Σχετικών Συχνοτήτων
5
10
13
xi Διαλογή
1
2
3
4
5
6
7
8
9
10Σύνολο
|||
|||
||
||||
|||| ||
|||| ||||
|||| ||
|||| ||
||||
||
νi Ni
3
2
5
3
7
9
7
7
5
250
3
20
29
36
43
4850
fi% Fi%6
4
10
6
14
18
1414
10
4
100
νi: (Απόλυτη) Συχνότητα
Νi : Αθροιστική Συχνότητα
fi: Σχετική Συχνότητα
Fi: Αθροιστική Σχετική Συχνότητα
6
10
20
26
40
58
72
86
96
100
ννii:(Απόλυτη) Συχνότητα:(Απόλυτη) Συχνότητα• Είναι ο φυσικός αριθμός που δείχνει πόσες φορές
εμφανίζεται η τιμή xi της εξεταζόμενης μεταβλητής Χ στο σύνολο των παρατηρήσεων
Ιδιότητα των ΣυχνοτήτωνΈστω ένα δείγμα μεγέθους ν και x1, x2,….xκ είναι οι τιμές μιας μεταβλητής Χ, που αφορά τα άτομα του δείγματος (με κν)
►Το άθροισμα όλων των συχνοτήτων είναι ίσο με το μέγεθος του δείγματος
ν1 +ν2 +….+νκ =ν
ΝΝii: : Αθροιστική Συχνότητα Αθροιστική Συχνότητα (ποσοτικές μεταβλητές)(ποσοτικές μεταβλητές)
Εκφράζουν το πλήθος των παρατηρήσεων που είναι μικρότερες ή ίσες της τιμής xi
N1=ν1
Ν2=ν1+ν2
Ν3=ν1+ν2+ν3
.
.
.
Νκ=ν1+ν2+….+νκ Νκ=ν
ffii : Σχετική Συχνότητα: Σχετική Συχνότητα11
Αν διαιρέσουμε την συχνότητα νi με το μέγεθος ν του δείγματος, προκύπτει η σχετική συχνότητα (relative frequency) fi της τιμής xi
i
if i=1,2,….κ
ffii : Σχετική Συχνότητα: Σχετική Συχνότητα33
10 if
;......21 fff
Για τη σχετική συχνότητα ισχύουν οι ιδιότητες:
, Για i=1,2,…κ αφού 0 νi ν
αφού
1.....
.......... 212121
fff
1
FFii :Αθροιστική Σχετική Συχνότητα :Αθροιστική Σχετική Συχνότητα (ποσοτικές μεταβλητές)(ποσοτικές μεταβλητές)
Εκφράζουν το ποσοστό των παρατηρήσεων που είναι μικρότερες ή ίσες της τιμής xi
F1=f1
F2=f1+f2
F3=f1+f2+f3
. .
. Fκ=f1+f2+….+fκ Fκ=1FFii% % :Αθροιστική Σχετική Συχνότητα:Αθροιστική Σχετική Συχνότητα
Fκ%=f1%+f2%+….+fκ% Fκ=100
ΓΡΑΦΙΚΗ ΠΑΡΑΣΤΑΣΗ ΓΡΑΦΙΚΗ ΠΑΡΑΣΤΑΣΗ ΚΑΤΑΝΟΜΗΣ ΣΥΧΝΟΤΗΤΩΝΚΑΤΑΝΟΜΗΣ ΣΥΧΝΟΤΗΤΩΝ11
Παρέχει μια πιο σαφή εικόνα από τον πίνακα, χωρίς να προσφέρει περισσότερη πληροφορία.
Διευκολύνει την σύγκριση ομοειδών στοιχείων για το ίδιο ή διαφορετικά χαρακτηριστικά.
ΓΡΑΦΙΚΗ ΠΑΡΑΣΤΑΣΗ ΓΡΑΦΙΚΗ ΠΑΡΑΣΤΑΣΗ ΚΑΤΑΝΟΜΗΣ ΣΥΧΝΟΤΗΤΩΝΚΑΤΑΝΟΜΗΣ ΣΥΧΝΟΤΗΤΩΝ22
πρέπει να συνοδεύονται από:
α) τον τίτλο
β) την κλίμακα με τις τιμές των μεγεθών που απεικονίζονται
γ) το υπόμνημα που επεξηγεί συνήθως τις τιμές της μεταβλητής
δ) την πηγή των δεδομένων
ΓΡΑΦΙΚΗ ΠΑΡΑΣΤΑΣΗ ΓΡΑΦΙΚΗ ΠΑΡΑΣΤΑΣΗ ΚΑΤΑΝΟΜΗΣ ΣΥΧΝΟΤΗΤΩΝΚΑΤΑΝΟΜΗΣ ΣΥΧΝΟΤΗΤΩΝ33
•Ραβδόγραμμα
•Διάγραμμα Συχνοτήτων
•Κυκλικό Διάγραμμα
•Σημειόγραμμα
•Χρονόγραμμα
Θα ασχοληθούμε με τα παρακάτω είδη γραφικών παραστάσεων κατανομής συχνοτήτων:
Διάγραμμα (line diagram)1
ΣυχνοτήτωνΔιάγραμμα Σχετικών ΣυχνοτήτωνΧρησιμοποιείται για την γραφική παράσταση των τιμών μιας ποσοτικής μεταβλητής.
Σε κάθε τιμή της μεταβλητής xi υψώνουμε μία κάθετη γραμμή με μήκος ίσο προς την αντίστοιχη συχνότητα.
Πολύγωνο Συχνοτήτων
Ενώνοντας τα σημεία (xi, νi) ή (xi, fi) έχουμε το πολύγωνο συχνοτήτων ή σχ. συχνοτήτων…
Ραβδόγραμμα (Ραβδόγραμμα (barchart)barchart)11
ΣυχνοτήτωνΡαβδόγραμμα Σχετικών ΣυχνοτήτωνΧρησιμοποιείται για την γραφική παράσταση των τιμών μιας ποιοτικής μεταβλητής.
Σε κάθε τιμή της μεταβλητής Χ αντιστοιχεί μια ορθογώνια στήλη της οποίας το ύψος είναι ίσο με την αντίστοιχη συχνότητα ή σχετική συχνότητα.
Ραβδόγραμμα (Ραβδόγραμμα (barchart)barchart)22
• Οι αποστάσεις μεταξύ των ράβδων και το μήκος των βάσεων καθορίζονται αυθαίρετα.
Τα δημοφιλέστερα ξένα μουσικά συγκροτήματα των 18 αγοριών του πίνακα 4 (σελ.64) ήσαν: (άσκηση 7, σελ. 79)
νi
5
3
4
1
2
318
xi
Metallica
Iron Maiden
Scorpions
Oasis
Rolling Stones
Άλλο
Σύνολο
fi
0,278
0,167
0,222
0,055
0,111
0,167
1
αi=360οfi
360o
100o
60o
80o
20o
40o
60o
1ο Ραβδόγραμμα
2ο Ραβδόγραμμα
3ο Ραβδόγραμμα
Ραβδόγραμμα Σχετικών Συχνοτήτων
0.278
0.167
0.222
0.055
0.111
Met
allic
aIro
n M
aide
nSc
orpi
ons
Oas
is
Rol
ling
Ston
es
Άλλο
Ραβδόγραμμα (Ραβδόγραμμα (barchart)barchart)33
• Μερικές φορές σε ένα ραβδόγραμμα συχνοτήτων ο ρόλος των δύο αξόνων είναι δυνατόν να αντιστραφεί, τότε οι ράβδοι είναι οριζόντιοι, παράλληλοι στον άξονα x΄x
Ραβδόγραμμα Σχετικών Συχνοτήτων
0.2
78
Metallica
Iron Maiden
Scorpions
Oasis
Rolling Stones
Άλλο
0.22
2
0.16
7
0.11
1
0.05
5
Τα μετάλλια που πήραν μερικές χώρες στο 17ο Ευρωπαϊκό Πρωτάθλημα Στίβου το 1998. (άσκηση 10, σελ. 80)
Επειδή θέλουμε να συγκρίνουμε το είδος των μεταλλίων που πήρε η κάθε χώρα, φτιάχνουμε το Ραβδόγραμμα συχνοτήτων ως εξής:
Μ.
ΒΡΕΤΑΝΙΑ
ΓΕΡΜΑΝΙΑ
ΡΩΣΙΑ
ΠΟΛΩΝΙΑ
ΡΟΥΜΑΝΙΑ
ΟΥΚΡΑΝΙΑ
ΙΤΑΛΙΑ
ΠΟΡΤΟΓΑΛΙΑ
ΙΣΠΑΝΙΑ
Κυκλικό Διάγραμμα (piechart)1
Χρησιμοποιείται για την γραφική παράσταση τόσο των ποιοτικών όσο και των ποσοτικών δεδομένων, όταν οι διαφορετικές τιμές της μεταβλητής είναι σχετικά λίγες.
Κυκλικό Διάγραμμα (piechart)2
Είναι ένας κύκλος χωρισμένος σε κυκλικούς τομείς, των οποίων τα εμβαδά ή τα αντίστοιχα τόξα είναι ανάλογα προς τις συχνότητες νi ή τις σχ. συχνότητες fi των τιμών xi της μεταβλητής
iii f
360360
αi: οι μοίρες του κυκλικού
τομέα
για i=1,2,3,….κ
Κυκλικό Διάγραμμα (piechart)2
fi%
27,8
16,7
22,2
5,5
11,1
16,7
100
αi=360οfi
100
60
80
20
40
60
360o
27,8%
22,2%
11,1%
16,7%5,5%
16,7%
Σημειόγραμμα (dot diagram)Χρησιμοποιείται όταν έχουμε λίγες παρατηρήσεις
Οι τιμές παριστάνονται σαν σημεία υπεράνω ενός οριζόντιου άξονα.
Π.χ.Ο χρόνος που χρειάστηκαν 15 μαθητές για να λύσουν ένα διαγώνισμα είναι: 4,2,3,1,5,6,4,2,3,4,7,4,8,6,3.
Χρονόγραμμα ή Χρονολογικό διάγραμμα
Χρησιμοποιείται για τη γραφική απεικόνιση της διαχρονικής εξέλιξης ενός οικονομικού, δημογραφικού ή άλλου μεγέθους.
Ο οριζόντιος άξονας χρησιμοποιείται συνήθως ως άξονας μέτρησης του χρόνου και ο κάθετος ως άξονας μέτρησης της εξεταζόμενης μεταβλητής
Στον παρακάτω πίνακα δίνονται τα κρούσματα δύο λοιμωδών νόσων από το 1987 έως το 1997 (Πηγή ΕΚΕΠΑΠ). Να κατασκευαστεί το αντίστοιχο χρονόγραμμα (άσκηση 11, σελ. 80)
xi νi fi Ni Fi fi% Fi%
1 10
2 4 0,20 6
3 0,60
4 25
5 2
6
Σύνολο
Να συμπληρώσετε τον πίνακα
(άσκηση 5, σελ. 79)
Το κυκλικό διάγραμμα παριστάνει την βαθμολογία των 450 μαθητών ενός Γυμνασίου σε 4 κατηγορίες: «Άριστα», «Λίαν Καλώς», «Καλώς» και «Σχεδόν Καλώς». (άσκηση 8, σελ. 79)
Οι μαθητές με βαθμό «Σχεδόν Καλώς» είναι διπλάσιοι των μαθητών με «Άριστα»
Πόσοι μαθητές έχουν επίδοση τουλάχιστον «Λίαν Καλώς»;
xi νi fi% αi
Άριστα
Λίαν Καλώς
Καλώς
Σχεδόν Καλώς
Σύνολο 450
30
144
Από το 1960-1968 (Πρωτάθλημα Α΄ Εθνικής) (άσκηση 9, σελ. 80)
xi νi fi αi
Παναθηναϊκός
Ολυμπιακός
ΑΕΚ
ΠΑΟΚ
Λάρισα
Σύνολο
15
12
9
2
1
Η επίδοση 50 υποψηφίων για την πρόσληψη τους σε μια
ιδιωτική σχολή (άσκηση 12, σελ. 80)
xi νi fi Fi
0
1
2
3
4
5
6
7
8
9
Σύνολο
Το παρακάτω χρονόγραμμα δίνει τη σχετική συχνότητα των νέων πτυχιούχων Μαθηματικών σε όλη την Ελλάδα από το 1930-1995 ανάλογα με το φύλλο. (άσκηση 4, σελ.81-82)
ΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝ11
Όταν το πλήθος των τιμών μιας μεταβλητής είναι αρκετά μεγάλο (συνήθως στις ποσοτικές μεταβλητές και πιο πολύ στις συνεχείς) είναι δύσκολο να κατασκευαστούν οι πίνακες κατανομής συχνοτήτων και κατ’ αναλογία τα αντίστοιχα διαγράμματα.
Σ’αυτές τις περιπτώσεις ομαδοποιούμε τα δεδομένα σε μικρό πλήθος ομάδων, που ονομάζονται κλάσεις (class intervals), έτσι ώστε κάθε τιμή να ανήκει σε μία μόνο κλάση.
►
ΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝ22
• Τα άκρα των κλάσεων καλούνται όρια των κλάσεων (class boundaries)
• Μια κλάση περιέχει το κάτω άκρο της (κλειστή αριστερά) αλλά όχι το άνω άκρο της (ανοικτή δεξιά), δηλαδή είναι ένα διάστημα της μορφής:
[α, β) όπου α: κάτω άκρο και β: άνω άκρο
• Κέντρο xi της κλάσης i αντιπροσωπεύει όλη την κλάση
2
ix
1οΒήμα:Προσδιορισμός του πλήθους κ των κλάσεων
1ος τρόπος: Καθορίζεται αυθαίρετα από εμάς ή μας
προσδιορίζει η άσκηση
2ος τρόπος: η χρησιμοποιούμε σαν οδηγό τον πίνακα:
ΟΜΑΔΟΠΟΙΗΣΗΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝΠΑΡΑΤΗΡΗΣΕΩΝ33
Σελ. 72, σχολικό βιβλίο
2οΒήμα:Προσδιορισμός του πλάτους c των κλάσεων
Το πλάτος c της κλάσης [α, β) είναι το c=β-α
Ίσου πλάτους
Κλάσεις
Άνισου πλάτους
ΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝ44
Ισοπλατείς κλάσεις
1ον Εύρος (range) R του δείγματος
Είναι η διαφορά της μικρότερης παρατήρησης από τη
μεγαλύτερη, δηλαδή:
R=xmax-xmin
2ον Πλάτος c
Είναι το πηλίκο του εύρους δια το πλήθος των κλάσεων
ΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝ55
R
c
3οΒήμα:Κατασκευή των κλάσεων
Ξεκινώντας από την μικρότερη παρατήρηση (για πρακτικούς λόγους μπορεί να ξεκινήσουμε λίγο πιο κάτω από τη
μικρότερη παρατήρηση)
προσθέτουμε κάθε φορά το πλάτος c και δημιουργούμε τις κ κλάσεις.
ΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝ66
Δηλαδή: •xmin+c
άρα η 1η κλάση είναι [xmin, xmin+c)
•(xmin+c)+c=xmin+2c
άρα η 2η κλάση είναι [xmin+c, xmin+2c)
•(xmin+2c)+c=xmin+3c
άρα η 3η κλάση είναι [xmin+2c, xmin+3c)
►Η διαδικασία αυτή, σταματάει όταν η μεγαλύτερη τιμή του δείγματος xmax ανήκει στην τελευταία κλάση που έχουμε σχηματίσει.
ΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝ66
Παρατηρήσεις►Καμία παρατήρηση δεν μπορεί να μείνει
έξω από κάποια κλάση
► Μια παρατήρηση που συμπίπτει με το άνω άκρο (το β)μια κλάσης θα τοποθετηθεί κατά τη διαλογή στην αμέσως επόμενη κλάση.
ΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝ88
4οΒήμα:Γίνεται η διαλογή των παρατηρήσεων
Το πλήθος νi των παρατηρήσεων που προκύπτει
από τη διαλογή για την i κλάση είναι η συχνότητα νi της κλάσης αυτής ή η συχνότητα της κεντρικής τιμής xi
ΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝ77
► Οι κεντρικές τιμές διαφέρουν μεταξύ τους όσο και το πλάτος των κλάσεων. Δηλαδή
xi+1-xi=c xi+1=xi+c
ΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝ99
Άρα για να υπολογίσουμε τις κεντρικές τιμές, μπορούμε να υπολογίσουμε την κεντρική τιμή x1 της πρώτης κλάσης [α, β) από την σχέση:
Και στην συνέχεια να προσθέτουμε κάθε φορά το πλάτος c, δηλ. x2=x1+c x3=x2+c κ.λ.π
21
x
Ιστόγραμμα ΣυχνοτήτωνΙστόγραμμα Συχνοτήτων ((histogram)histogram)11
Στον οριζόντιο άξονα σημειώνουμε τα όρια των κλάσεων
Στον κατακόρυφο άξονα τις συχνότητες ή τις σχετικές συχνότητες
Κατασκευάζουμε διαδοχικά ορθογώνια (ιστούς), καθένα από τα οποία έχει βάση ίση με το πλάτος c των κλάσεων και ύψος τέτοιο ώστε το εμβαδόν του ορθογωνίου να ισούται με τη συχνότητα της κλάσης αυτής: Εi=β*υ Εi=c*υ και Ei=νi
Παρατήρηση
Στην κατασκευή του ιστογράμματος θεωρούμε 2 ακόμη υποθετικές κλάσεις, στην αρχή και στο τέλος, με συχνότητα 0.
π.χ.
Ιστόγραμμα ΣυχνοτήτωνΙστόγραμμα Συχνοτήτων ((histogram)histogram)22
Πολύγωνο Πολύγωνο ΣυχνοτήτωνΣυχνοτήτων & Σχ. Συχνοτήτων
(frequency polygon)
Για να σχεδιάσουμε το πολύγωνο συχνοτήτων, ενώνουμε τα μέσα των άνω βάσεων των ορθογωνίων με ευθύγραμμα τμήματα. (μαζί με τις βάσεις των μηδενικών κλάσεων στην αρχή και το τέλος)
Ιστόγραμμα Αθροιστικών Ιστόγραμμα Αθροιστικών Συχνοτήτων & Σχ. ΣυχνοτήτωνΣυχνοτήτων & Σχ. Συχνοτήτων
Κατασκευάζεται με τον ίδιο τρόπο με το ιστόγραμμα συχνοτήτων και σχετικών συχνοτήτων
Πολύγωνο ΑθροιστικώνΠολύγωνο ΑθροιστικώνΣυχνοτήτωνΣυχνοτήτων & Σχ. Συχνοτήτων
Για να σχεδιάσουμε το πολύγωνο Αθροιστικών συχνοτήτων, ενώνουμε τα δεξιά άκρα των άνω βάσεων των ορθογωνίων με ευθύγραμμα τμήματα, ξεκινώντας από το κάτω αριστερό άκρο του πρώτου ορθογωνίου.
Οι χρόνοι (σε λεπτά) που χρειάστηκαν Οι χρόνοι (σε λεπτά) που χρειάστηκαν 55 μαθητές για να λύσουν ένα πρόβλημα 55 μαθητές για να λύσουν ένα πρόβλημα είναι: είναι: (άσκηση 7, σελ. 83)(άσκηση 7, σελ. 83)
Να ομαδοποιηθούν τα δεδομένα σε κατάλληλο αριθμό κλάσεων: Το πλήθος των κλάσεων είναι ………… Η μέγιστη τιμή είναι………….και η ελάχιστη τιμή είναι ……........., άρα το εύρος του δείγματος είναι..………….. και το πλάτος c, είναι:
κ=7
xmax=13,8xmin=1,3
R=12,5
και το πλάτος c, είναι: 8,1768,17
5,12
R
c
Κατασκευή πίνακα με νi, fi%, Ni, Fi%
Κλάσεις [ , ) νi fi% Ni Fi% xi
Σύνολο: 5
1,3-3,1
3,1-4,9
4,9-6,7
6,7-8,58,5-10,3
10,3-12,1
12,1-13,9
14
19
4
6
4
3
5
55
25,5
34,5
7,3
10,9
7,3
5,4
9,1
100
2,2
4,0
5,8
7,6
9,4
11,2
13
Ιστόγραμμα & ΠολύγωνοΙστόγραμμα & Πολύγωνο Αθροιστικών Σχετικών Αθροιστικών Σχετικών
ΣυχνοτήτωνΣυχνοτήτων
Στα σχολεία ενός δήμου υπηρετούν συνολικά 100 εκπαιδευτικοί. Ο συνολικός χρόνος υπηρεσίας των εκπαιδευτικών δίνεται από τον παρακάτω πίνακα:
Χρ. υπηρεσίας
[ - )
Σχ. Συχνότητα
fi%
0-5 10
5-10 15
10-15 12
15-20 15
20-25 18
25-30 18
30-35 12
Σύνολο
Συχνότητανi
Στον επόμενο πίνακα, φαίνεται η κλιμάκωση των βαθμών πρόσβασης, του συνόλου των Μαθητών της Γ΄Λυκείου που εξετάστηκαν σε εθνικό επίπεδο το 2002, σύμφωνα με τα επίσημα στοιχεία που έδωσε στην δημοσιότητα το Υπουργείο Παιδείας
1. Αν είναι γνωστό ότι το πλήθος των μαθητών που πήραν βαθμό πρόσβασης μεγαλύτερο ή ίσο του 16 και μικρότερο του 18 ήταν τετραπλάσιος αυτών που πήραν βαθμό μεγαλύτερο ή ίσο του 4 και μικρότερο του 6, να συμπληρώσετε τον πίνακα με τις δύο σχετικές συχνότητες που λείπουν.
2. Είναι οι γνωστό ότι 55872 μαθητές πήραν βαθμό πρόσβασης μεγαλύτερο ή ίσο του 10. Να βρείτε το συνολικό πλήθος των υποψηφίων
3. Να υπολογίσετε πόσοι υποψήφιοι είχαν βαθμό πρόσβασης μεγαλύτερο ή ίσο του 11 και μικρότερο του 13
[ - ) Σχ. Συχνότητα fi%
0-2 1
2-4 2
4-6
6-8 16
8-10 18
10-12 16
12-14 14
14-16 13
16-18
18-20 5
Σύνολο
Αριθμητικά ΜέτραΑριθμητικά Μέτρα
Αριθμητικά Μέτρα με τα οποία μπορούμε να περιγράψουμε με συντομία μια κατανομή συχνοτήτων.
Μέτρα θέσης (Location Measures)
Μέτρα
Μέτρα διασποράς (Measures of
Variability)
Μέτρα Θέσης
Μας δίνουν τη θέση του «κέντρου» των παρατηρήσεων στον οριζόντιο άξονα.
Εκφράζουν την “κατά μέσο όρο” απόσταση των παρατηρήσεων από την αρχή των αξόνων.
Τα πιο «συνηθισμένα» μέτρα θέσης είναι:•Μέση τιμή ( ) ή Αριθμητικός Μέσος
(Arithmetic mean or Average)•Σταθμικός Μέσος ( ) (weighted mean)•Διάμεσος (δ) (median)
x
x
Μέση τιμή ( ) (Average)1
1η περίπτωση
Η μέση τιμή ενός συνόλου ν παρατηρήσεων
(t1, t2,….tν) μιας μεταβλητής Χ είναι το άθροισμα των παρατηρήσεων δια του πλήθους των παρατηρήσεων.
x
1
121 1...
ii
ii
tt
tttx
Μέση τιμή ( ) (Average)2
2η περίπτωση
Αν x1, x2,…xκ είναι οι τιμές της μεταβλητής Χ με συχνότητες ν1, ν2, ….,νκ, αντίστοιχα τότε :
ή
1
1
1
21
2211 1
...
...
iii
ii
iii
xx
xxxx
x
11 iii
i
ii fxxx
Παράδειγμα
Μέση τιμή ( ) (Average)3
Παρατήρηση:
Ο τύπος της 2ης περίπτωσης, χρησιμοποιείτε και για ομαδοποιημένα δεδομένα, όπου xi είναι τα κέντρα των κλάσεων
x
Παράδειγμα
Σταθμικός Μέσος ( ) (weighted mean)
Χρησιμοποιείται στις περιπτώσεις όπου δίνεται διαφορετική βαρύτητα (έμφαση) στις τιμές x1, x2,…xν ενός συνόλου δεδομένων.
Αν σε κάθε τιμή x1, x2,…xν δώσουμε διαφορετική βαρύτητα, που εκφράζεται με τους λεγόμενους συντελεστές στάθμισης (βαρύτητας) w1, w2,….wν, τότε
x
1
1
21
2211
....
....
ii
iii
w
wx
www
wxwxwxx
Παράδειγμα
Διάμεσος (δ) (median)1
Η διάμεσος δ είναι ένας αριθμός:
xmin< δ < xmax
και μοιράζει τις παρατηρήσεις σε δύο σύνολα έτσι ώστε το 50% των παρατηρήσεων να είναι μικρότερες ή ίσες του δ.
Διάμεσος (δ) (median)2
Μη Ομαδοποιημένα Δεδομένα
Προσοχή!!
Οι παρατηρήσεις πρέπει να έχουν διαταχθεί κατά αύξουσα σειρά
1η περίπτωση:
Το πλήθος ν των παρατηρήσεων είναι περιττός αριθμός.
δ =μεσαία παρατήρηση
2η περίπτωση:
Το πλήθος ν των παρατηρήσεων είναι άρτιος αριθμός.
δ = ο μέσος όρων των μεσαίων παρατηρήσεων
Παράδειγμα
Διάμεσος (δ) (median)3
Ομαδοποιημένα Δεδομένα1ο Κατασκευάζουμε το ιστόγραμμα των αθροιστικών
σχετικών συχνοτήτων και την πολυγωνική γραμμή.
2ο Από το σημείο του 50% του άξονα (Οy) των αθροιστικών συχνοτήτων φέρνουμε παράλληλη στον άξονα Οx μέχρι το σημείο που τέμνει το πολύγωνο.
3ο Από το σημείο τομής φέρνουμε κάθετη στον Οx
► Στο σημείο τομής με τον άξονα Οx αντιστοιχεί η διάμεσος δ Παράδειγμα
Οι βαθμοί επίδοσης ενός μαθητή σε 10 μαθήματα είναι: 14, 20, 15, 16, 18,15, 14, 16, 16, 18. Να βρεθεί η μέση επίδοση του
2,1616210
1)18161614151816152014(
10
11
1
iitx
xi νi xiνi
14
15
16
18
20
Σύνολο 2,1616210
1
1
1
i
iixx
1ος τρόπος
2ος τρόπος 2
2
2
3
1
10
28
30
48
36
20
162
Δημιουργούμε τον πίνακα Άρα
1i
iix
Εάν το κάθε μάθημα έχει συντελεστή βαρύτητας, αντίστοιχα: xi: 14, 20, 15, 16, 18,15, 14, 16, 16, 18 wi: 2, 1, 3, 1, 2, 3, 2, 1, 2, 3
1620
320
20
543216284536164520283212321312
3*182*161*162*143*152*181*163*151*202*141
1
ii
iii
w
wxx
Ποια είναι τότε η μέση επίδοση;
Ο παρακάτω πίνακας δίνει τον χρόνο που έκαναν 40 μαθητές για να λύσουν μια άσκηση. Να βρεθεί η μέση τιμή
[ - ) xi νi xiνi
0-2 8
2-4 8
4-6 14
6-8 6
8-10 4
Σύνολο 40
1i
iix
Άρα
5,418040
1
1
1
i
iixx
1
3
5
7
9
8
24
70
42
36
180
Οι βαθμοί επίδοσης ενός μαθητή σε 10 μαθήματα είναι: 14, 20, 15, 16, 18,15, 14, 16, 16, 18. Να βρεθεί η διάμεσος των παρατηρήσεων
Οι παρατηρήσεις πρέπει να τοποθετηθούν κατά αύξουσα σειρά
Άρα: 14, 14, 15, 15, 16, 16, 16, 18,18, 20
Το πλήθος των παρατηρήσεων είναι άρτιος αριθμός.
Άρα δ= 162
1616
4 4
Αν προστεθεί ο βαθμός ενός μαθήματος ακόμα, δηλαδή: 14, 20, 15, 16, 18,15, 14, 16, 16, 18, 15, τότε η διάμεσος είναι:
Άρα: 14, 14, 15, 15, 15, 16, 16, 16, 18,18, 20
Το πλήθος των παρατηρήσεων είναι περιττός αριθμός.
Οι παρατηρήσεις πρέπει να τοποθετηθούν κατά αύξουσα σειρά
5 5
Άρα δ=16
Ο παρακάτω πίνακας δίνει τον χρόνο που έκαναν 40 μαθητές για να λύσουν μια άσκηση. Να βρεθεί η διάμεσος των παρατηρήσεων
[ - ) xi νi fi% Fi%
0-2 1 8
2-4 3 8
4-6 5 14
6-8 7 6
8-10 9 4
Σύνολο 40
7520
35
10
15
100
20
40
20
90
100
1ο Βήμα:
Υπολογίζουμε τις Αθροιστικές Σχετικές Συχνότητες
2ο Βήμα: Κατασκευάζουμε το ιστόγραμμα & το πολύγωνο
Αθροιστικών Σχετικών Συχνοτήτων
Α Β
Γ
ΔΕ
%40%50
%40%75
4
46
10
35
4
2
1403520
57.4
16035
Μέτρα Διασποράς (measures of variation, dispersion measures)
• Μας δίνουν την διασπορά των παρατηρήσεων, δηλαδή πόσο αυτές εκτείνονται γύρω από το «κέντρο» τους.
Τα σπουδαιότερα μέτρα διασποράς είναι:
Το εύρος (R) (range)
Η διακύμανση ( ) (variance)
Η τυπική απόκλιση (s) (standard deviation)
Συντελεστής μεταβολής (CV) (coefficient of variation)
2s
Εύρος Εύρος ( R ) (range)( R ) (range)
R=xmax-xmin
• Το εύρος είναι ένα αρκετά απλό μέτρο, • Υπολογίζεται εύκολα• Δεν θεωρείται αξιόπιστο γιατί βασίζεται μόνο στις
δύο ακραίες παρατηρήσεις
Διακύμανση (Διακύμανση ( ) )11
Αν t1, t2, ….tν είναι οι τιμές μιας μεταβλητής Χ,
τότε ti- είναι η απόκλιση της τιμής ti από την μέση τιμή.
Διακύμανση, είναι ο μέσος όρος των τετραγώνων των αποκλίσεων των τιμών ti από την μέση τιμή
x
2s
x
1
22 1
ii xts
2
1
1
22 1 ii
ii
t
tsή
Παράδειγμα
Διακύμανση (Διακύμανση ( ) )22
όταν έχουμε κατανομή συχνοτήτων ή ομαδοποιημένα δεδομένα, τότε η διακύμανση ορίζεται από την σχέση:
1
22 1
iii xxs
2s
2
1
1
22 1 iii
iii
x
xsή
Υπέρ: Αξιόπιστο μέτρο διασποράς
Κατά: Δεν εκφράζεται με τις μονάδες που εκφράζονται οι παρατηρήσεις…
Τυπική Απόκλιση (Τυπική Απόκλιση (s) s) (standard deviation)(standard deviation)
Γι’ αυτό αν πάρουμε την θετική τετραγωνική ρίζα της διακύμανσης, αυτή θα εκφράζεται με την ίδια μονάδα μέτρησης με τις παρατηρήσεις. Η ποσότητα αυτή λέγεται τυπική απόκλιση (s)
s= 2s
Παράδειγμα
Οι βαθμοί επίδοσης ενός μαθητή σε 10 μαθήματα είναι: 14, 20, 15, 16, 18,15, 14, 16, 16, 18. Να βρεθεί η διακύμανση
2,16x
52,32,3510
184,404,004,084,444,1
24,304,044,144,1484,4(10
1
])8,1()2,0()2,0()2,2()2,1(
)8,1()2,0()2,1()8,3()2,2[(10
1
])2,1618()2,1616()2,1616()2,1614(2,1615
)2,1618()2,1615()2,1620()2,1614[(10
1
1
22222
22222
22222
2222
1
22
ii xts
Ο παρακάτω πίνακας δίνει τον χρόνο που έκαναν 40 μαθητές για να λύσουν μια άσκηση. Να βρεθεί η διακύμανση & η τυπική απόκλιση, αν =4,5
[ - ) xi νi xi- (xi- )2 (xi- )2νi
0-2 1 8
2-4 3 8
4-6 5 14
6-8 7 6
8-10 9 4
Σύνολο
40
x
x
-3,5
-1,5
0,5
2,5
4,5
x x
12,25
2,250,25
6,25
20,25
98
183,5
37,5
81
238
1
2
iii xx
95,523840
11
1
22
i
ii xxs
x
44,295,52 ss
Συντελεστής Μεταβολής (Συντελεστής Μεταβολής (CV)CV)11
x
Μας βοηθάει στην σύγκριση ομάδων τιμών, που
είτε εκφράζονται σε διαφορετικές μονάδες μέτρησης
είτε εκφράζονται στην ίδια μονάδα μέτρησης, αλλά έχουν σημαντικά διαφορετικές μέσες τιμές.
Ορίζεται για 0, από τον τύπο:
|| x
sCV
Συντελεστής Μεταβολής (Συντελεστής Μεταβολής (CV)CV)22
Είναι ανεξάρτητος από τις μονάδες μέτρησης
Εκφράζεται επί τοις εκατό
Παριστάνει ένα μέτρο σχετικής διασποράς
Συγκρίνοντας τους συντελεστές μεταβολής CV, δύο δειγμάτων Α και Β, για την ίδια μεταβλητή
►Αν sA=sB και CVA>CVB τότε συμπεραίνουμε ότι το δείγμα Α παρουσιάζει μεγαλύτερη διασπορά από το δείγμα Β.
►Αν sAsB , και CVA>CVB τότε συμπεραίνουμε ότι το δείγμα Α παρουσιάζει μεγαλύτερη διασπορά από το δείγμα Β.
BA xx
Συντελεστής Μεταβολής (Συντελεστής Μεταβολής (CV)CV)33
Ένα δείγμα τιμών μιας μεταβλητής είναι ομοιογενές εάν ο
CV≤10%