statistika množičen pojav - matematikamat.sc-nm.si/files/statistika_pros_za_dijake.pdf ·...

20

Click here to load reader

Upload: trinhkhue

Post on 30-Jun-2018

292 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: STATISTIKA Množičen pojav - MATEMATIKAmat.sc-nm.si/files/statistika_pros_za_dijake.pdf · STATISTIKA 1 1. OSNOVNI POJMI Definicija 1: Statistika je veda, ki se ukvarja s proučevanjem

STATISTIKA

1

1. OSNOVNI POJMI

Definicija 1:Statistika je veda, ki se ukvarja s proučevanjem množičnih pojavov vdoločenem prostoru in času.

Množičen pojav:ocenjevanje dijakovmerjenje višin dijakovbranje knjig dijakovsmučanje v Slovenijimerjenje krvnega tlakapromet skozi določeno križiščemesečne plače zaposlenihserijska proizvodnja določenega izdelka

2

Osnovne naloge statistike:zbiranje podatkov (anketiranje, opazovanje, merjenje, štetje)razvrščanje podatkov,urejanje in grafično prikazovanje podatkov,povzemanje in sprejemanje zaključkev (odkrivanje lastnosti inzakonitosti populacije in napovedovanje vrednosti).

3

Definicija 2:Populacija je množica, ki jo želimo statistično proučiti. Statistična enotaje en element populacije.

Populacijo lahko sestavljajo živa bitja, predmeti, dogodki.

Opredelitev populacije:stvarno (kdo ali kaj spada v populacijo in kdo ne)geografsko (kje je populacija opazovana)časovno (kdaj je zajeta)

4

Page 2: STATISTIKA Množičen pojav - MATEMATIKAmat.sc-nm.si/files/statistika_pros_za_dijake.pdf · STATISTIKA 1 1. OSNOVNI POJMI Definicija 1: Statistika je veda, ki se ukvarja s proučevanjem

Definicija 3:Vzorec je podmnožica (del) populacije. Vzorec je slučajen, če imajo vseenote populacije enako možnost (enako verjetnost) biti izbrane v vzorec.

Slučajni vzorec predstavlja (reprezentira) celotno populacijo.

Enostavno slučajno vzorčenje: žrebanje (loterijski način)vzorci s ponavljanjem (enota, ki je bila že izbrana v vzorec, jeponovno izbrana),vzorci brez ponavljanja (enota, ki je bila že izbrana v vzorec, ne morebiti ponovno izbrana).

5

Definicija 4:Preučevano lastnost (značilnost) enote imenujemo statističnaspremenljivka. Vrednost statistične spremenljivke je lastnost eneopazovane enote in jo imenujemo podatek.

PRIMER 1Statistične spremenljivke: višina dijaka, ocena dijaka.

Definicija 5:Parameter je statistična karakteristika populacije.

PRIMER 2Parametri: povprečna višina dijakov, povprečna ocena dijakov.

Število enot populacije označimo z N.

6

Glede na način izražanja podatke ločimo na:opisne (ali kvalitativne): vrednosti le opišemo z besedami in jih nemoremo ovrednotiti numerično (npr. spol, kraj bivanja, barvaavtomobila),vrstne (ali ordinalne): vrednosti lahko uredimo le po velikosti,njihova razmerja pa nimajo pomena (npr. šolska ocena, doseženomesto na tekmi, zadovoljstvo z malico),številske (ali kvantitativne): vrednosti izrazimo numerično oz.številsko. Ločimo diskretne in zvezne številske podatke.

Nezvezne (ali diskretne): zaloga vrednosti končna ali neskončnamnožica realnih števil (npr. število prometnih nesreč, št. prebranihknjig, št. dijakov v razredu).Zvezne: zavzamejo lahko vsako vrednost iz nekega intervala (npr.višina ali teža dijaka, višina žepnine, cena knjig).

7

PRIMER 3V tabeli so zbrani nekateri podatki o podnebju v Sloveniji v letu 2007:

Zap.št. Kraj Pov. temp. (◦ C) Pov. vlaž. (%) Št. dni z dežjem1. Bilje 13,4 71 1292. Bovec 10,7 74 ...3. Letal. J.P.LJ 10,1 80 1134. Celje 11,2 75 1305. Črnomelj 12 77 1426. Ilirska Bistr. 10,8 76 ...7. Kočevje 9,7 79 1438. Kredarica -0,3 77 77...

......

......

Vir: Statistični urad Republike Slovenije

8

Page 3: STATISTIKA Množičen pojav - MATEMATIKAmat.sc-nm.si/files/statistika_pros_za_dijake.pdf · STATISTIKA 1 1. OSNOVNI POJMI Definicija 1: Statistika je veda, ki se ukvarja s proučevanjem

Odgovorite na naslednja vprašanja:1 Kaj je v tem primeru populacija? S katerimi pogoji je opredeljena

(stvarno, časovno, krajevno)?2 Kaj je statistična enota?3 Katere statistične spremenljivke so predstavljene v tabeli?4 Kakšna je posamezna spremenljivka glede na način izražanja?5 Katere parametre populacije bi lahko določili?

9

PRIMER 4Izvedeti želimo, kakšno je mnenje dijakov na ŠC Novo mesto o malici všol. letu 2008/2009. Ker je število dijakov okoli 3000, ne moremo vprašativsakega, zato se odločimo, da bomo oblikovali vzorec velikosti 200 dijakov,ki bo dobro predstavljal celo populacijo. Ali bi bil v ta namen ustrezenvzorec, ki bi zajemal prvih 200 dijakov, ki pridejo v torek zjutraj v šolo?

10

Kdo zbira podatke?

šolebolnišnicepodjetja

...SURS (uradna statistika)EUROSTAT (evropska statistika)EPICENTER, NINAMEDIA (javnomnenjske raziskave)

...

Programski paketi za obdelavo podatkov:Excel, SPSS, SAS, Minitab, Mathlab, S-Plus, . . .

11

2. UREJANJE PODATKOV

Spoznali bomo:ranžirno vrstogrupiranje podatkov

12

Page 4: STATISTIKA Množičen pojav - MATEMATIKAmat.sc-nm.si/files/statistika_pros_za_dijake.pdf · STATISTIKA 1 1. OSNOVNI POJMI Definicija 1: Statistika je veda, ki se ukvarja s proučevanjem

RANŽIRNA VRSTA

Ranžirno vrsto predstavljajo po velikosti urejeni številski podatki.Uporabljamo jo za urejanje majhnega števila številskih podatkov.

Vsakemu podatku določimo zaporedno mesto v ranžirni vrsti, ki gaimenujemo rang.

Enaki podatki stojijo v ranžirni vrsti skupaj in imajo enak rang.Izračunamo ga kot povprečje rangov, ki bi jih podatki imeli, če bi bilirazlični med seboj.

13

PRIMER 5Število potnikov. Na avtobusu, ki vozi vsak dan ob delovnikih ob 14.45iz Novega mesta v Ljubljano, so 12 dni zapored opazovali število potnikov.Rezultati so

20, 38, 28, 35, 30, 40, 22, 32, 35, 32, 45, 35.

Zapišite podatke v ranžirno vrsto in jim določite rang.

Rešitev:

št. potnikov 20 22 28 30 32 32 35 35 35 38 40 45rang

14

GRUPIRANJE PODATKOV

PRIMER 6Poraba mleka. 50 slovenskih družin v neki vasi smo vprašali, koliko mlekaso porabili v prejšnjem tednu. Zbrani podatki v litrih so:

1,1 1,7 1 0,5 0,9 2,1 2,3 2,3 2,6 3,1 3,7 3,9 3,1 2,5 3,3 3,3 3,9 3,8 4,1 44,3 4,4 4,4 5,1 5,9 5,3 5,2 5,7 4,7 4,3 4,2 4,3 4,7 4,2 7,1 7,2 7,5 7,5 7,66,3 6,2 6,1 6,9 8,1 8,2 8,5 9,3 9,2 9,1 9,8

Ali so podatki dovolj pregledni, da lahko povemo kaj o porabi mleka?

15

Grupiranje: združevanje podatkov v skupine (razrede):najprej določimo skupne lastnosti enot v posameznih razredih (od 5do 20 razredov),enote porazdelimo po razredih,vsaka enota mora biti v natanko enem razredu (ne sme se zgoditi, dabi ista enota ustrezala lastnostim dveh razredov ali pa da za kakšnoenoto ne bi obstajal razred, v katerega bi jo uvrstili).

16

Page 5: STATISTIKA Množičen pojav - MATEMATIKAmat.sc-nm.si/files/statistika_pros_za_dijake.pdf · STATISTIKA 1 1. OSNOVNI POJMI Definicija 1: Statistika je veda, ki se ukvarja s proučevanjem

I. Grupiranje številskih spremenljivk v r razredov:

Najmanjša vrednost, ki še sodi v i-ti razred: xi ,minNajvečja vrednost, ki še sodi v i-ti razred: xi ,max

(Absolutna) frekvenca razreda fi : število enot v i-tem razredu

Frekvenčna tabela ali frekvenčna porazdelitev: predstavitev razredov inpripadajočih frekvenc:

razred vrednost spr. fi1. x1,min − x1,max f12. x2,min − x2,max f2...

...r. xr ,min − xr ,max frΣ / N

Frekvenčna porazdelitev številske spremenljivke

17

PRIMER 7Poraba mleka - nadaljevanje. Zbrane podatke grupiraj in vsakemurazredu določi frekvenco.

18

Kaj lahko izračunamo za grupirane podatke?

Relativna frekvenca f ◦i : delež enot v i-tem razredu glede na število vsehenot N, ki smo jih opazovali:

f ◦i =fiN

Strukturni odstotek fi %: relativna frekvenca f ◦i pomnožena s 100 %:

fi % = f ◦i · 100 %

19

Kumulativna frekvenca Fi : število enot, ki imajo manjše vrednosti odspodnje meje i-tega razreda:

F1 = 0 in Fi = Fi−1 + fi−1 (za i > 1)

Relativna kumulativna frekvenca F ◦i : delež vseh opazovanih enot, ki

imajo manjše vrednosti od spodnje meje i-tega razreda:

F ◦i =

Fi

N

20

Page 6: STATISTIKA Množičen pojav - MATEMATIKAmat.sc-nm.si/files/statistika_pros_za_dijake.pdf · STATISTIKA 1 1. OSNOVNI POJMI Definicija 1: Statistika je veda, ki se ukvarja s proučevanjem

Spodnja meja xi ,s in zgornja meja xi ,z razreda: zgornja meja razredai-tega razreda enaka spodnji meji (i + 1)-vega razreda:

xi ,z = xi+1,s

Zvezna spremenljivka: xi ,s = xi ,min in xi ,z = xi ,max

Celoštevilska spremenljivka(dve zaporedni celi števili se razlikujeta za1 - enotski razmik):

xi ,s = xi ,min − 0, 5

xi ,z = xi ,max + 0.5

21

Širina razreda di : razlika med zgornjo in spodnjo mejo razreda

di = xi ,z − xi ,s

Sredina razreda xi : aritmetična sredina spodnje in zgornje meje razreda:

xi =xi ,s + xi ,z

2

Z grupiranjem enot v frekvenčne razrede dodelimo vsem enotam v i-temrazredu isto vrednost xi , s čimer izgubimo nekaj natančnosti pri obdelavipodatkov.

22

PRIMER 8Poraba mleka - nadaljevanje. Za grupirane podatke iz primera o porabimleka izračunajte f ◦i , fi%, Fi , F ◦

i , xi ,s , xi ,z , di , xi .

razred poraba mleka v l fi1. 0−pod 2 52. 2−pod 4 133. 4−pod 6 164. 6−pod 8 95. 8−pod 10 7Σ / 50

Excel: grupiranje: FREQUENCY, nato CTRL-SHIFT-ENTER

23

PRIMER 9Starost oseb. V okulistični ambulanti so včeraj pregledali 45 oseb.Njihove starosti v letih so:

33 32 34 37 18 12 36 38 22 24 27 27 28 29 21 24 25 27 23 15 3 4 16 1315 41 17 19 8 44 45 6 2 7 38 26 25 47 42 25 48 31 35 35 33

Podatke grupirajte v razrede, nato pa za vsak razred izračunajtef ◦i , fi%, Fi , F ◦

i , xi ,s , xi ,z , di , xi .

24

Page 7: STATISTIKA Množičen pojav - MATEMATIKAmat.sc-nm.si/files/statistika_pros_za_dijake.pdf · STATISTIKA 1 1. OSNOVNI POJMI Definicija 1: Statistika je veda, ki se ukvarja s proučevanjem

II. Grupiranje opisnih podatkov

Za vsak razred lahko določimo le relativno frekvenco in strukturni odstotekvsakega razreda.

razred lastnost spr. fi f ◦i fi %

1. lastnost 1 f1 f ◦1 f1 %

2. lastnost 2 f2 f ◦2 f2 %

......

......

r. lastnost r fr f ◦r fr %

Σ / N 1 100

Frekvenčna porazdelitev opisne spremenljivke

25

PRIMER 10Potniki na vlaku. Na vlaku so želeli ugotoviti strukturo potnikov.Razdelili so jih na dijake, študente, delavce, brezposelne in upokojence.Zbrani podatki so:

dijak dijak dijak delavec brezposelen brezposelen brezposelen upokojenecupokojenec dijak dijak dijak dijak dijak dijak dijak študent študent študentštudent delavec delavec delavec delavec dijak dijak dijak dijak dijak dijakštudent študent študent študent študent študent dijak dijak dijak dijakdijak študent študent študent delavec delavec dijak dijak dijak dijakdelavec delavec delavec delavec delavec delavec brezposelen brezposelenbrezposelen študent študent študent delavec delavec delavec upokojenecupokojenec brezposelen brezposelen študent študent študent upokojenecupokojenec delavec upokojenec upokojenec študent študent študentštudent dijak dijak dijak dijak dijak upokojenec upokojenec upokojenecupokojenec

Oblikujte frekvenčno porazdelitev podatkov, nato pa za vsak razredizračunajte f ◦i in fi %. Excel: COUNTIF (pogoj je posamezna kategorija)

26

3. GRAFIČNO PRIKAZOVANJE PODATKOV

Histogram je prikaz grupiranih številskih podatkov v pravokotnemkoordinatnem sistemu s stolpci, kjer vsak stolpec ustreza enemu razredu.Če so razredi enako široki, so višine stolpcev premosorazmerne sfrekvencami razredov.

7

9

16

13

5

0

2

4

6

8

10

12

14

16

18

0 - 2 2 - 4 4 - 6 6 - 8 8 - 10

Poraba mleka v l

Št.

dru

žin

Excel: Stolpični diagram (zmanjšamo presledke med stolpci, primeren zaprikaz številskih podatkov)

27

Frekvenčni poligon je linijski poligon v pravokotnem koordinatnemsistemu, ki povezuje točke, katerih abscise so enake sredinam frekvenčnihrazredov, ordinate pa frekvencam: (xi , fi ). Da grafikon povežemo zabscisno osjo, dodamo še točki (x0, 0) in (xr+1, 0).

5

7

9

13

0 0

16

0

2

4

6

8

10

12

14

16

18

-1 1 3 5 7 9 11

Poraba mleka v l

Št.

dru

žin

Excel: Črtni diagram (primeren za prikaz številskih podatkov)

28

Page 8: STATISTIKA Množičen pojav - MATEMATIKAmat.sc-nm.si/files/statistika_pros_za_dijake.pdf · STATISTIKA 1 1. OSNOVNI POJMI Definicija 1: Statistika je veda, ki se ukvarja s proučevanjem

Strukturni stolpec uporabljamo za prikaz strukturnih odstotkov.Narišemo stolpec poljubne širine in poljubne višine. Višino stolpcaproglasimo za 100 %, nato pa jo razdelimo v razmerju strukturnihodstotkov. Posamezne dele stolpca ponavadi šrafiramo ali pobarvamo zrazličnimi barvami, zato za pojasnitev dodamo legendo.

5

13

16

9

7

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

8 - 10

6 - 8

4 - 6

2 - 4

0 - 2

Excel: Stolpični diagram (primeren za prikaz vrstnih in opisnih podatkov)

29

Tudi strukturni krog uporabljamo za prikaz strukturnih odstotkov. Deleženot v posameznem razredu je prikazan s krožnim izsekom. Velikostsrediščnega kota za vsak razred izračunamo kot odstotek polnega kota:fi % · 360◦. Tudi strukturni krog opremimo z legendo.

0 - 2

10%

2 - 4

26%

4 - 6

32%

6 - 8

18%

8 - 10

14%

Excel: Tortni diagram (primeren za prikaz vrstnih in opisnih podatkov)30

Prikaz s stolpci je podoben histogramu, uporabljamo pa ga lahko zaprikaz grupiranih opisnih ali številskih podatkov. Širina stolpca jepoljubna, višina stolpca pa je premosorazmerna s frekvenco razreda.

Excel: Stolpični diagram (primeren za prikaz vrstnih in opisnih podatkov)

31

PRIMER 11Spodnji grafikon prikazuje zaslužke dijaka preko študentskega servisa venem letu. Primerjajte zaslužke dijaka po mesecih.

32

Page 9: STATISTIKA Množičen pojav - MATEMATIKAmat.sc-nm.si/files/statistika_pros_za_dijake.pdf · STATISTIKA 1 1. OSNOVNI POJMI Definicija 1: Statistika je veda, ki se ukvarja s proučevanjem

PRIMER 12Spodnji grafikon prikazuje iste zaslužke dijaka preko študentskega servisa venem letu kot prejšnji grafikon. V čem je razlika? Kaj lahko zdaj povemoo višinah zaslužkov dijaka po mesecih?

33

4. SREDNJE VREDNOSTI

Srednja vrednost je mera za osredinjenost podatkov. Pove, kje senahajajo podatki. Obravanali bomo tri srednje vrednosti:

medianamodusaritmetična sredina (povprečje)

34

MEDIANA

Definicija 6:Mediana (ali središčnica) je srednja vrednost, od katere ima polovicaenot manjše ali enake vrednosti, polovica pa večje ali enake. Označili jobomo z Me.

Mediano za majhno število podatkov najhitreje določimo tako, da podatkenajprej uredimo po velikosti v ranžirno vrsto, nato izračunamo mesto, nakaterem se nahaja mediana: N+1

2 . Če ta vrednost ni celo število, jemediana povprečje sosednjih dveh vrednosti.

35

PRIMER 13Določite mediano zamud avtobusa v petih dneh: 2, 2, 6, 7, 10 min.Rezultat komentirajte.

PRIMER 14Določite mediano zamud avtobusa v šestih dneh: 2, 2, 6, 7, 10, 15 min.Rezultat komentirajte.

Mediana je določena z mestom v ranžirni vrsti, zato ekstremno veliki (alimajhni) podatki ne vplivajo na njeno vrednost.

Excel: MEDIAN

36

Page 10: STATISTIKA Množičen pojav - MATEMATIKAmat.sc-nm.si/files/statistika_pros_za_dijake.pdf · STATISTIKA 1 1. OSNOVNI POJMI Definicija 1: Statistika je veda, ki se ukvarja s proučevanjem

MODUS

Definicija 7:Modus (ali gostiščnica) je srednja vrednost, ki je enaka tisti vrednostispremenljivke, ki se najpogosteje pojavlja. Označili ga bomo z Mo.

PRIMER 15Določite modus zamud avtobusa v petih dneh: 2, 2, 6, 7, 10 min. Rezultatkomentirajte.

Med podatki je lahko tudi več modusov (tiste vrednosti, ki seenakomnogokrat pojavljajo največkrat).

Excel: MODE

37

ARITMETIČNA SREDINA

Definicija 8:Aritmetična sredina (povprečje) je srednja vrednost, ki jo dobimo tako,da vsoto vseh vrednosti spremenljivke delimo s številom enot v populacijiN. Označili jo bomo z µ:

µ =x1 + x2 + · · · + xN

Nali µ =

ΣNi=1xi

N

Excel: AVERAGE

38

PRIMER 16Izračunajte aritmetično sredino zamud avtobusa v petih dneh: 2, 2, 6, 7,10 min.

1 Rezultat komentirajte.2 Kako bi se spremenila aritmetična sredina, če bi vsaki vrednosti

prišteli 5 min?3 Kolišna bi bila vsota podatkov, če bi vsakega nadomestili z

aritmetično sredino?4 Od vsakega podatka odštejte aritmetično sredino. Kolikšna je vsota

teh vrednosti?

39

Lastnosti aritmetične sredine:Če vsakemu podatku prištejemo isto vrednost a, se tudi aritmetičnasredina poveča za a.Če vsak podatek nadmestimo z aritmetično sredino, ostane vsotapodatkov nespremenjena.Če od vsakega podatka odštejemo aritmetično sredino (izračunamoodklon od aritmetične sredine), je vsota vseh odklonov enaka 0.

PRIMER 17Ali je smiselno izračunati aritmetično sredino spremenljivke spol ali paspremenljivke kraj bivanja? Odgovor obrazloži.

40

Page 11: STATISTIKA Množičen pojav - MATEMATIKAmat.sc-nm.si/files/statistika_pros_za_dijake.pdf · STATISTIKA 1 1. OSNOVNI POJMI Definicija 1: Statistika je veda, ki se ukvarja s proučevanjem

PRIMER 18V skupini je 5 dijakov. Njihova povprečna starost je 15 let. Kaj lahkosklepamo?

1 Da je največ dijakov starih 15 let.2 Da so vsi dijaki stari približno 15 let.3 Da so vsi dijaki stari 15 let.4 Da je polovica dijakov starih manj kot 15 let, polovica pa več kot 15

let.5 Da je vsota starosti vseh otrok v skupini 75 let.

PRIMER 19Povprečna ocena pisne naloge iz matematike petih dijakov je 3,2. Kajlahko poveš o ocenah pisne naloge posameznih dijakov?

41

5. RAZPRŠENOST PODATKOV

Razpršenost (ali variabilnost) je lastnost podatkov, da lahko zavzamejorazlične vrednosti. Podatki so lahko bolj ali manj razpršeni, kar je videti nasliki:

Obravnavali bomo naslednje mere za razpršenost:variacijski razmikstandardni odklon (standardna deviacija)medčetrtinski razmik

42

VARIACIJSKI RAZMIK

Definicija 9:Variacijski razmik je razlika med največjo in najmanjšo vrednostjo vpopulaciji. Označimo ga z VR.

VR = xmax − xmin

PRIMER 20Izračunajte variacijski razmik zamud avtobusa v petih dneh: 2, 2, 6, 7, 10min. Rezultat komentirajte.

Excel: VR = MAX - MIN (izračunamo, ker ni posebnega ukaza)

43

STANDARDNI ODKLON

Definicija 10:Standardni odklon (ali standardna deviacija) je enaka korenu povprečjakvadratov odklonov vrednosti od aritmetične sredine. Označimo ga s σ:

σ =

√ΣN

i=1(xi − µ)2

N

Za uporabo je bolj preprosta formula:

σ =

√ΣN

i=1x2i

N− µ2

Dokaz.

44

Page 12: STATISTIKA Množičen pojav - MATEMATIKAmat.sc-nm.si/files/statistika_pros_za_dijake.pdf · STATISTIKA 1 1. OSNOVNI POJMI Definicija 1: Statistika je veda, ki se ukvarja s proučevanjem

PRIMER 21Izračunaj standardni odklon zamud avtobusa v petih dneh: 2,2,6,7,10 min.Rezultat komentiraj. Kaj bi se zgodilo s standardnim odklonom, če bivsem vrednostim prišteli 5 min?

Kaj pove standardni odklon?Če je porazdelitev spremenljivke simetrična (lahko pogledamo histogram),se približno 2

3 vrednosti spremenljivke nahaja na intervalu [µ − σ, µ + σ].

Excel:standardni odklon: STDEVP

45

ARITMETIČNA SREDINA IN STANDARDNI ODKLONGRUPIRANIH PODATKOV

PRIMER 22Dijaki v T1A, T1B in T1C so pisali pisno nalogo iz matematike.Povprečna ocena dijakov iz T1A je 3,4, povprečna ocena v T1B je 3,2, vT1C pa 2,9. Kolikšna je povprečna ocena dijakov vseh treh razredov?

46

Aritmetična sredina (povprečje) grupiranih podatkov(tudi tehtana aritmetična sredina):

µ =f1xi + f2x2 + · · · + fr xr

Nali µ =

Σri=1fixi

N

Standardni odklon grupiranih podatkov:

σ =

√Σr

i=1fix2i

N− µ2

47

Pri izračunu si pomagamo z razširjeno frekvenčno porazdelitvijo:

razred vrednost fi xi fi xi fi x2i

1. x1,min − x1,max f1 x1 f1x1 f1x21

2. x2,min − x2,max f2 x2 f2x2 f2x22

......

......

...r. xr ,min − xr ,max fr xr fr xr fr x2

rΣ / N / Σr

i=1fi xi Σri=1fi x2

i

48

Page 13: STATISTIKA Množičen pojav - MATEMATIKAmat.sc-nm.si/files/statistika_pros_za_dijake.pdf · STATISTIKA 1 1. OSNOVNI POJMI Definicija 1: Statistika je veda, ki se ukvarja s proučevanjem

PRIMER 23Poraba mleka - nadaljevanje primera. Izračunajte aritmetično sredino instandardni odklon porabe mleka 50 slovenskih družin prejšnji teden v nekivasi.

razred poraba mleka v l fi xi1. 0−pod 2 5 12. 2−pod 4 13 33. 4−pod 6 16 54. 6−pod 8 9 75. 8−pod 10 7 9Σ / 50 /

49

PRIMER 24Starost oseb - nadaljevanje primera Izračunajte aritmetično sredino instandardni odklon starosti oseb, ki so bile včeraj pregledane v okulističniambulanti.

razred starost fi xi1. 1−10 6 5,52. 11−20 8 15,53. 21−30 14 25,54. 31−40 11 35,55. 41−50 6 45,5Σ / 45 /

50

6. KVARTILI IN ŠKATLA Z BRKI

Definicija 11:Trije kvartili razdelijo številske podatke v ranžirni vrsti v štiri skupine:

prvi kvartil Q1 je tista vrednost, od katere je 25 % podatov manjših(ali enakih) in 75 % podatkov večjih (ali enakih) - nahaja se naN+1

4 -tem mestudrugi kvartil Q2 je tista vrednost, od katere je 50 % podatov manjših(ali enakih) in 50 % podatkov večjih (ali enakih) (tudi mediana) -nahaja se na 2(N+1)

4 -tem mestutretji kvartil Q3 je tista vrednost, od katere je 75 % podatov manjših(ali enakih) in 25 % podatkov večjih (ali enakih) - nahaja se na3(N+1)

4 - tem mestu

Če vrednosti N+14 , 2(N+1)

4 in 3(N+1)4 niso celoštevilske, vzamemo za kvartil

povprečje sosednjih vrednosti.

51

S pomočjo kvartilov lahko nazorno pokažemo razpršenost podatkov tako,da narišemo škatlo z brki, za katero potrebujemo poleg kvartilov šenajmanjšo in največjo vrednost med podatki.

Škatlo z brki imenujemo tudi okvir z ročaji ali grafikon kvartilov (ang.box-and-whiskers plot ali box-plot).

Definicija 12:Medčertinski razmik Q je razlika med tretjim in prvim kvartilom. (MedQ1 in Q3 se nahaja 50 % podatkov.)

52

Page 14: STATISTIKA Množičen pojav - MATEMATIKAmat.sc-nm.si/files/statistika_pros_za_dijake.pdf · STATISTIKA 1 1. OSNOVNI POJMI Definicija 1: Statistika je veda, ki se ukvarja s proučevanjem

PRIMER 25V T1A so dijaki zbrali podatke o številu ur, ki so jih prejšnji teden preživeliza računalnikom. Zbrani podatki so:

2, 2, 3, 4, 5, 6, 6, 7, 7, 8, 9, 10, 11, 11, 12, 12, 15, 15, 16, 17, 18, 21, 21,21, 22, 24, 25, 28, 30, 30, 34

1 Izračunajte vse tri kvartile in jih obrazložite.2 Izračunajte medčetrtinski razmik.3 Narišite škatlo z brki.

53

PRIMER 26Na zdravniškem pregledu so stehtali 17 dijakov manjšega razreda. Njihoveteže v kg so:

50, 52, 53, 55, 56, 56, 60, 61, 64, 64, 65, 67, 71, 72, 73, 73, 80

1 Izračunajte vse tri kvartile in jih obrazložite.2 Izračunajte medčetrtinski razmik.3 Narišite škatlo z brki.

54

PRIMER 27Primerjaj osebne dohodke moških in žensk v nekem podjetju na spodnjemgrafikonu. Kaj lahko sklepaš iz slike?

55

PRIMER 28Primerjaj osebne dohodke moških in žensk v nekem podjetju na spodnjemgrafikonu. Kaj lahko sklepaš iz slike?

56

Page 15: STATISTIKA Množičen pojav - MATEMATIKAmat.sc-nm.si/files/statistika_pros_za_dijake.pdf · STATISTIKA 1 1. OSNOVNI POJMI Definicija 1: Statistika je veda, ki se ukvarja s proučevanjem

7. KORELACIJA IN REGRESIJA

PRIMER 29Voznik beleži število kilometrov, ki jih prevozi s svojim avtomobilom, inporabo goriva pri vsaki vožnji. Ugotoviti želi, kako je poraba gorivapovezana s številom prevoženih kilometrov.

Kateri statistični spremenljivki nastopata v primeru?Ali bo pri različnih vožnjah, ko bo prevozil enako število kilometrov,vedno porabil enako količino goriva?Koliko goriva bo porabil za vožnje, pri katerih bo prevozil manj km, vprimerjavi z vožnjami, pri katerih bo prevozil več km?Razmisli, kaj vpliva na porabo goriva.

57

Spremenljivka X : število prevoženih kilometrovSpremenljivka Y : količina porabljenega goriva

Povezanost med številskima spremenljivkama X in Y imenujemokorelacija.

Povezanost spremenljivk lahko prikažemo v pravokotnem koordinatnemsistemu, če eno od spremenljivk proglasimo za neodvisno in drugo zaodvisno. Tako dobljeni diagram imenujemo razsevni diagram.

58

Razsevni diagram:

Razsevni diagram

Excel: Raztreseni (XY)

59

Spremenljivki X in Y sta povezani linearno, če točke v razsevnemdiagramu ležijo na isti premici ali pa se od nje bolj ali manj odklanjajo(ovalna oblika množice točk v razsevnem diagramu).

Premico, ki se najbolj prilega točkam, imenujemo regresijska premica.

Ločimo pozitivno in negativno linearno povezanost:Pozitivna linearna povezanost: večje vrednosti spremenljivke X sopovezane z v povprečju večjimi vrednostmi spremenljivke Y .(regresijska premica je naraščajoča)Negativna linearna povezanost: večje vrednosti spremenljivke X sopovezane z v povprečju manjšimi vrednostmi spremenljivke Y .(regresijska premica je naraščajoča)

Excel: Enačba regresijske premice: na grafikonu kliknemo z desnimgumbom miške na eno točko in izberemo ’Dodaj trendno črto’. Podmožnostmi izberemo ’Prikaži enačbo na grafikonu’.

60

Page 16: STATISTIKA Množičen pojav - MATEMATIKAmat.sc-nm.si/files/statistika_pros_za_dijake.pdf · STATISTIKA 1 1. OSNOVNI POJMI Definicija 1: Statistika je veda, ki se ukvarja s proučevanjem

poz.lin. povezanost neg.lin. povezanost

ni lin. povezanosti ni povezanosti61

Moč linearne povezanosti kaže Pearsonov koeficient r , kateregavrednosti se nahajajo na intervalu [−1, 1].

Moč linearne povezanosti med spremenljivkama X in Y je lahko:

- močna pozitivna, če je 0.75 ≤ r < 1;- srednje močna pozitivna, če je 0.4 ≤ r < 0.75;- šibka pozitivna, če je 0 ≤ r < 0.4;- ni linearne povezanosti, če r = 0;- šibka negativna, če je −0.4 < r < 0;- srednje močna negativna, če je −0.75 < r ≤ −0.4;- močna negativna, če je −1 < r ≤ −0.75.

Excel: PEARSON

62

PRIMER 30Voznik je za 12 voženj zabeležil število prevoženih kilometrov in porabogoriva v litrih. Rezultati so prikazani v tabeli:

Kilometri 20 35 60 35 65 50 40 25 25 45 10 15Gorivo 2,5 3,8 6 4 5,5 4 3,5 2,5 3 4 1,8 2

1 Narišite razsevni diagram (v zvezek in z Excel).2 Izračunajte Pearsonov koeficient korelacije (z Excel). Kakšno

povezanost kaže?3 Določite enačbo regresijske premice (z Excel). Premico vrišite v

razsevni diagram.4 Koliko goriva bo v povprečju porabil voznik za 42 km?

63

8. ČASOVNE VRSTE

Mnogi pojavi se spreminjajo s časom. Če podatke uredimo glede natrenutek ali obdobje, ki ga opisujejo, dobimo časovno vrsto. Analiziranječasovne vrste nam lahko pomaga razumeti spremembe in napovedativrednosti v prihodnosti.

Definicija 13:Časovna vrsta je niz istovrstnih podatkov v zaporednih časovnih trenutkihali v posameznih zaporednih časovnih intervalih.

Grafični prikaz podatkov: podatke prikažemo z linijskim grafikonom, kjerna vodoravno os nanašamo čas, na navpično os pa vrednosti opazovanihpodatkov.

64

Page 17: STATISTIKA Množičen pojav - MATEMATIKAmat.sc-nm.si/files/statistika_pros_za_dijake.pdf · STATISTIKA 1 1. OSNOVNI POJMI Definicija 1: Statistika je veda, ki se ukvarja s proučevanjem

PRIMER 31Poraba električne energije. Dijak je doma 7 tednov beležil tedenskoporabo električne energije. Podatki so zbrani v tabeli:

Zap. št. (k) teden kWh1 1. teden 1092 2. teden 983 3. teden 1024 4. teden 1035 5. teden 956 6. teden 907 7. teden 92

Podatke prikažite z linijskim grafikonom in izračunajte povprečno tedenskoporabo.

65

Definicija 14:Linearni trend je premica y = kx + n, ki podaja dolgoročno smer razvojačasovne vrste.

Njeno enačbo bomo določili s programom Excel.

V enačbi linearnega trenda je x zaporedna številka obdobja. Koeficient kpove, za koliko se spremeni vrednost y , ko se x poveča za 1 obdobje.

Linearni trend bomo vrisali v linijski grafikon s programom Excel. Spomočjo trenda lahko izračunamo napoved vrednosti y za vnaprej.

Opomba: linearni trend je poseben primer regresijke premice.

Excel: na sliki kliknemo z desnim gumbom miške na eno točko in izberemo’Dodaj trendno črto’. Pod možnostmi izberemo ’Prikaži enačbo nagrafikonu’.

66

PRIMER 32Za primer porabe električne energije s programom Excel vrišite linearnitrend. Napovejte, kolikšno porabo električne energije lahko pričakujemo 8.teden.

67

PRIMER 33Spodnji grafikon prikazuje upad vrednosti delnice v zadnjih 18 mesecih. Alije trend upada linearen?

68

Page 18: STATISTIKA Množičen pojav - MATEMATIKAmat.sc-nm.si/files/statistika_pros_za_dijake.pdf · STATISTIKA 1 1. OSNOVNI POJMI Definicija 1: Statistika je veda, ki se ukvarja s proučevanjem

Kaj lahko še izračunamo za časovno vrsto?

Indeks s stalno osnovo Ik/0 je v odstotkih izraženo razmerje medpodatkom Xk v trenutku ali intervalu k in podatkom X0 v vnaprej izbranemtrenutku ali intervalu. Indeks s stalno osnovo torej izračunamo po formuli:

Ik/0 =Xk

X0· 100

Verižni indeks Ik je v odstotkih izraženo razmerje med podatkom Xk vtrenutku ali intervalu k in podatkom Xk−1 v prehodnem trenutku aliintervalu k − 1. Verižni indeks izračunamo po formuli:

Ik =Xk

Xk−1· 100

69

Stopnja rasti Sk je v odstotkih izražena razlika med podatkoma Xk inXk−1 glede na podatek Xk−1. Izračunamo jo po formuli:

Sk =Xk − Xk−1

Xk−1· 100

Povprečna stopnja rasti S je stopnja, s katero bi morali zaporednospreminjati podatke v časovni vrsti, da bi iz podatka v prvem trenutku aliintervalu dobili podatek v zadnjem trenutku ali intervalu. Izračunamo jopo formuli:

S = 100

(n−1

√Xn

X1− 1

)

70

Trenutke ali obdobja, podatke ter indekse in stopnje pregledno prikažemov tabeli:

razred (k) obdobje Xk Ik/0 Ik Sk1 X1 I1/0 I1 S12 X2 I2/0 I2 S2...

......

......

n Xn In/0 In Sn

71

PRIMER 34Za primer porabe električne energije izračunajte indekse s stalno osnovoglede na prvi teden, verižne indekse, stopnje rasti ter povprečno stopnjorasti.

Rešitev: Rezultati so podani v tabeli:

Zap. št. teden kWh Ik/1 Ik Sk1 1. teden 109 100 / /2 2. teden 98 89,9 89,9 -10,13 3. teden 102 93,6 104,1 4,14 4. teden 103 93,6 101,0 1,05 5. teden 95 87,2 92,2 -7,86 6. teden 90 82,6 94,7 -5,37 7. teden 92 84,4 102,2 2,2

Excel: oblikujemo formule za posamezne celice.

72

Page 19: STATISTIKA Množičen pojav - MATEMATIKAmat.sc-nm.si/files/statistika_pros_za_dijake.pdf · STATISTIKA 1 1. OSNOVNI POJMI Definicija 1: Statistika je veda, ki se ukvarja s proučevanjem

Povprečna stopnja rasti:

S = 100

(n−1

√Xn

X1− 1

)= 100

(6

√92109

− 1

)= −2, 79

Če bi se poraba električne energije vsak teden zmanjšala za 2, 79%, bi se izzačetne porabe 109 kWh v prvem tednu zmanjšala na 92 kWh v sedmemtednu.

73

Kontingenčna tabela

Definicija 15:Kontingenčna ali dvorazsežna tabela prikazuje podatke po vrednostih dvehopisnih spremenljivk hkrati.

PRIMER 35225 dijakov srednje šole smo vprašali o zadovoljstvu s šolsko malico.Rezultati so zbrani v tabeli:

letnik/zadovoljstvo zadovoljen nezadovoljen1. letnik 35 152. letnik 45 153. letnik 35 104. letnik 20 50

Kaj lahko povemo o zadovoljstvu anketiranih dijakov z malico?

74

Rešitev:

Za boljši pregled nad podatki, dodamo še vrstico ’skupaj’ in stolpec’skupaj’:

letnik/zadovoljstvo zadovoljen nezadovoljen skupaj1. letnik 35 15 502. letnik 45 15 603. letnik 35 10 554. letnik 20 50 70skupaj 135 90 225

75

Struktura anketiranih dijakov po zadovoljstvu s šolsko malico za vsakletnik:

letnik/zadovolj. zadovoljen % nezadov. % skupaj %1. letnik 35 70,0% 15 30,0 % 50 100 %2. letnik 45 75,0% 15 25,0 % 60 100%3. letnik 35 77,8% 10 22,2 % 55 100 %4. letnik 20 28,6% 50 71,4 % 70 100 %skupaj 135 60,0% 90 40,0 % 225 100 %

Strukturo prikažite tudi grafično.

76

Page 20: STATISTIKA Množičen pojav - MATEMATIKAmat.sc-nm.si/files/statistika_pros_za_dijake.pdf · STATISTIKA 1 1. OSNOVNI POJMI Definicija 1: Statistika je veda, ki se ukvarja s proučevanjem

77

Struktura anketiranih dijakov po letnikih za vsako od mnenj o zadovoljstvus šolsko malico:

letnik/zadovolj. zadovoljen % nezadov. % skupaj %1. letnik 35 25,9 % 15 16,7 % 50 22,2 %2. letnik 45 33,3 % 15 16,7 % 60 26,7 %3. letnik 35 25,9 % 10 11,1 % 55 20,0 %4. letnik 20 14,8 % 50 55,6 % 70 31,1 %skupaj 135 100 % 90 100 % 225 100 %

Strukturo prikažite tudi grafično.

78

79

PRIMER 36Odrasle moške in ženske so vprašali, ali imajo vozniški izpit ali ne. Podatkiso zbrani v spodnji tabeli. Oblikujte kontingenčno tabelo. Izračunajtestrukturo podatkov po spolu in strukturo po imetju vozniškega izpita ter juprikažite grafično.

spol vozniški izpitmoški daženska daženska nemoški nemoški daženska daženska damoški daženska neženska damoški ne

Nalogo rešite s programom Excel (vrtilna tabela).

80