treguesit e lokalizimit dhe te variacionit
Post on 18-May-2015
2.846 Views
Preview:
TRANSCRIPT
Në këtë kaptinë ju do të mësoni:
Të përshkruani karakteristikat e madhësivemesatare, variacionit dhe formën e shpërndarjes së të dhënave numerike.
Të llogaritni treguesit deskriptiv për mostërdhe populacion dhe të bëni dallimet në mes tëtyre.
Të llogaritni treguesit relativ të variacionit
Të kuptoni se si përdoret Excel për llogaritjen e statistikave përshkruese.
Matësit e tendencës qendrore, variacionit dhe forma e shpërndarjes◦ Mesatarja aritmetike, mediana, moda, mesatarja
gjeometrike
◦ Rangu, Rangu i interkuartilit, varianca dhe devijimi standard, koeficienti i variacionit
Përmbledhje e matësve të popullimit
◦ Mesatarja, varianca, dhe devijimi standard
◦ , etj
Mesatarja aritmetike
Mediana
Moda
Përshkrimi i të dhënave numerike
Varianca
Devijimi standard
Koeficienti i variacionit
Rangu
Interkuartili i rangut
Mesatarja gjeometrike
Asimetria
Tendenca qendrore Variacioni Forma e
shpërndarjesKuartilet
Tendenca qendrore
Mes. aritmetike Mediana Moda Mes. gjeometrike
n
X
X
n
i
i 1
1 2( )nnG X X X
Vështrim
Vlera e mesit
e të dhënave
të renditura
Vlera e
shfaqur më
së shpeshti
Mesatarja aritmetike është treguesi më i shpeshtë që mat tendencën qendrore të dhënave◦ Për mostër me madhësi n:
Madhësia e
mostrës
n
XXX
n
X
X n21
n
1i
i
Vlerat e vrojtuara
Matësi më i shpeshtë i tendencës qendrore
Mesataja = shuma e vlerava e ndarë për numrin e vlerave
E ndikuar nga vlerat ekstreme (outliers)
(vazhdim)
0 1 2 3 4 5 6 7 8 9 10
Mesatarja = 3
0 1 2 3 4 5 6 7 8 9 10
Mesatarja = 4
35
15
5
54321
4
5
20
5
104321
Në një renditje të dhënave mediana është vlera e “mesit” ( 50% mbi dhe 50% nën)
Nuk ndikohet nga vlerat ekstreme
0 1 2 3 4 5 6 7 8 9 10
Median = 3
0 1 2 3 4 5 6 7 8 9 10
Median = 3
Vendi i medianës/Rangu i medianës/Pozita e medianës
◦ Nëse numri i të dhënave është tek, medianë është numri imesit.
◦ Nëse numri i të dhënave është qift, mediana ështëmesatare aritmetike e dy numrave të mesit
Veni re nuk është vlera e medianës, por
vetëm pozita e medianës në të dhënat e rregullura.
1
2
nPozitae medianes pozicioni ne te dhenat e renditura
2
1n
Matës i tendencës qendrore;
Vlera që paraqitet më së shpeshti;
Nuk ndikohet nga vlerat ekstreme;
Përdoret për të dhënat numerike dhe nominale;
Mund të mos ketë modë;
Mund të ketë disa moda.
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Moda = 9
0 1 2 3 4 5 6
Ska Mode
Pesë shtëpi afër plazhit
$2,000 K
$500 K
$300 K
$100 K
$100 K
Çmimet e shëpive:
$2,000,000
500,000
300,000
100,000
100,000
Mes. aritmetike: ($3,000,000/5) = $600,000
Mediana: Vlera e mesit e tëdhënave të rregulluara
= $300,000
Moda: Vlera e shfaqur më sëshpeshti
= $100,000
Çmimet e shtëpive:
$2,000,000
500,000
300,000
100,000
100,000
Sum $3,000,000
Mes. Aritmetike në përgjithësi përdoret, edhe pse ekzistojnë vlerat ekstreme
Mediana shpesh përdoret, meqë mediana nuk është e ndieshme ndaj vlerave ekstreme.
◦ Shembull: Çmimi medial i shtëpive do të mund të raportohej për regjionin- sepse është më pak e ndieshme ndaj vlerave ekstreme
E dobishme për gjetjen e ndryshimeve mesatare të përqindjeve, normave , indekseve dhe normës së rritjes përgjatë kohës.
Ka aplikim shumë të gjerë në biznes dhe ekonomi sepse ne jemi të interesuar në gjetjen e ndryshimeve në përqindje, ndryshimeve në shitje, paga ose në tregues të tjerë ekonomik si GDP të cilat ndërtohen prej një vit në një vit tjetër.
Mesatarja gjeometrike gjithmonë do të jetë më e vogël ose e barabartë me mesataren aritmetike.
Mesatarja gjeometrike e një grumbulli të dhënash definohet si rrënja e n të prodhimit të n vlerave.
Formula për mesataren gejometrike është :
1 2( )nnG X X X
Shembull:
Supozojmë se individi “X” ka rritje të pages 5% në këtë vit dhe15% në vitin e ardhshëm. Rritja mesatare është 9.886% e jo10%.
Vertetim:
Rritja e pare: 3000x0.05 = 150
Rritja e dytë: 3150x0.15 = 472
Gjithsej rritja= 150+472=622.50, kjo është ekuivalente me:
3000x0.9886=296.58
3296.58x 0.9886= 325.90
Gjithsej rritja: 296.58+ 325.90=622.48 =622.50
1.05 1.15 1.2075 1.09886 1 0.09886 100 9.886%
1.09886 100 109.886 100 9.886%
G x
ose
Një përdorim tjetër i mesatares gjeometrike është gjetja e normës mesatare të rritjes së shitjeve , prodhimit, apo ndonjë kategorie tjetër ekonomike prej një periudhe në një periudhë tjetër.
Formula për kësi lloj problemesh është:
1
1nn
NG
N
Të dhënat e periudhës së fundit
Të dhënat e periudhës së
fillimitNumri i viteve
Në vitin 1950 në Organizatën e Kombeve të Bashkuara kanë qenë të anëtarësuara 50 shtete. Në vitin 1996 ky numër është rritur në 185 shtete. Sa është norma mesatare vjetore e rritjes së anëtarësimit për këtë periudhë.
46185
1 0,0288550
G
Norma mesatare e shtimit është 2,885%0,02885x100=2.885%
Mesatarja aritmetike e ponderuar Mesatarja aritmetike e ponderuar është rast
i veçantë i mesatares aritmetike dhe llogaritet në rastet kur ka disa vrojtime në të njejtën modalitet, gjegjësisht kur të dhënat grupohen në distribucionin e frekuencave.
Mesatarja aritmetike e ponderuar llogaritet në rastet ku përveç vlerave të X janë edhe të dhënat për denduritë, gjegjësisht kur frekuencat nuk janë të barabarta , ashtu që njëri modalitet peshon me shumë e tjetri më pak.
Mesatarja aritmetike e ponderuar quhet edhe mesatare aritmetike e “peshuar”
Formula për llogaritjen e mesatares aritmetike të ponderuar është:
Simbolet:1
1
nf Xi i
iX nfi
i
(iks bar)-prezanton simbolin për mesataren
aritmetike të mostrës
f- frekuencat në çdo klasë
fx - është prodhimi i frekuencave me vlerat e x
X - prezanton vlerat individuale të çdo modaliteti
fx - prezanton shumën e përgjithshme të këtyre
produkteve.
X
Kompania ndërtimore paguan në orë punëtorët e
vet: $16.50, $19.00, ose $25.00 në orë. Gjithësej
janë të punësuar 26 punëtorë, 14 prej tyre
paguhen me $16.50 në orë, 10 prej tyre me
$19.00 në orë, dhe 2 prej tyre $25.00 ne orë.
Mesatarisht sa paguhen punëtorët e kësja firme?
14 16,5$ 10 19$ 2 26$ 47118.1154$
14 10 2 261
1
x x x
nf Xi i
iX nfi
i
Pagat ($)
(X)
Nr.i punëtorëve
(f)
(X)x(f)
16.5 14 231
19.0 10 190
25.0 2 50
Σ 26 471
1
1
47118,1154$ 18$
26
n
i i
i
n
i
i
X f
X
f
Pagat ($) (X) Nr.i
punëtorëve (f)
Frekuencat
.kumulative
16.5 14 14
19.0 10 24
25.0 2 26
Σ 26
Për gjetjen e Medianës duhettë gjejme frekuencatkumulative dhe pozitën e medianësRme=Σf/2+1= 26/2+1=14
Me = 16.5& $
Moda është vlera qëpërsëritet më së shpeshti. Ne rastin konkretModa=16.5,$ sepse numrimë i madh i punëtorëvemerr ketë pagë
Mesatarja aritmetike
Eksporti ne
(000€) Nr. i firmave
Mesi i
intervalit (X)0 deri4 25 2 504 deri 8 35 6 2108 deri 12 42 10 42012 deri16 35 14 49016 deri 20 25 18 450
162 1620
X f
Se pari gjejme mesin e intervalit
Frekuencat Shumëzojmëfrekuencat me mesin
e intervalit
1
1
162010$
162
n
i i
i
n
i
i
X f
X
f
X
Mediana, shembull
Eksporti ne
(000€) Nr. i firmave
Frekuencat
kumulative0 deri4 25 254 deri 8 35 (w1) 608 deri 12 (fme ) 42 10212 deri16 35 13716 deri 20 25 162
162
Se pari ,gjejme Frekuencat kumulativeSe dyti, gjejmë pozitën e medianës: Rme=Σf/2+1=162/2+1=82
Elementi i 82 gjindet në grupin 8 deri 12; X1 = 8; d= 4
Frekuencat
11
/ 2
81 608 4 10$
42
me
f wMe X d
f
Me
Formula për gjetjene medianës
Pse duhet të studjohet variacioni?◦ Madhësitë mesatare si mesatarja aritmetike ose
mediana , përshkruajnë vetëm qendrën e të dhënave. Kjo është e vlefshme nga ky këndvështrim, mirëpo neve nuk na tregon asgjë rreth shpërndarjes së të dhënave.
◦ Per shembull , nëse të dhënat ju thonë se thellësia mesatare e lumit është 3 këmbë thellë, a do të vendosni që të kaloni lumin këmbë. Sipas të gjitha gjasave jo. Ju doni të dini edhe informata shtesë rreth variacionit të thesllësisë së lumit.
◦ Arsye e dytë për të studjuar dispersionin në një grumbull të dhënave është që të bëhet krahasimi i shpërndarjes në dy apo më shumë distribucione.
Qendra e njejtë,
Variacione te ndryshme
Variacioni
Varianca Devijimi
standard
Koeficienti i
variacionit
Rangu Rangu i
interkuartilit
Treguesit e variacionit
japin informata për
shpërndarjen e
variabilitetit të vlerave të
dhënave .
Treguesi më i thjeshtë i variacionit
Diferenca në mes të vlerës më të madhe dhe vlerës më të vogël në një grumbull të dhënash:
Rangu = Xmax – Xmin
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Rangu = 14 - 1 = 13
Shembull:
Nuk e përfill rregullin e renditjes së të dhënave
I ndieshëm ndaj vlerave ekstreme
7 8 9 10 11 12
Range = 12 - 7 = 5
7 8 9 10 11 12
Range = 12 - 7 = 5
1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,5
1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120
Range = 5 - 1 = 4
Range = 120 - 1 = 119
Mund të eliminohen disa probleme me vlera ekstreme përmes rangut të interkuartilit
Eliminon disa vlera të vrojtuara të larta dhe të ulta dhe mund të llogarit rangun nga vlerat e mbetura.
Rangu i interkuartilit= Kuartili i 3të – Kuartili i 1rë = Q3 – Q1
Mediana
(Q2)X
maximumXminimum Q1 Q3
Shembull:
25% 25% 25% 25%
12 30 45 57 70
Rangu i interkuartilit
= 57 – 30 = 27
Mesatare (e përafërt ) e devijimeve të ngritura në katror të vlerave nga mesatarja e tyre.
◦ Varianca e mostrës:
1-n
)X(X
S
n
1i
2
i2
Ku= mesatarja aritmetike
n = madhësia e mostrës
Xi = ith vlerat e variablës X
S2 – simboli për variancë
X
Treguesi më i shpeshtë i matjes së variacionit;
Tregon variacionet rreth mesatares;
Është rrënja katrore e variancës;
Shprehet në njësi të njejta të matjes sikurse edhe të dhënat.
◦ Devijimi standard i mostrës:
1-n
)X(X
S
n
1i
2
i
Te dhënat e
Mostrës (Xi) : 10 12 14 15 17 18 18 24
n = 8 Mesatarja = X = 16
Matës i devijimeve “mesatare”
rreth mest. aritmetike.
Mes. = 15.5
S = 3.33811 12 13 14 15 16 17 18 19 20 21
11 12 13 14 15 16 17 18 19 20 21
Të dhënat B
Të dhënat A
Mest. = 15.5
S = 0.926
11 12 13 14 15 16 17 18 19 20 21
Mest. = 15.5
S = 4.567
Të dhënat C
Mat shumë mirë variabilitetin e të dhënave.
► Ka lidhje të ngusht me mesataren aritmetike.
► Është shumë i rëndësishëm për zhvillimin e teorisë statistikore.
► Gjindet lehtë përmes softverëve!
Matës i variacionit relativ
Gjithmonë shprehet në përqindje (%)
Tregon variacionin relativ në raport me
mesataren.
Mund të përdoret për krahasimin e dy apo
më shumë variabiliteve të shprehura në njësi
të ndryshme të matjes.
Fletëaksioni A:
◦ Çmimi mesatar vitin e kaluar= $50
◦ Devijimi standard= $5
Fletëaksioni B:
◦ Çmimi mesatar vitin e fundit = $100
◦ Devijimi standard = $5
Të dy
fletëaksionet
kanë devijim
standard të
njejtë, mirëpo
fletëaksioni B
është më pak
variabil rreth
çmimit të tij.
Statistikat deskriptive mund të gjinden përmes Microsoft® Excel
◦ Përdorni zgjedhjet e menysë:
Data / data analysis / descriptive statistics
◦ Shkruani detajet në kutinë e dialogut
Nëse në menynë Datanuk gjindet data
analysis, atëherë duhettë instaloni këtë menysipas procedurave tëprezantuara në fotot
vijuese sipas hapave 1, 2, 3,4, 5, 6, 7, 8)
Pasi keni përfunduar me proceduren e instalimit (1 deri 8) në menynë “Data” do të paraqitetmenyja e re “Data Analysis”, e cilaka shumë zgjedhje rreth metodavestatistikore, per qëllime tëstatistikave përshkruese do të
zgjedhim “Descriptive statistics”
Shkruani detajet ne kutine e dialogut
Kontrolloni kutinë për “Sumary Statistics”
Klikoni OK
(vazhdim)
Rezultati i statistikave
deskriptive
përmes Excel-it,
Shfrytëzimi i të dhënave për
çmimet e shtëpive:
Çmimet e shtëpive:
$2,000,000
500,000
300,000
100,000
100,000
Treguesit përmbledhës të populacionit quhen
parametera
Mesatarja e populimit është shuma e vlerave në
populacion e ndarë me madhësinë e populacionit
N
N
XXX
N
XN21
N
1i
i
μ = mesatarja e popullimit
N = Madhësia e popullimit
Xi = ith vlerat e variablës X
Ku
Mesatare e devijimeve të ngritura në katrortë vlerave nga mesatarja e tyre.
◦ Varianca e populacionit:
N
μ)(X
σ
N
1i
2
i2
Ku σ2= Varianca e populimit
N = Madhësia e populimit
Xi = ith vlerat e variablës X
Matësi më i shpeshtë i variacionit
Tregon variacionet rreth mesatares
Është rrënja katrore e variancës së popullimit
Ka njësi të njejtë të matjes sikurse të dhënat origjinale
◦ Devijimi standard i populimit:
N
μ)(X
σ
N
1i
2
i
Populacioni Mostra
Madhësia N n
Mesatarja
Varianca
Devijimistandard
1
N
i
i
X
N
n
X
X
n
i
i 1
1-n
)X(X
S
n
1i
2
i
N
μ)(X
σ
N
1i
2
i2
1-n
)X(X
S
n
1i
2
i2
N
μ)(X
σ
N
1i
2
i
top related