Download - bazele statisticii (1)
-
8/20/2019 bazele statisticii (1)
1/38
Anul I, CSIE 2011-2012Statistica I
Exercitii pregatitoare pentru testul de la seminar si pentru examen – partea I
Ex. 1. Următoarea serie de date arată preţul de vânzare sute lei! pentru 1" lucrări de #ra$icăla o licitaţie de o%iecte de artă& '1, (0, )2, "', "2, '), (", (1, *+, "", (), '*, ")Sta%iliţi valoarea de adevăr a următoarelor a$irmaţii, usti$icând răspunsurile&
a) 2' . dintre lucrarile licitate s-au vandut pentru un pret mai mic de *+ sute de lei/b) umatate dintre lucrarile licitate au un pret mai mic sau e#al cu '* sute lei/c) 2' . dintre lucrari s-au vandut cu cel putin (2 sute de lei/d) pentru )'. dintre o%iecte s-a o%tinut un pret de cel putin "( sute lei/e) precizati care dintre urmatoarele valori& 2', 2, 1(, *0, 12*, +', ,+ sute lei sunt
outliers in raport cu datele initiale
Rezolvare:Cele n1" valori ale seriei de date se ordonează crescător& x1!"2, x2!"", x"!"', x*!"), x'!*+, x(!'1, x)!'*, x+!'), x!(0, x10!(1, x11!(", x12!(), x1"!)2
Q1 cuartila de ordinul 1 sau cuartila in$erioara
3ocul lui Q1 este
∉=⋅+
=⋅+
'0,"1*
11"1
*
1n
N, dar " 4 ",'0 4 *
( ) ( )*1" xQ x ≤≤⇒
si
( ) ( )"(
2
")"'
2
*"
1 =+
=+
= x x
Q
sute lei
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
.)'
1"121110+)('*
"(
.2'
"21
1
x x x x x x x x x x x x x
Q
≤≤≤≤≤≤≤≤≤≤≤≤↑
Cu interpretarea&
• 2' . dintre termenii seriei au valori mai mici decat "( sute lei Q1 este percentila de ordinul 2'!,iar )'. dintre termenii seriei au valori mai mari ca "( sute lei/
sau• 2'. dintre lucrarile de #ra$ica licitate s-au vandut pentru un pret mai mic decat "( sute lei, iar
restul de )'. dintre ele s-au vandut cu un pret mai mare de "( sute lei
Q2 Me cuartila de ordinul 2 sau mediana seriei de date statistice
3ocul lui Q2 Me este
∈=+
=+
)2
11"
2
1n
N ( ) '*) ==⇒ x Me
sute lei
-
8/20/2019 bazele statisticii (1)
2/38
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
.'0
'*
.'0
1"121110+)('*"21
Me
x x x x x x x x x x x x x
↑
≤≤≤≤≤≤≤≤≤≤≤≤
Cu interpretarea&• umatate dintre termenii seriei au valori mai mici ca '* sute lei Me este percentila de ordinul '0!,
iar restul au valori mai mari ca '* sute lei/sau
• umatate dintre lucrarile de #ra$ica licitate s-au vandut cu mai putin de '* sute lei, iar restul s-auvandut cu un pret mai mare de '* sute lei
Q" cuartila de ordinul " sau cuartila superioara
3ocul lui Q" este∉=⋅+=⋅+ '0,10"*
11""*
1n
N, dar 10 4 10,'0 4 11
( ) ( )11"10 xQ x ≤≤⇒ si
( ) ( )(2
2
("(1
2
1110
" =+
=+
= x x
Q
sute lei
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
.)'
1"1211
(2
.2'
10+)('*"21
"
x x x x x x x x x x x x x
Q
≤≤≤≤≤≤≤≤≤≤≤≤↑
Cu interpretarea&• )' . dintre termenii seriei au valori mai mici decat (2 sute lei Q" este percentila de ordinul )'!,
iar 2'. dintre termenii seriei au valori mai mari ca (2 sute lei/sau
• )'. dintre lucrarile de #ra$ica licitate s-au vandut pentru un pret mai mic decat (2 sute lei,iar restul de 2'. dintre ele s-au vandut cu un pret mai mare de (2 sute lei
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
.2'
1"1211
(2
.'0
10+)('*
"(
.2'
"21
"1
x x x x x x x x x x x x x
QQ
≤≤≤≤≤≤≤≤≤≤≤≤↑↑
5umatate din termenii din milocul seriei au valori cuprinse intre Q1"( sute lei siQ"(2 sute lei
A%aterea intercuatilica este IQRQ"-Q12( sute lei
Definitie& Spunem ca o valoare x este outlier pentru un set de date statistice numerice daca&
-
8/20/2019 bazele statisticii (1)
3/38
-
8/20/2019 bazele statisticii (1)
4/38
Unde A – nivelul cel mai slab, E – nivelul cel mai inalt.
Construiti distributia de frecvente absolute si reprezentati-o grac.
Studiati tendinta centrala a distributiei folosind indicatori adecvati.
Calculati media si dispersia unei variabile alternative, a carei stare favorabila este data de c
Ex. !. 6entru " de actrite care au o%tinut premiul 9scar se cunoaste varsta, in ani impliniti,la momentul casti#arii premiului&
'0, **, "', +0, 2(, 2+, *1, 21, (1, "+, *, "", )*, "0, "", *1, "1, "', *1, *2,"), 2(, "*, "*, "', 2(, (1, (0, "*, 2*, "0, "), "1, 2), ", "*, 2(, 2', "" ani
Se cere&a) sa se determine si sa se interpreteze indicatorii tendintei centrale si cuartilele acestei
serii de date/b) sa se construiasca dia#rama %o8-plot sau dia#rama cu mustati %o8-and-:;is
-
8/20/2019 bazele statisticii (1)
5/38
o @edia unei serii simple de date numerice{ }
n x x x ,,, 21 este
n
x
n
x x x x
n
i
i
n
∑==
+++= 121
In cazul acestei serii, varsta medie a unei actrite din esantion care a casti#at premiul 9scar
este
102',"+"
1*+(
""
"
1"21 ===+++
=∑=i
i x x x x
x
anio 6entru a determina mediana, vom proceda ast$el&
- seria simpla de date se ordoneaza crescator( ) ( ) ( )n x x x ≤≤≤ 21
, unde
( ) ni x i ,1, = este elementul cu ran#ul i din seria ordonata crescator,
- locul medianei este
( ) "*202
120 ==⇒∈=+ x Men N
ani5umatate dintre actritele din selectie au o%tunut premiul 9scar la o varsta de cel mult "*de ani umatate dintre actritele din esantion au casti#at premiul 9scar la o varsta de peste"* de ani!
o E8ista doua valori care au $recventa ma8ima si anume valorile 2( ani si "* ani, care apar pentru * actrite $iecare
Nr. crt.
Varsta actritelor
i x
Varsta actritelor, in ordine crescatoare
( )i x
1 x150 x1!212 x244 x2!243 x"35 x"!254 x*80 x*!265 x'26 x'!266 28 26
7 41 26
8 21 27
9 61 28
10 38 x10!30Q111 49 3012 33 31
13 74 31
14 30 33
15 33 33
16 41 33
17 31 34
18 35 34
19 41 34
20 42 x20!34 Me21 37 35
22 26 35
23 34 35
24 34 37
-
8/20/2019 bazele statisticii (1)
6/38
25 35 37
26 26 38
27 61 39
28 60 41
29 34 41
30 24
x"0!41
Q"31 30 4232 37 44
33 31 49
34 27 x"*!5035 39 x"'!6036 34 x"(!6137 26 x")!6138 25 x"+!7439 x"33 x"!80
o 6entru determinarea cuartilelor procedam ast$el&
- locul cuartilei de ordinul 1, Q1, este
( ) "0101*
1101 ==⇒∈=⋅
+ xQ
nN
ani/un s$ert dintre actrite au casti#at premiul 9scar la o varsta mai mica saue#ala cu "0 de ani, iar restul la cel putin "0 de ani/
- locul cuartilei de ordinul ", Q", este
( ) *1"0"*
1"0" ==⇒∈=⋅+ xQ
nN
ani/trei s$erturi dintre actrite au casti#at premiul 9scar la o varsta mai mica saue#ala cu *1 de ani, iar restul la cel putin *1 de ani
o A%aterea intercuartilica este111" =−= QQ IQR
ani si arata lun#imea intervalului in carese #asesc umatate dintre valorile din milocul seriei de date
b) 7ia#rama cu mustati %o8-and-:;is
-
8/20/2019 bazele statisticii (1)
7/38
!
"#$%
&
"'e%
&$
"#%
(! )! )$ *& +!
* * * *
*
- limita sau mar#inea superioara a dia#ramei %o8-plot este cea mai maredintre valorile seriei de date cu proprietatea ca este mai mica sau e#ala cu
IQRQ ⋅+ ',1", adica
( ) ( ){ } IQRQ xni x ii plot box ⋅+≤==− ',1,1,ma8suplim "&
o
',')',1"
=⋅+ IQRQ
o cea mai mare dintre valorile seriei de date, cu proprietatea ca este',')≤
, este x"*!'0 ani, deci mar#inea superioara este e#ala cu '0
ani,( )"*'0suplim x plot box ==−
Se o%serva ca intervalul cuprins intre mar#inea in$erioara si cea superioara dia#ramei %o8-plot, adica intervalul de numere reale B21/ '0 nu contine toate valorile o%servate, ina$ara lui ramanand valorile x"'!60, x"(!61, x")!61, x"+!74, x"!80 ani
=aloarea x este outlier pentru seria de date statistice numerice daca x se #aseste in
a$ara intervalului[ ] [ ]',')/',1"',1/',1 "1 =⋅+⋅− IQRQ IQRQ
, x"'!60, x"(!61, x")!61, x"+!74, x"!80 sunt outliers si vor $i reprezentate distinct india#rama %o8-plot
Di# 7ia#rama %o8-plot sau dia#rama cu mustati %o8-and-:;is
-
8/20/2019 bazele statisticii (1)
8/38
Di# 7ia#rama %o8-plot in S6SS
c) 7ispersia de selectie sample variance! pentru o serie simpla de date numerice asupravaria%ilei X este
( ) ( ) ( )
11
1
2
22
12
−
−=
−−++−
=∑=
n
x x
n
x x x x s
n
i
i
n x
,
adica
( ))2(0,1)+
1"
'+),()1
1"
"
1
2
2 =−
=−
−=∑=i
i
x
x x
s
,
a%aterea standard standard deviation! este
"(++,1"2 == x x s s
ani
Coe$icientul de variatie este
."'.0,"'100 >=⋅= x
sv x x
, ceea ce indica $aptul caseria de date nu este omo#ena, iar media nu este reprezentativa pentru colectivitate, caindicator al tendintei centrale
-
8/20/2019 bazele statisticii (1)
9/38
Nr. crt.Varsta actritelor
i x x xi − ( )
2 x xi −
1 x150 11,8974 141,54892 x244 5,8974 34,77973 x"35 -3,1026 9,62594 x*80 41,8974 1755,39515 x'26 -12,1026 146,47206 28 -10,1026 102,0618
7 41 2,8974 8,3951
8 21 -17,1026 292,4977
9 61 22,8974 524,2925
10 38 -0,1026 0,010511 49 10,8974 118,754112 33 -5,1025 26,0361
13 74 35,8974 1288,6259
14 30 -8,1025 65,6515
15 33 -5,1025 26,0361
16 41 2,8974 8,3951
17 31 -7,1025 50,4464
18 35 -3,1025 9,6259
19 41 2,8974 8,3951
20 42 3,8974 15,1900
21 37 -1,1025 1,2156
22 26 -12,1025 146,4720
23 34 -4,1025 16,8310
24 34 -4,1025 16,8310
25 35 -3,1025 9,6259
26 26 -12,1025 146,4720
27 61 22,8974 524,2925
28 60 21,8974 479,4977
29 34 -4,10256 16,8310
30 24 -14,1025 198,882331 30 -8,1025 65,6515
32 37 -1,1025 1,2156
33 31 -7,1025 50,4464
34 27 -11,1025 123,2669
35 39 0,8974 0,8053
36 34 -4,1025 16,8310
37 26 -12,1025 146,4720
38 25 -13,1025 171,6771
39 x"33 -5,1025 26,0361
-
8/20/2019 bazele statisticii (1)
10/38
∑=
="
1i
i x
1486
( )∑=
=−"
1i
i x x
0
( )∑=
=−"
1
2
i
i x x
6791,5897
= x38,1025
=2 x s178,7260
== 2 x x s s13,3688
= xv35,09%
d) Asimetria unei serii de distri%uţie de $recvenţe se poate sta%ili&- prin compararea indicatorilor tendintei centrale,
- prin analiza distantei intre mediana si cele doua cuartile in$erioara si superioara,- prin calculul si interpretarea valorii unui indicator speci$ic, coe$icientul de asimetrie,- se o%servă din reprezentarea #ra$ică prin ;isto#ramă sau poli#onul $recvenţelor
- Cum x Me =
-
8/20/2019 bazele statisticii (1)
11/38
∑=
=(
1k
k n
39(n
Feprezentarea #ra$ica seriei de distri%utie de $recvente pe intervale, adica ;isto#rama si poli#onul $recventelor su#ereaza ca aceasta prezinta asimetrie pronuntata la dreapta sauasimetrie pozitiva, adica predomina valorile mai mici ale varia%ilei de interes, cu coada mailun#ă a distri%uţiei spre valorile mari, care apar cu $recventa mai mica Intre cele " de actritecasti#atoare ale premiului 9scar, predomina cele cu varste relativ mai mici
e) Indicatorii tendintei centrale, principaliiindicatori ai variatiei si ai $ormei
distri%utiei pentru o serie simpla de datenumerice pot $i calculati in Excel si inS6SS, output-urile $iind de $orma&
9utput-ul "escriptive#tatistics in Excel
9utput-ul "escriptive#tatistics in S6SS
9%servatie& Analizaboltirii/aplatizării
Boltireakurtosis, Gnen#l! e8primăGnălţimea cur%eiHcocoaeiJ!comparativ cudistri%uţia normalăteoretică Kntâlnim,ast$el distribu!iileptocurtice, ascuţitecu HcocoaaJ Gnaltă!
Varsta actritelor
)ean $edia! = x
38.1025
*tandard +rror 2.1407
)edian Me34)ode Mo26
*tandard eviationa#aterea standard!
== 2 x x s s13.3688
*a$le Variancedisersia de selectie!
=2 x s178.7260
urtosis 2.3830
*'e/nesscoeicientul de asi$etrie!
=CAS 1.5734
ane$litudinea!
=−= minma8 x x A x59
)ini$u$ =
min x
21
)ai$u$ =ma8 x
80
*u$ ∑=
="
1i
i x
1486
&ount n(39
Statistics
Varsta actritelor scar
N Valid 39
)issin 0
)ean = x38.10
*td. +rror o )ean 2.141
)edian Me34.00
)ode Mo26a
*td. eviation == 2 x x s s
13.369
Variance =2 x s178.726
*'e/ness =CAS 1.573
*td. +rror o *'e/ness .378
urtosis 2.383
*td. +rror o urtosis .741
ane =−= minma8 x x A x59
)ini$u$ =min x21
)ai$u$ =ma8 x80
*u$ ∑=
="
1i
i x
1486
ercentiles 25 =1Q30.00
50 == MeQ234.00
75 ="Q41.00
a. )ultile $odes eist. e s$allest value is so/n
-
8/20/2019 bazele statisticii (1)
12/38
i distribu!ii platicurtice, aplatizate $oeficientul de boltire sau aplatizare kurtosis! este omăsură a Gmprătierii $iecărei o%servaţii Gn urul unei valori centrale i se determină, peeantion, cu $ormula&
( )
( ) "
22
1
*
−⋅
−
=
∑=
x
n
i
i
sn
x x
C"A
, unde
( )
1
1
2
2
−
−
=
∑=
n
x x
s
n
i
i
x
Defini!ia este ba#at$ pe momentul centrat de ordinul %&
Interpretarea valorii coe$icientului de aplatizare si %oltire&
7acă0>C"A
, avem distri%uţie leptocurtică, valorile vari%ilei $iind concentrate %n &urul indicatorilor tendin'ei centrale
7acă0=CA"
, ceea ce indica o distri%utieleptocurtica cu cocoasa, asa cum se poate vedea si din ;isto#rama sau poli#onul$recventelor!
Ex. (. Un a#ent al companiei de asi#urari ' vinde contracte de asi#urare de locuinte In luna
iulie a inc;eiat& 2 contracte cu prime anuale de '0 Eur, " contracte cu prime anuale de (0 Eur,( contracte cu prime de )0 Eur, contracte cu prime de 0 Eur, 1( contracte cu prime anualede 120 Eur, + contracte cu prime anuale de 1"0 Eur si ( contracte cu prime de 1*0 Eur Secere&
a) Construiţi seria de distri%uţie de $recvenţe i analizaţi #ra$ic tendinţa de normalitate aacesteia
b) Caracterizaţi omo#enitatea i asimetria distri%uţiei contractelor Gn $uncţie de valoarea primelor anuale
c) Calculati media si a%aterea standard a varia%ilei alternative care evidentiazacontractele cu prime anuale de valoare mai mica sau e#ala cu 0 Eur
Rezolvare& a)o 6opulatia statistica este multimea contractelor de asi#urare de locuinte din porto$oliul
companiei ' o Unitatea statistica este un contract de asi#urare de locuintao =aria%ila statistica sau caracteristica de interes, notata X , este varia%ila ce arata marimei
primei anuale, in Eur, pentru un contract de asi#urare de locuinta inc;eiat de un a#ent alcompaniei/ varia%ila numerica, continua
o A#entul a inc;eiat intr-o luna n'0 de contracte, seria de date statistice re$eritoare la primele anuale ale acestor contracte $iind sistematizata intr-o serie de distri%utie de$recvente pe r ) variante distincte Ast$el distri%utia celor n'0 de contracte dupa
valoarea primei anuale, in Eur, este&
-
8/20/2019 bazele statisticii (1)
13/38
Nr.crt.
Valoarea
k x
+ur a unei ri$e anuale
Nu$arul de contracte,
k n
,recventa a#soluta!
1
=1 x50 +ur
=1n2 contracte
2=2 x
60 +ur =2n
3
3
=" x70 +ur
="n6
4
=* x90 +ur
=*n9
5
=' x120 +ur
='n16
6
=( x130 +ur
=(n8
7
=) x140 +ur
=)n6
∑=
==)
1
'0k
k nn
contracte
sau
==============
(+1(("contracte2
1201"01200)0(0Eur '0&
)('*"21
)('*"21
nnnnnnn
x x x x x x x X
,
unde∑= ==)
1'0
k
k nn
contracte
o Feprezentarea #ra$ica a acestei serii de distri%utie este poli#onul $recventelor a%solute
-
8/20/2019 bazele statisticii (1)
14/38
o 6oli#onul $recventelor su#ereaza ca distri%utia are tendinta de normalitate, dar prezintaasimetrie la stan#a, coada poli#onului $reventelor a%solute $iind mai alun#ita spre stan#a
o 6oli#onul $recventelor se mai poate reprezenta si cu autorul $recventelor relative
Nr.crt.
Valoarea
k x
+ur a unei ri$e anuale
Nu$arul de contracte,
k n
,recventa a#soluta! "recventa relativa
[ ]1,0L ∈=n
nn k k
1
=1 x50 +ur
=1n2 contracte
=L1n0,04
2
=2 x60 +ur
=2n
3
=L2n0,06
3
=" x70 +ur
="n6
=L"n0,12
4
=* x
90 +ur
=*n
9
=L*n0,18
5=' x
120 +ur ='n
16=
L
'n0,32
6
=( x130 +ur
=(n8
=L(n0,16
7
=) x140 +ur
=)n6
0,12
∑=
==)
1
'0k
k nn
contracte
∑=
=)
1
L1
k
k n
=L)n
-
8/20/2019 bazele statisticii (1)
15/38
b)o Media pentru o serie de distri%utie de $recvente pe r variante distincte ale varia%ilei de
interes este
n
n x
nn
n xn x x
r
k
k k
r
r r
∑=
⋅=
++⋅++⋅
= 11
11
,
unde{ }r k x
k ,1, =
sunt variantele distincte o%servate ale varia%ilei, iar
∑=
=r
k
k nn1
volumulesantionului
In cazul nostru,
2,10('0
'"10
'0
)
1 ==⋅
=∑=k
k k n x
x
Eur este valoarea medie a unei prime anualacorespunzatoare unui contract de asi#urare de locuinta inc;eiat de respectivul a#ent devanzari
o Mediana pentru o serie de distri%utie de $recvente pe r variante distincte se calculeaza parcur#and urmatorii pasi&
• Cele r variante distincte sunt ordonate crescatorr x x x
-
8/20/2019 bazele statisticii (1)
16/38
• @ediana este acea valoare distincta cu proprietatea ca $recventa sa a%solutacumulata crescator este prima care depaseste locul medianei
',2'20',2'11
',2''
',2'2
*
"
2
1
-
8/20/2019 bazele statisticii (1)
17/38
o Modul sau valoarea modala pentru o serie de distri%utie de $recvente pe r variantedistincte este acea varianta sau valoare care apare cu $recventa a%soluta sau relativa ceamai mare&
• Drecventa a%soluta cea mai mare este&
{ }r k nn k ,1,ma81( ' ===
• valoarea modala este deci a '-a varianta sau valoare distincta de
raspuns a varia%ilei de interes,120' == x Mo
Eur, aceasta $iind valoarea ceamai des intalnita a unei prime anuale pentru contractele inc;eiate derespectivul a#ent
o Felatia in care se #asesc indicatorii tendintei centrale, Mo Me x =<
, ca si reprezentatrea#ra$ica pentru poli#onul $recventelor a%solute sau relative, arata ca distri%utia contractelor dupa valoarea primelor anuale prezinta asimetrie ne#ativa, in serie predominand valorilemai mari ale primelor anuale, iar coada distri%utiei este alun#ita spre stan#a
o 7ispersia in esantion de selectie! pentru o serie de distri%utie de $recvente pe r intervalede variatie este
( ) ( )( )
( )
11
1
2
1
2
1
2
12
−
⋅−=
−++⋅−++⋅−
=∑=
n
n x x
nn
n x xn x x s
r
k
k k
r
r r x
,
unde
{ }r k xk ,1, = sunt variantele distincte o%servate ale varia%ilei,
∑=
=r
k
k nn1
volumulesantionului
In cazul nostru,
( )+1(",)(2
1'0
")")+
1'0
)
1
2
2 =−
=−
⋅−=∑=k
k k
x
n x x
s
, iar a%aterea standard sau
a%aterea medie patratica este
(11,2)2 == x x s s Eur, care arata cu cat se a%at, in medie,
valorile o%servate $ata de nivelul mediu in esantion al primelor anuale
o Coe$icientul de variatie in esantion este
."0.01,2(1002,10(
(11,2)100
-
8/20/2019 bazele statisticii (1)
18/38
unde1=)
pentru unitatile statistice din esantion care veri$ica evenimentul $avora%il, iar meste numarul de unitati statistice din esantion care veri$ica evenimentul $avora%il,
20*"21 =+++= nnnnm contracte,
iar 0=) pentru unitatile statistice din esantion care nu veri$ica evenimentul $avora%il,mn−
este numarul de unitati statistice din esantion pentru care nu se veri$ica
evenimentul $avora%il,"0=− mn
de contracte cu prime anuale mai mari de 0 Eur
@edia varia%ilei alternative este
*,0'0
20 ===n
m *
, adica *0. dintre contracte auvalori ale primelor anuale mai mici sau e#ale cu 0 Eur
7ispersia varia%ilei alternative este
2*,012 =
−⋅=
nm
nm s *
, iar a%aterea standard
*+,01 ≅
−⋅=
n
m
n
m s *
Ex. . 7istri%utia a 1100 de a%solventi ai Universitatii din Dlorida dupa salariul casti#at, in N,in primul an dupa terminarea studiilor este urmatoarea serie de distri%utie de $recvente peintervale de variatie&
Or crt Intervalul de variatie al salariului, N Oumarul de a%solventi1 7200 12500: 302 12500 17800: 693 17800 23100: 3024 23100 28400: 3085 28400 33700: 2636 33700 39000: 957 39000 44300: 208 44300 49600: 69 49600 54900: 5
10 54900 60200: 111 60200 65500: 1
Se cere&a) sa se reprezinte #ra$ic aceasta serie de distri%utie/b) sa se determine si sa se interpreteze indicatorii tendintei centrale/c) sa se reprezinte #ra$ic poli#onul $recventelor a%solute cumulate crescator si sa se
estimeze proportia a%solventilor care&i) au o%tinut un salariu mai mic de 21000 N in primul an de dupa $inalizarea
studiilor,ii) au o%tinut un salariu mai mic decat media in primul an de dupa $inalizarea
studiilor,iii) au casti#at in primul an intre 2'000 N si *0000 N,iv) au casti#at mai mult de '2000 N/
d) sa se sta%ileasca daca media este reprezentativa pentru colectivitate/e) sa se analizeze asimetria acestei distri%utii
-
8/20/2019 bazele statisticii (1)
19/38
Rezolvare& a) 6opulatia statistica este multimea a%solventilor Universitatii din Dlorida, promotiile anilor
1+ si 10, asa cum se speci$ica in $isierul +niversit* of (lorida ,raduate salariessaval pro#ramului S6SS
Unitatea statistica este un a%solvent =aria%ila sau caracteristica de interes, notata X , este varia%ila ce arata salariul unui
a%solvent, in N, din primul an de dupa $inalizarea studiilor, varia%ila numerica, continua
6entru un esantion de volum1100=n
de a%solventi s-au inre#istrat valorile varia%ilei, iar
setul de date s-a sistematizat intr-o serie de distri%utie de $recvente pe11=r
intervale devariatie de marime e#ala, data in enuntul pro%lemei
Feprezentarea #ra$ica a acestei serii de distri%utie de $recvente pe intervale de variatie se poate realiza prin ;isto#rama si poli#onul $recventelor a%solute
Nr.crt.
Intervalul k de variatie*alariul anual al unui
a#solvent, in ;!
"recventa a#solutak n
a intervalului k nu$arul de a#solventi!
-
8/20/2019 bazele statisticii (1)
20/38
Di# Pisto#rama 7istri%utia celor 1100 de a%solventi ai Universitatii din Dloridadupa salariul casti#at in primul an de dupa $inalizarea studiilor
Di# 6oli#onul $recventelor a%solute 7istri%utia celor 1100 de a%solventi aiUniversitatii din Dlorida dupa salariul casti#at in primul an de dupa $inalizarea studiilor
-
8/20/2019 bazele statisticii (1)
21/38
b) Indicatorii tendintei centrale& media, mediana si modul
Nr.crt.
Intervalul k *alariul anual al
unui
a#solvent, in ;!
&entrul
k x "recventa a#solutak n
nu$arul de a#solventi!
k k n x ⋅
"recventa a#solutacu$ulata crescator
a intervalului ',
k ck nn ( ++= 1
1 7200 12500: 9850 30 295500 30
2 12500 17800: 15150 69 1045350 99
3 17800 23100: 20450 302 6175900 401
4 23100 28400: 25750 308 7931000 709
5 28400 33700: 31050 263 8166150 972
6 33700 39000: 36350 95 3453250 1067
7 39000 44300: 41650 20 833000 1087
8 44300 49600: 46950 6 281700 1093
9 49600 54900: 52250 5 261250 1098
10 54900 60200: 57550 1 57550 1099
11 60200 65500: 62850 1 62850 1100
∑=
==11
1k
k nn
1100
∑=
=⋅11
1k
k k n x
28563500
= x25966,82
o Media pentru o serie de distri%utie de $recvente pe r intervale de variatie este
n
n x
nn
n xn x x
r
k
k k
r
r r
∑=
⋅=
++⋅++⋅
= 11
11
,
unde{ }r k x
k ,1, =
sunt centrele celor r intervale, iar
∑=
=r
k
k nn1
volumul esantionului
+2,2'((1100
2+'("'00
1100
11
1 ==⋅
=⇒∑=k
k k n x
x
N a casti#at, in medie, un a%solvent in primul an
o Mediana pentru o serie de distri%utie de $recvente pe r intervale de variatie se calculeaza
parcur#and urmatorii pasi&
• Se determina locul medianei, adica
',''02
1=
+n
• Se calculeaza $recventele a%solute cumulate crescator ale intervalelor de
variatie
k ck nn ( ++= 1,
r k ,1=
• Intervalul median este primul interval cu proprietatea ca $recventa sa a%solutacumulata crescator depaseste locul medianei
-
8/20/2019 bazele statisticii (1)
22/38
',''0*01
',''0
',''0"0
"
2
1
-
8/20/2019 bazele statisticii (1)
23/38
varia%ilei de interes X este mai mica sau e#ala decat limita superioara( ) supk x
a intervalului k
de variatie, adica( ) supk cck x ( ( =
,r k ,1=
.
6entru reprezentarea #ra$ica a poli#onului $reventelor a%solute cumulate crescator
vom pune in evidenta limitele superioare( ) supk x
ale intervalelor de variatie si $recventele lor
a%solute cumulate, impreuna cu limita in$erioara a primului interval de variatie( ) in$ 1 x
, in cazul
nostru )200 N, a carui $recventa a%soluta cumulata este 0,( )( ( ) 0)200in$ 1 == cc ( x (
, deoarece
pentru nicio unitate statistica din esantion, nivelul varia%ilei nu este mai mic decat( ) in$ 1 x
3imitele superioare aleintervalelor de variatie,
( ) supk x
( ) k ck k c nn ( x ( ++== 1sup, adica
numarul de a%solventi din esantion
care au casti#at un salariu mai mic sau e#al cu( ) supk x
N
( ) in$ 1 x
(7200
( )( ( ))200in$ 1 cc ( x ( =0
( ) sup1 x
12500( ) ( )12'00sup1 cc ( x ( =
30
( ) sup2 x
17800
( )( ( )1)+00sup2 cc ( x ( =
99( ) sup" x
23100( ) ( )2"100sup" cc ( x ( =
(401
( ) sup* x
28400( )( ( )2+*00sup* cc ( x ( =
(709
( ) sup' x
33700( )( ( )"")00sup' cc ( x ( =
972
( ) sup( x
39000( ) ( )"000sup( cc ( x ( =
(1067
( ) sup) x 44300( )( ( )**"00
sup) cc ( x ( = (1087( ) sup+ x
49600( )( ( )*(00sup+ cc ( x ( =
(1093
( ) sup x
54900( )( ( )'*00sup cc ( x ( =
(1098
( ) sup10 x
60200( )( ( )(0200sup10 cc ( x ( =
(1099
( ) sup11 x
65500( )( ( )(''00sup11 cc ( x ( =
1100
-
8/20/2019 bazele statisticii (1)
24/38
-
8/20/2019 bazele statisticii (1)
25/38
Di# Interpolare liniara - detaliu din $i#ura reprezentand poli#onul $recventelor a%solutecumulate crescator, pentru intervalul 17800 23100: N in care se #aseste 21000 N.
ii)
( )+2,2'((c ( este numarul de a%solventi care au o%tinut un salariu mai mic decat
nivelul mediu= x
2'((,+2 N al salariului in esantion7in relatia
( ) ( )
( ) ( )2"1002+*00
2"100+2,2'((
2"1002+*00
2"100+2,2'((
cc
cc
( (
( (
−
−=
−
−
,
o%tinem ca( ) '(++,'()+2,2'(( ≅=
c (
a%solventi,
adica o proportie de
.(",'11001100
'(+=⋅
dintre cei 1100 de a%solventi din esantionulconsiderat au avut un salariu anual mai mic de nivelul mediu
iii)
( ) ( ) ''"',''2'000*0000 ≅=− cc ( (
este numarul de a%solventi care au casti#at in primul an intre 2'000 N si *0000 N, adica '0,+1. dintre cei 1100 de a%solventi
-
8/20/2019 bazele statisticii (1)
26/38
iv)
( ) ( ) ')",*'20001100'2000 ≅=−=− cc ( ( n a%solventi au casti#at mai mult de '2000
N, adica o proportie de 0,*'.
d) @edia varia%ilei de interes in esantion este = x
25966,82 ;.
Nr.crt.
Intervalul k *alariul anual al
unuia#solvent, in ;!
&entrul
k x "recventa a#solutak n
nu$arul de a#solventi!
( ) k k n x x ⋅−
2
1 7200 12500: 9850 30
( ) =⋅− 1
2
1 n x x
7792556607
2 12500 17800: 15150 69 8073248049
3 17800 23100: 20450 302 9191461480
4 23100 28400: 25750 308 14479361,025 28400 33700: 31050 263 6795583074
6 33700 39000: 36350 95 10241990557
7 39000 44300: 41650 20 4919242698
8 44300 49600: 46950 6 2641763057
9 49600 54900: 52250 5 3454027755
10 54900 60200: 57550 1 997497258,9
11 60200 65500: 62850 1 1360368967
∑=
==11
1k
k nn
1100
( )∑=
=⋅−11
1
2
k
k k n x x
55482218864=2 x s
50484275,58
= x s7105,2287
7ispersia in esantion de selectie! pentru o serie de distri%utie de $recvente pe r intervale de variatie este
( ) ( )
( )
( )
11
1
2
1
2
1
2
12
−
⋅−=
−++
⋅−++⋅−=
∑=
n
n x x
nn
n x xn x x s
r
k
k k
r
r r x
,
unde{ }r k xk ,1, =
sunt centrele celor r intervale,
∑=
=r
k
k nn1
volumul esantionului
( )'+,'0*+*2)'
11100
*''*+221++(
11100
11
1
2
2 =−
=−
⋅−=⇒∑=k
k k
x
n x x
s
, iar a%aterea standard este22+),)10'= x s
N, care arata cu cat se a%at, in medie, valorile o%servate $ata de nivelul mediual salariului din esantion
-
8/20/2019 bazele statisticii (1)
27/38
Coe$icientul de variatie in esantion este
."0."(,2)100+2,2'((
22+),)10'100
-
8/20/2019 bazele statisticii (1)
28/38
6 33700 39000: 36350 95 1,06344+=14
7 39000 44300: 41650 20 7,71494+=13
8 44300 49600: 46950 6 5,54326+=13
9 49600 54900: 52250 5 9,07828+=13
10 54900 60200: 57550 1 3,15041+=13
11 60200 65500: 62850 1 5,01747+=13
∑=
==11
1k
k nn
1100
( )∑=
=⋅−11
1
"
k
k k n x x
1,82302+=14
=CAS 0,462
Cum10
-
8/20/2019 bazele statisticii (1)
29/38
•
r k nk ,1, =, $recventa a%soluta a intervalului k de variatie numarul de de%itori restantiei
pentru care numarul de zile de intarziere apartine intervalului k de variatie!,nnn r =++ 1
/
•
[ ] r k n
nn k
k ,1,1/0L =∈=
, $recventa relativa a intervalului k de variatie,1 LL
1 =++ r nn
/
•
r k n
nn k k ,1,100.L =⋅=
, $recventa relativa e8primata procentual a intervalului k devariatie sau ponderea de%itorilor cu numarul de zile de intarziere din intervalul sau clasa
k ,.100..
LL
1 =++ r nn/
•r k nn ( k ck ,1,1 =++= , este $recventa a%soluta cumulata crescator a intervalului k /
•
r k nn ( k ck ,1, LL
1
L =++=, este $recventa relativa cumulata crescator a intervalului k /
•
r k nn ( k ck ,1.,.. LL
1
L =++=, este $recventa relativa e8primata procentual cumulata
crescator a intervalului k ponderea cumulata a intervalului k !
Orcrt
Intervalul k devariatie a
numarului de zilede intarziere a
platii
6onderea cumulataa de%itorilor .!
... LL
1
L
k ck nn ( ++=
6ondereaintervalului k ,
.L
k n
Drecventarelativa,
100
.LL k k
nn =
Drecventaa%soluta,
L
L
'00 k
k k
n
nnn
⋅=
=⋅=
1 1'-2' de zile == .. L
1L n ( ck
2'.2'. =
L
1n0,2' =
1n12'
2 2'-"' de zile =+= ... L2
L
1
L
2 nn ( c)'.
=.L2n'0.
=L2n0,'0
=2n2'0
" "'-*' de zile =++= ... L"L
1
L
" nn ( c+'.
=.L"n10.
=L"n0,10
="n'0
* *'-'' de zile =++= ... L*
L
1
L
* nn ( c".
=.L*n+.
=L*n0,0+
=*n*0
' ''-(' de zile =++= ... L'
L
1
L
' nn ( c
+.
=.L'n
'.
=L'n
0,0'
='n
2'
=.L1n
-
8/20/2019 bazele statisticii (1)
30/38
( ('-)' de zile=++= ... L(
L
1
L
( nn ( c100
.
=.L(n2.
=L(n0,02
=(n10
∑=
=(
1
L.
k
k n
100.
∑=
=(
1
L
k
k n
1
∑=
==(
1
'00
k
k nn
7istri%utia celor '00 de de%itori dupa numarul de zile de intarziere a platii esteurmatoarea serie de distri%utie de $recvente pe intervale&
Orcrt
Intervalul k de variatiea numarului de zilede intarziere a platii
Oumarul de de%itori$recventa a%soluta!,
k nCentrul
k x
alintervalului k
de variatie
1 1'-2' de zile
=1n
12' de%itori
=1 x
20
2 2'-"' de zile =
2n
2'0=2 x
"0
" "'-*' de zile ="n
'0=" x
*0
* *'-'' de zile =*n
*0=* x
'0
' ''-(' de zile ='n
2'=' x
(0
( ('-)' de zile =
(
n
10=
(
x
)0
∑=
==(
1
'00k
k nn
de%itorib)
Di# 7istri%utia celor '00 de de%itori dupa numarul de zile de
-
8/20/2019 bazele statisticii (1)
31/38
intarziere a platiiDi# 6oli#onul $recventelor a%solute pentru distri%utia celor
'00 de de%itori dupa numarul de zile de intarziere a platilor c)
Orcrt
Intervalul k
Oumarul de
de%itori,
k nCentrul
k x k k n x ⋅ ck ( ( ) k k n x x ⋅−
2
1 1'-2' de zile
=1n
12'
=1 x
20
=⋅ 11 n x2500
=1c ( 125
( ) =⋅− 12
1 n x x
19220
2 2'-"' de zile
=2n2'0
=2 x"0 7500
=2c ( 375 1440
" "'-*' de zile
="n'0
=" x*0 2000
="c ( 425 2888
* *'-'' de zile
=*n*0
=* x'0 2000 465 12390,4
' ''-(' de zile='n
2'=' x
(0 1500 490 19044
( ('-)' de zile
=(n10
=( x)0
=⋅ (( n x700
=(c ( 500
( ) =⋅− (
2
( n x x
14137,6
∑=
==(
1
'00k
k nn ∑=
=⋅(
1k
k k n x
16200
( )∑=
=⋅−(
1
2
k
k k n x x
(69120
= x32,4
=2 x s
138,5170
== 2 x x s s11,7693
= xv36,33%
o Media este'00
1(200
(
1
(1
(11 =⋅
=++
⋅++⋅=
∑=
n
n x
nn
n xn x x k
k k
r
, deci*,"2= x
zile este numarulmediu de zile de intarziere a platilor pentru un de%itor restantier
o 3ocul medianei este
',2'02
1 =+n
/ primul interval cu proprietatea ca2
1+≥ n ( ck
este
intervalul 2'-"' de zile, deoarece',2'012'
1
-
8/20/2019 bazele statisticii (1)
32/38
02,"02'0
12'',2'0102' =
−⋅+=
zile, adica umatate dintre de%itorii restantieriau intarziat cel putin "0 de zile cu e$ectuarea platilor
o Intervalul modal este intervalul 2'-"' de zile deoarece are $recventa a%soluta cea mai
mare{ }(,1,ma82'0 2 === k nn k
, atunci
=∆+∆
∆⋅+=
21
1in$ Mo Mo - x Mo
( ) ( ) +*,2+
'02'012'2'0
12'2'0102' =
−+−−
⋅+=
zile/ numarul cel mai intalnit de zilede intarziere a platilor celor '00 de de%itori restantieri este de apro8imativ 2
de zile
o Felatia in care se #asesc cei trei indicatori ai tendintei centrale este x Me Mo
-
8/20/2019 bazele statisticii (1)
33/38
iar 0=)
pentru unitatile statistice din esantion care nu veri$ica evenimentul $avora%il,mn−
este numarul de unitati statistice din esantion pentru care nu se veri$ica
evenimentul $avora%il,*2'=−mn
de%itori
@edia varia%ilei alternative este
1',0'00
)'===
n
m *
, adica 1'. dintre de%itori auintarziat mai mult de *' de zile
7ispersia varia%ilei alternative este
12)',012 =
−⋅=
n
m
n
m s *
, iar a%aterea standard
"(,01 ≅
−⋅=n
m
n
m s *
Ex. +. Un cercetător $ace un studiu asupra unor $irme, privind ansele pe care acestea le o$erătinerilor an#aaţi de a promova repede i de a avansa Gn carieră 6entru aceasta el a cuprins Gnstudiu un număr de 20 de companii producătoare de te;nolo#ie de vâr$ i a Gnre#istrat timpulscurs de la an#aarea iniţială a unui salariat Gn $irmă până la prima promovare a acestuiaDirmele au $ost #rupate după mărime, iar datele Gnre#istrate sunt&
,-rimeafirmelor
Num-r de s-pt-mni de la anga&are pn- la primapromovare
@ici "0/ 2(/ "0/ "2/ "+/ 2*/ "2/ 2+/@edii "*/ "2/ 2'/ "(/ ""@ari *)/ *1/ *"/ *+/ *0/ */ *0
Se cere&a) să seprecizeze care este #rupa de $irme cu un #rad mai ridicat de omo#enitate/
b) sa se determine in ce proportie marimea companiei in$luenteaza variatia timpului panala prima promovare a unui salariat
Rezolvare& a)o 6opulatia statistica este multimea companiilor producatoare de te;nolo#ie de var$o Unitatea statistica este o companie $irma!o Caracteristicile urmarite sunt&
X - varia%ila ce arata marimea unei $irme/- varia%ila nenumerica avand r " cate#orii sau variante de raspuns& $irme mici, $irme milocii si
$irme mari&aceste cate#orii ale varia%ilei R vor determina impartirea populatiei statistice in r " #rupesi anume&
.rupa / #rupa $irmelor mici!,
.rupa 0 #rupa $irmelor milocii!,
.rupa 1 #rupa $irmelor mari!/- ast$el, varia%ila X , marimea $irmei, se mai numeste si $actor de #rupare
-
8/20/2019 bazele statisticii (1)
34/38
siY - varia%ila ce arata durata de timp, in saptamani, de la an#aare la prima promovare a unui
salariat al unei $irme producatoare de te;nolo#ie de var$/- varia%ila numerica de interes
• 7in .rupa / #rupa $irmelor mici! se selecteaza un su%esantion de volum+1 =n
$irme pentru care se inre#istreaza valorile varia%ilei ) &
?2+/"2/2*/"+/"2/"0/2(/"0>1,1+,1),1(,1',1*,1",12,11,1
=========n
* * * * * * * * *
saptamani
@edia de selectie de #rupa este
"0+
2*0
1
1
,1
1
,12,11,1
1
1
1 ===+++
=∑=
n
*
n
* * * *
n
2
2
n
saptamani,dispersia de selectie de #rupa este
( ) ( ) ( ) ( )
2+'),1+11
1
1
2
1,1
1
2
1,1
2
12,1
2
11,12
1
1
1 =−
−=
−
−++−+−=
∑=
n
* *
n
* * * * * * s
n
2
2
n
,
a%aterea standard de selectie de #rupa este2)(2,*2+'),1+211 === s s
saptamani,
iar coe$icientul de variatie al acestei #rupe este
.2',1*100"0
2)(2,*100
1
11 =⋅=⋅=
*
sv
• 7in .rupa 0 #rupa $irmelor milocii! se selecteaza un su%esantion de volum'2 =n
$irme pentru care se inre#istreaza valorile varia%ilei ) &
?"","(,2',"2,"*>2,2',2*,2",22,21,2
====== n * * * * * * saptamani
@edia de selectie de #rupa este
"2'
1(0
2
1
,2
2
,22,21,2
2
2
2 ===+++
=∑=
n
*
n
* * * *
n
2
2
n
saptamani,
dispersia de selectie de #rupa este
( ) ( ) ( ) ( )',1)
11
2
1
2
2,2
2
2
2,2
2
22,2
2
21,22
2
2
2 =−
−=
−
−++−+−=
∑=
n
* *
n
* * * * * * s
n
2
2
n
,
a%aterea standard de selectie de #rupa este
1+"",*',1)222 === s s
saptamani,
-
8/20/2019 bazele statisticii (1)
35/38
iar coe$icientul de variatie al acestei #rupe este
.0),1"100"2
1+"",*100
2
22
=⋅=⋅= *
sv
• 7in .rupa 1 #rupa $irmelor mari! se selecteaza un su%esantion de volum)" =n
$irme pentru care se inre#istreaza valorile varia%ilei ) &
?*0/*/*0/*+/*"/*1/*)>2,"),"(,"',"*,"","2,"1,"
======== n * * * * * * * *
saptamani
@edia de selectie de #rupa este
**)
"0+
"
1
,"
"
,"2,"1,"
"
"
" ===+++
=∑=
n
*
n
* * * *
n
2
2
n
saptamani,
dispersia de selectie de #rupa este
( ) ( ) ( ) ( )"""",1'
11
"
1
2
","
"
2
","
2
"2,"
2
"1,"2
"
"
" =−
−=
−
−++−+−=
∑=
n
* *
n
* * * * * * s
n
2
2
n
,
a%aterea standard de selectie de #rupa este
1'+,""""",1'2"" === s s saptamani,
iar coe$icientul de variatie al acestei #rupe este
.+,+100**
1'+,"100
"
"" =⋅=⋅=
*
sv
Cum coe$icientii de variatie pentru cele trei #rupe sunt mai mici ca "0.-"'., atuncitoate #rupele sunt omo#ene .rupa 1 #rupa $irmelor mari! este mai omo#ena in privintaduratei de timp de la an#aare la prima promovare a unui salariat deoarece are cel mai mic
coe$icient de variatie12" vvv
-
8/20/2019 bazele statisticii (1)
36/38
Di#ura 1 Introducerea datelor si ale#erea "escriptive #tatisticsdin su%meniul Data Analysis
Dereastra de dialo# este prezentata in Di#ura 2
Di#ura 2 Dereastra de dialo# pentru "escriptive #tatistics
9utput-ul consta din urmatorul ta%el, corepunzator prelucrarii datelor din cele trei
#rupe&
-
8/20/2019 bazele statisticii (1)
37/38
Grupa 1(firme mici)
Grupa 2 (firme mijlocii)
Grupa 3(firme mari)
)ean
30(
1 *
32(
2 *
44(
" *
*tandard +rror 1,5119 1,8708 1,4800)edian 30 33 43)ode 30 >N? 40
*tandard eviation
4,2762(
2
11 s s =4,1833(
2
22 s s =3,9158(
2
"" s s =
*a$le Variance18,2857(
2
1 s
17,5(
2
2 s
15,3333(
2
" s
urtosis 0,9406 2,9143 -2,3115*'e/ness 0,5846 -1,5367 0,2332
ane 14 11 9)ini$u$ 24 25 40)ai$u$ 38 36 49
*u$
240(
∑=
1
1
,1
n
2
2 *
160(
∑=
2
1,2
n
2
2 *
308(
∑=
"
1,"
n
2
2 *
&ount8(
1n
5(2n
7(
"n
b)
o @edia totala la nivelul intre#ului esantion de volum20"21 =++= nnnn
$irme este
20
)**'"2+"0
"21
""2211 ⋅+⋅+⋅=++
⋅+⋅+⋅=
nnn
n *n *n * *
*,"'=⇒ * saptamani
o 6e %aza datelor de selectie calculam&• =ariatia dintre #rupe S um of S 5uares Between .roups!
( ) ( ) ( )
( ) ( ) ( ) )*,"'**'*,"'"2+*,"'"0 222"
2"2
221
21
⋅−+⋅−+⋅−=
=⋅−+⋅−+⋅−= n * *n * *n * *SS"
+,+0+=⇒ SS"
• =ariatia din interiorul #rupelor S um of S 5uares W it-in .roups!( ) ( ) ( )
( ) ( ) ( ) """",1'1)',1)1'2+'),1+1+
111 2""2
22
2
11
⋅−+⋅−+⋅−==⋅−+⋅−+⋅−= sn sn snSS'
20=⇒ SS'
• =ariatia totala
-
8/20/2019 bazele statisticii (1)
38/38
20+,+0+ +=+= SS' SS"SS6
+,10+=⇒ SS6
• Coe$icientul de determinatie este"(+,0
+,10+
*,*0*2 ===SS6
SS" R
sau, e8primat procentual,
.+,"(100+,10+
*,*0*1002. =⋅=⋅=
SS6
SS" R
arata ca $actorul de#rupare, tipul companiei, e8plica variatia totala a duratei de timp pana la prima
promovare in proportie de "(,+., restul de (",2. din variatia totala a timpului sedatoreaza altor $actori care nu au $ost considerati de cercetator
o 7ispersia de selectie la nivelul intre#ului esantion de volum20=n
de $irme este
+"1',')120
+,10+
11
esantionintre#uluinivelullatotala=ariatia2 =−
=−
=−
=n
SS6
n s
*
cu o a%atere standard
(0*),)+"1',')2 === * * s s saptamani,
iar coe$icientul de variatie este
.*+,21100*,"'
(0*),)100 =⋅=⋅=
*
sv
*
*
Ex. /. @ana#erul unei a#entii imo%iliare doreste sa e$ectueze o analiza re$eritoare la pretul devanzare zeci mii euro! al caselor din doua zone ale ucurestiului& zona Cotroceni si zona6iata =ictoriei 7atele inre#istrate au $ost prelucrate cu E8cel si s-au o%tinut urmatoarelerezultate&
Cotroceni Piata Victoriei
)ean 38,98 )ean 59,45
)edian 36,18 )edian 59,8
)ode 36 )ode 59
*tandard eviation 12,04 *tandard eviation 17,23
*a$le Variance 144,93 *a$le Variance 296,88
urtosis 1,91 urtosis -1,01
*'e/ness 1,30 *'e/ness 0,09
ane 53,20 ane 61,37
)ini$u$ 21,77 )ini$u$ 29,9
)ai$u$ 74,97 )ai$u$ 91,27
*u$ 1169,50 *u$ 1783,37
&ount 30 &ount 30
a! Caracterizati comparativ celedoua su%colectivitati pe %azaoutput-ului prezentat in
particular, caracterizaţi
omo#enitatea i asimetria$iecărei #rupe!/ %! 7eterminati in ce proportie
zona in$luenteaza pretul devanzare al caselor