exercitii statistica - partea a 2-a

7
Statistica Anul I, 2012-2013 Regula de compunere a variabilitatii; Coeficientul de determinatie Problema rezolvata si probleme propuse Problema rezolvata Un cercetător face un studiu asupra unor firme, privind şansele pe care acestea le oferă tinerilor angajaţi de a promova repede şi de a avansa în carieră. Pentru aceasta el a cuprins în studiu un număr de 20 de companii producătoare de tehnologie de vârf şi a înregistrat timpul scurs de la angajarea iniţială a unui salariat în firmă până la prima promovare a acestuia. Firmele au fost grupate după mărime, iar datele înregistrate sunt: Mărimea firmelor Număr de săptămâni de la angajare până la prima promovare Mici 30; 26; 30; 32; 38; 24; 32; 28; Medii 34; 32; 25; 36; 33 Mari 47; 41; 43; 48; 40; 49; 40. Se cere: a) să seprecizeze care este grupa de firme cu un grad mai ridicat de omogenitate; b) sa se determine in ce proportie marimea companiei influenteaza variatia timpului pana la prima promovare a unui salariat. Rezolvare: a) o Populatia statistica este multimea companiilor producatoare de tehnologie de varf. o Unitatea statistica este o companie (firma). o Caracteristicile urmarite sunt: X - variabila ce arata marimea unei firme; - variabila nenumerica avand r=3 categorii sau variante de raspuns: firme mici, firme mijlocii si firme mari: aceste categorii ale variabilei X vor determina impartirea populatiei statistice in r =3 grupe si anume: Grupa 1 (grupa firmelor mici), Grupa 2 (grupa firmelor mijlocii), Grupa 3 (grupa firmelor mari); - astfel, variabila X, marimea firmei, se mai numeste si factor de grupare. si Y - variabila ce arata durata de timp, in saptamani, de la angajare la prima promovare a unui salariat al unei firme producatoare de tehnologie de varf; - variabila numerica de interes. Din Grupa 1 (grupa firmelor mici) se selecteaza un subesantion de volum 8 1 = n firme pentru care se inregistreaza valorile variabilei Y: } 28 ; 32 ; 24 ; 38 ; 32 ; 30 ; 26 ; 30 { 1 , 1 8 , 1 7 , 1 6 , 1 5 , 1 4 , 1 3 , 1 2 , 1 1 , 1 = = = = = = = = = n y y y y y y y y y saptamani.

Upload: dumitrache-daniel

Post on 14-Sep-2015

99 views

Category:

Documents


10 download

DESCRIPTION

sdfsdsdf

TRANSCRIPT

  • Statistica Anul I, 2012-2013

    Regula de compunere a variabilitatii; Coeficientul de determinatie Problema rezolvata si probleme propuse

    Problema rezolvata Un cercettor face un studiu asupra unor firme, privind ansele pe care acestea le ofer tinerilor angajai de a promova repede i de a avansa n carier. Pentru aceasta el a cuprins n studiu un numr de 20 de companii productoare de tehnologie de vrf i a nregistrat timpul scurs de la angajarea iniial a unui salariat n firm pn la prima promovare a acestuia. Firmele au fost grupate dup mrime, iar datele nregistrate sunt:

    Mrimea firmelor Numr de sptmni de la angajare pn la prima promovare

    Mici 30; 26; 30; 32; 38; 24; 32; 28; Medii 34; 32; 25; 36; 33 Mari 47; 41; 43; 48; 40; 49; 40.

    Se cere: a) s seprecizeze care este grupa de firme cu un grad mai ridicat de omogenitate; b) sa se determine in ce proportie marimea companiei influenteaza variatia timpului

    pana la prima promovare a unui salariat.

    Rezolvare: a) o Populatia statistica este multimea companiilor producatoare de tehnologie de varf. o Unitatea statistica este o companie (firma). o Caracteristicile urmarite sunt:

    X - variabila ce arata marimea unei firme; - variabila nenumerica avand r=3 categorii sau variante de raspuns: firme mici,

    firme mijlocii si firme mari: aceste categorii ale variabilei X vor determina impartirea populatiei statistice in r =3 grupe si anume:

    Grupa 1 (grupa firmelor mici), Grupa 2 (grupa firmelor mijlocii),

    Grupa 3 (grupa firmelor mari); - astfel, variabila X, marimea firmei, se mai numeste si factor de grupare.

    si

    Y - variabila ce arata durata de timp, in saptamani, de la angajare la prima promovare a unui salariat al unei firme producatoare de tehnologie de varf;

    - variabila numerica de interes. Din Grupa 1 (grupa firmelor mici) se selecteaza un subesantion de volum 81 =n

    firme pentru care se inregistreaza valorile variabilei Y: } 28;32;24;38;32;30;26;30{

    1,18,17,16,15,14,13,12,11,1========= nyyyyyyyyy

    saptamani.

  • 2

    Media de selectie de grupa este 308

    240...

    1

    1,1

    1

    ,12,11,11

    1

    1 ===+++

    =

    =

    n

    y

    n

    yyyy

    n

    j

    j

    n

    saptamani, dispersia de selectie de grupa este

    ( ) ( ) ( ) ( )2857,18

    11

    ...

    1

    1

    21,1

    1

    21,1

    212,1

    211,12

    1

    1

    1 =

    =

    +++=

    =

    n

    yy

    n

    yyyyyys

    n

    j

    j

    n ,

    abaterea standard de selectie de grupa este 2762,42857,18211 === ss saptamani,

    iar coeficientul de variatie al acestei grupe este %25,1410030

    2762,4100

    1

    11 ===

    y

    sv .

    Din Grupa 2 (grupa firmelor mijlocii) se selecteaza un subesantion de volum 52 =n

    firme pentru care se inregistreaza valorile variabilei Y: }33 ,36 ,25 ,32 ,34{

    2,25,24,23,22,21,2====== nyyyyyy saptamani.

    Media de selectie de grupa este 325

    160...

    2

    1,2

    2

    ,22,21,22

    2

    2 ===+++

    =

    =

    n

    y

    n

    yyyy

    n

    j

    j

    n

    saptamani, dispersia de selectie de grupa este

    ( ) ( ) ( ) ( )5,17

    11

    ...

    2

    1

    22,2

    2

    22,2

    222,2

    221,22

    2

    2

    2 =

    =

    +++=

    =

    n

    yy

    n

    yyyyyys

    n

    j

    j

    n ,

    abaterea standard de selectie de grupa este 1833,45,17222 === ss saptamani,

    iar coeficientul de variatie al acestei grupe este %07,1310032

    1833,4100

    2

    22 ===

    y

    sv .

    Din Grupa 3 (grupa firmelor mari) se selecteaza un subesantion de volum 73 =n

    firme pentru care se inregistreaza valorile variabilei Y: } 40;49;40;48;43;41;47{

    2,37,36,35,34,33,32,31,3======== nyyyyyyyy

    saptamani.

    Media de selectie de grupa este 447

    308...

    3

    1,3

    3

    ,32,31,33

    3

    3 ===+++

    =

    =

    n

    y

    n

    yyyy

    n

    j

    j

    n

    saptamani,

  • 3

    dispersia de selectie de grupa este

    ( ) ( ) ( ) ( )3333,15

    11

    ...

    3

    1

    23,3

    3

    23,3

    232,3

    231,32

    3

    3

    3 =

    =

    +++=

    =

    n

    yy

    n

    yyyyyys

    n

    j

    j

    n ,

    abaterea standard de selectie de grupa este 9158,33333,15233 === ss saptamani,

    iar coeficientul de variatie al acestei grupe este %89,810044

    9158,3100

    3

    33 ===

    y

    sv .

    Cum coeficientii de variatie pentru cele trei grupe sunt mai mici ca 30%-35%,

    atunci toate grupele sunt omogene. Grupa 3 (grupa firmelor mari) este mai omogena in privinta duratei de timp de la angajare la prima promovare a unui salariat deoarece are cel mai mic coeficient de variatie 123 vvv

  • 4

    Fereastra de dialog este prezentata in Figura 2.

    Figura 2. Fereastra de dialog pentru Descriptive Statistics.

    Output-ul consta din urmatorul tabel, corepunzator prelucrarii datelor din cele trei

    grupe:

    Grupa 1 (firme mici)

    Grupa 2 (firme mijlocii)

    Grupa 3 (firme mari)

    Mean 30= 1y 32= 2y 44= 3y

    Standard Error 1,5119 1,8708 1,4800

    Median 30 33 43

    Mode 30 #N/A 40

    Standard Deviation 4,2762=211 ss = 4,1833=

    222 ss = 3,9158=

    233 ss =

    Sample Variance 18,2857=21s 17,5=

    22s 15,3333=

    23s

    Kurtosis 0,9406 2,9143 -2,3115

    Skewness 0,5846 -1,5367 0,2332

    Range 14 11 9

    Minimum 24 25 40

    Maximum 38 36 49

    Sum 240==

    1

    1,1

    n

    j

    jy 160==

    2

    1,2

    n

    j

    jy 308==

    3

    1,3

    n

    j

    jy

    Count 8= 1n 5= 2n 7= 3n

  • 5

    b)

    o Media totala la nivelul intregului esantion de volum 20321 =++= nnnn firme este

    20

    744532830

    321

    332211 ++=++

    ++=

    nnn

    nynynyy

    4,35= y saptamani. o Pe baza datelor de selectie calculam:

    Variatia dintre grupe (Sum of Squares Between Groups)

    ( ) ( ) ( )

    ( ) ( ) ( ) 74,354454,353284,3530 2223

    232

    221

    21

    ++=

    =++= nyynyynyySSB

    8,808= SSB

    Variatia din interiorul grupelor (Sum of Squares Within Groups) ( ) ( ) ( )( ) ( ) ( ) 3333,15175,17152857,1818

    111 233222

    211

    ++=

    =++= snsnsnSSW

    290= SSW Variatia totala

    2908,808 +=

    += SSWSSBSST

    8,1098= SST

    Coeficientul de determinatie este

    ...8,1098

    8,8082 ===SST

    SSBR

    sau, exprimat procentual, %...1008,1098

    8,8081002% ===

    SST

    SSBR arata ca factorul

    de grupare, tipul companiei, explica variatia totala a duratei de timp pana la prima promovare in proportie de ... %, restul de ... % din variatia totala a timpului se datoreaza altor factori care nu au fost considerati de cercetator.

    o Dispersia de selectie la nivelul intregului esantion de volum 20=n de firme este

    8315,57120

    8,1098

    11

    esantion intregului nivelul la totalaVariatia2 =

    =

    =

    =n

    SST

    ns y

    cu o abatere standard 6047,78315,572 === yy ss saptamani,

    iar coeficientul de variatie este %48,211004,35

    6047,7100 ===

    y

    sv

    y

    y .

  • 6

    Probleme propuse

    1. Managerul unui lan de supermarketuri dorete s deschid un nou magazin n unul din cele 4 cartiere principale ale unui oras. Unul din factorii importanti luati in considerare in luarea deciziei de amplasare este venitul mediu lunar al rezidentilor fiecarui cartier. Se selecteaz astfel un eantion de 80 gospodarii i se nregistreaz veniturile (mii lei). n urma prelucrrii datelor in Excel s-au obinut rezultatele:

    Groups Count Sum Average Variance

    Cartierul A 19 44,2 2,33 0,24 Cartierul B 24 78,3 3,26 0,33 Cartierul C 16 33,6 2,10 0,17 Cartierul D 21 57,3 2,73 0,46

    Se cere: a) precizati care este grupa cu cel mai ridicat grad de omogenitate; b) calculati proportia in care cartierul influenteaza variatia venitului lunar al rezidentilor; c) calculati dispersia de selectie la nivelul intregului esantion pentru venitul unei gospodarii si coeficientul de variatie; d) determinati si interpretati intervalul de incredere 98% al venitului mediu al unei gospodarii. 2. Un cercetator doreste sa determine daca un nou produs software ajuta studentii sa nvete la matematica. Pentru aceasta el formeaza 3 grupe de studiu: studentii din Grupul 1 nu beneficiaza de pregatire suplimentara la matematica n afara orelor din programa universitara, studentii din Grupul 2 beneficiaza de pregatire suplimentara n cadrul consultatiilor, iar studentii din Grupul 3 se pregatesc pe baza programului tutorial pe calculator. Dupa o luna de zile de pregatire la matematica, studentii primesc un test, punctajele obtinute la test fiind prezentate in tabelul urmator:

    Grupul 1 - Fara pregatire suplimentara Grupul 2 - Consultatii Grupul 3 Program tutorial

    23 30 32

    22 27 30

    22 22 24

    23 23 22

    17 19 21

    18 19 20

    15 21 19

    Determinati in ce proportie modul de pregatire la matematica a influentat rezultatele obtinute la test de catre studenti. Rezolvati problema in Excel. 3. O fabrica de produse de patiserie produce un tip de fursecuri pe care l comercializeaza ntr-un supermarket. n vederea stimularii vnzarilor, managerul supermarketului hotaraste sa schimbe locatia de amplasare a produsului timp de 15 saptamni. Astfel, produsul este mutat saptamnal n 3 locatii: la raionul de patiserie, la raionul de lactate si lnga casa de marcat, nregistrndu-se vnzarile saptamnale obtinute. n urma prelucrarii datelor s-au obtinut urmatoarele rezultate preliminare:

    Group Count Average Standard deviation

    Raionul de lactate 5 35,0 7,96

    Casa de marcat 5 49,0 11.85

    Raionul de patiserie 5 23,4 5.63

    Determinati in ce proportie variatia vanzarilor este influentata de locatia de expunere a produselor.

  • 7

    4. Managerul unui lant de supermarketuri doreste sa deschida un nou magazin n una din cele 4 zone diferite ale unui oras mare. Unul din factorii importanti n luarea acestei decizii l constituie venitul mediu anual al gospodariilor rezidentilor din fiecare zona. ntr-un studiu preliminar, diferiti rezidenti ai celor 4 zone sunt ntrebati care este venitul mediu anual al gospodariilor din care fac parte (Y). In urma prelucrarii datelor s-au obtinut urmatoarele rezultate:

    Zona (X) Numar gospodarii i

    iy i

    iy2

    A 6 159 4345

    B 9 294 10464

    C 7 182 5550

    D 5 138 4134

    Completati tabelul:

    Groups Count Sum Average Variance Standard Deviation Coefficient of variation

    Calculati in ce proportie variatia venitului lunar al gospodariilor este influentata de alti factori, in afara cartierului de rezidenta. 5. O agentie de ocupare a fortei de munca este interesata sa studieze care din cele 3 tipuri de anunt publicitar, publicat la rubrica de "Cereri si oferte de angajare" dintr-un ziar local este cel mai eficient. Cele 3 tipuri de anunturi (cel tiparit cu caractere mari, cel tiparit cu caractere obisnuite si cele tiparit cu caractere bold) sunt alternate aleator timp de 18 saptamni si este inregistrat numarul persoanelor care au raspuns la anunt in fiecare saptamna. Rezultatele preliminare ale prelucrarii datelor sunt:

    Groups Count Average

    Caractere mari 7 33,43

    Caractere obisnuite 5 23,60

    Caractere bold 6 34,00

    Stiind ca numarul respondentilor inregistreaza - pe total esantion - un coeficient de variatie de 27,2%, aflati in ce proportie tipul de anunt influenteaza eficacitatea acestuia (masurata prin numarul mediu de respondenti). 6. Pentru compararea puterii de frnare a 4 tipuri de anvelope auto a fost inregistrata distanta de frnare a unui vehicol pe carosabil umed. Este testata cte o anvelopa din fiecare tip pe acelasi autovehicol. Se dau urmatoarele rezultate preliminare:

    Groups Count Variance

    Tip A 6 4,00

    Tip B 5 4,00

    Tip C 4 4,67

    Tip D 7 1,67

    Stiind ca dispersia distantei de frnare, la nivelul esantionului este de 3,636, determinati coeficientul de determinatie.