cap_3(1)egg32

16
Capitolul 3 Statistică descriptivă 3.1 Noţiuni fundamentale Analiza experimentalã a unei mãrimi constã în efectuarea a numeroase mãsurãtori şi înregistrarea rezultatelor obţinute. Mulţimea elementelor luate în studiu poartã denumirea de populaţie statisticã , colectivitatea statisticã . sau lot . Un element al populaţiei statistice se numeşte unitate statisticã sau individ statistic . In funcţie de numãrul indivizilor statistici populaţia statisticã poate fi finitã sau infinitã. O populaţie poate fi omogenã dacã elementele componente sunt de acelaşi tip, sau neomogenã la care elementele componente sunt de tipuri diferite. Aplicaţia 3.1 Un lot de bucse cu diametrul de 10±0,1 produse prin sinterizare reprezintã o populaţie statistică omogenã. Mulţimea bucselor produse de SC Sinterom SA într- o lunã reprezintã o populaţie neomogenã; Datele experimentele provenite din mãsurarea forţei de aşchiere la rectificare reprezintã o populaţie statisticã omogenã. Datele experimentale provenite din mãsurarea regimului de aşchiere (s,t,v) la rectificare reprezintã o populaţie neomogenã. Metodele statistice se aplicã numai populaţiilor omogene. Proprietatea comunã tuturor unitãţilor statistice provenite dintr-o populaţie omogenã poartã denumirea de caracteristicã, sau variabilã. O populaţie poate

Upload: pascunicoleta12

Post on 29-Sep-2015

2 views

Category:

Documents


0 download

DESCRIPTION

Cap_3(1)egg32

TRANSCRIPT

  • Capitolul 3

    Statistic descriptiv 3.1 Noiuni fundamentale

    Analiza experimental a unei mrimi const n efectuarea a numeroase

    msurtori i nregistrarea rezultatelor obinute. Mulimea elementelor luate n studiu poart denumirea de populaie statistic, colectivitatea statistic. sau lot. Un element al populaiei statistice se numete unitate statistic sau individ statistic.

    In funcie de numrul indivizilor statistici populaia statistic poate fi finit sau infinit.

    O populaie poate fi omogen dac elementele componente sunt de acelai tip, sau neomogen la care elementele componente sunt de tipuri diferite.

    Aplicaia 3.1 Un lot de bucse cu diametrul de 100,1 produse prin sinterizare reprezint o

    populaie statistic omogen. Mulimea bucselor produse de SC Sinterom SA ntr-o lun reprezint o populaie neomogen;

    Datele experimentele provenite din msurarea forei de achiere la rectificare reprezint o populaie statistic omogen. Datele experimentale provenite din msurarea regimului de achiere (s,t,v) la rectificare reprezint o populaie neomogen.

    Metodele statistice se aplic numai populaiilor omogene. Proprietatea comun tuturor unitilor statistice provenite dintr-o populaie omogen poart denumirea de caracteristic, sau variabil. O populaie poate

  • Capitolul 3 54

    avea una sau mai multe caracteristici. Notarea acestora se face cu liter mare.

    Caracteristicile pot fi:

    - cantitative - exprimate prin valori numerice

    - calitative - exprimate prin atribute ca bun - defect; satisfctor - nesatisfctor etc.

    Caracteristicile cantitative pot fi

    - discrete - numerele care le reprezint aparin mulimii numerelor ntregi sau raionale (numrul de piese defecte dintr-un lot) - continue - dac ntr-un interval se poate obine orice valoare real pentru caracteristic.

    Datele experimentele pot fi culese printr-o cercetare:

    - complet, n cazul msurrii caracteristicii fiecrui individ statistic

    - selectiv, n cazul msurrii caracteristicilor pentru un anumit numr de indivizi

    statistici care formeaz un eantion sau o selecie. Valoarea numeric a unei caracteristici cantitative referitoare la o unitate

    statistic se numete valoare observat. Totalitatea valorilor observate formeaz datele experimentale.

    3.2 Repartiii experimentale

    3.2.1 Tabele

    Colectarea datelor experimentale se face n scopul determinrii

    caracteristicilor populaiilor statistice, formarea unor concluzii privind comportamentul populaie i lurii unor decizii. Statistica descriptiv reprezint forma cea mai simpl de analiz a

    caracteristicilor unei populaii. Ea include colectarea de date, prezentarea lor sub form de tabele, ntocmirea unor reprezentri grafice i stabilirea indicatorilor statistici.

    Tabelele trebuie n aa fel ntocmite nct s permit o interpretare direct i uoar fr a mai necesita texte aplicative suplimentare. Tabelele sunt formate dintr-o reea de linii i coloane n care sunt trecute valorile obinute ale caracteristicii. Primul tabel care se ntocmete este tabelul datelor primare n care sunt trecute n ordinea msurrii caracteristicile cercetate.

    3.1 Tabelul datelor primare

    60 77 71 74 78 66 76 74 82 6973 72 61 76 67 73 75 68 72 79

  • Statistic descriptiv 55

    71 69 82 72 62 83 73 68 74 7273 83 67 85 70 75 63 76 72 7769 71 72 76 67 80 73 77 65 74

    Aceleai valori aranjate n ordine cresctoare astfel ca ntre dou valori consecutive s existe relaia

    ( )xx 1ii +< (3.1)formeaz tabelul valorilor ordonate (Tab.3.2). Totalitatea valorilor unei caracteristici

    scrise ntr-o anumit ordine (cresctoare sau descresctoare) formeaz un ir statistic

    Tab.3.2 Tabelul valorilor ordonate

    60 62 64 65 65 66 67 67 67 6868 69 69 69 70 71 71 71 72 7272 72 72 72 73 73 73 73 73 7474 74 74 75 75 76 76 76 76 7777 77 78 79 80 82 82 83 83 85

    3.2.2 Frecvene i intervale In tabelul valorilor ordonate se observ c unele valori se repet. In

    consecin este posibil alctuirea unui nou tabel n care s fie puse n eviden numrul de apariii a unei valori. Un astfel de tabel poart denumirea de tabel cu simpl intrare. Construcia acestor tabele se mai poate realiza i prin mprirea amplitudinii msurtorii ntr-un numr de intervale disjuncte. Mrimea intervalelor se

    ia n general egal cu excepia intervalelor extreme pentru care uneori se pot adopta valori diferite. Amplitudinea msurtorii se determin ca diferen ntre valoarea maxim i minim:

    XXA minmax = (3.2) Numrul intervalelor se determin cu:

    1. Relaia lui H.A.Sturges: m n= + 1 3 322, lg (3.3)

    n care n reprezint numrul total al datelor de observaie. 2. Relaia lui H.B.Mann i A. Wald pentru n>100:

    m n= 4

    1

    41

    1

    5( ) (3.4)

    3. Prin adoptarea numrului ntreg dat de relaia: m n= (3.5)

  • Capitolul 3 56

    In general s-a constatat c pentru n

  • Statistic descriptiv 57

    cuprins n intervalul [3, 4] este P(A)=4/15. In multe cazuri este necesar s cunoatem numrul total de uniti statistice pn la o anumit valoare a caracteristicii sau numrul de la o anumit valoare n

    sus. Acest numr reprezint frecvena cumulat cresctoare respectiv frecvena cumulat descresctoare, (Tab.3.3). Dup cum sunt raportate acestea pot fi absolute

    sau relative:

    c ii

    i

    cc

    d ii n

    i

    dd

    A a FA

    nA a F

    A

    n= = = =

    = =1 (3.8)

    Tabelele statistice cu simpl intrare prezint informaii asupra repartiiei frecvenelor. O imagine mai sugestiv a repartiiei frecvenelor se obine cu ajutorul graficelor

    3.2.3 Diagramele repartiiei Graficele cel mai frecvent folosite sunt: histogramele diagramele cu bare,

    poligonul frecvenelor i diagramele circulare. Histogramele sunt diagrame formate din dreptunghiuri a cror baz este egal cu mrimea intervalului de grupare i nlimea proporional cu frecvena. Se poate utiliza frecvena absolut, (Fig.3.1), frecvena relativ, (Fig.3.2), frecvena cumulat cresctoare, (Fig.3.3), sau frecvena cumulat descresctoare, (Fig. 3.4). Diferite programe utilitare cum ar fi programul EXCEL permit vizualizarea

    histogramelor n 2D sau 3D.

    0

    5

    10

    15

    20

    0

    0.2

    0.4

    Fig.3.1 Histograma frecvenelor absolute n 2D

    Fig.3.2 Histograma frecvenelor relative n 3D

  • Capitolul 3 58

    Diagramele cu bare se construiesc similar histogramelor pentru repartiii discrete. Se realizeaz o diagram in care nlimea barelor trasate este proporional cu frecvenele respective (Fig.3.5).

    0 20 40 60

    0 0.10.20.30.40.50.60.70.80.9 1

    Fig.3.3 Histograma frecvenelor cumulate cresctor n 2D

    Fig.3.4 Histograma frecvenelor cumulate descresctor n 3D

    Poligonul frecvenelor se obine dintr-o diagram cu bare prin unirea capetelor barelor (Fig.3.6). Imaginea obinut se apropie de imaginea funciilor de repartiie clasice.

    `

    0

    2

    4

    6

    8

    10

    12

    14

    16

    0

    2

    4

    6

    8

    10

    12

    14

    16

    Fig.3.5 Diagrama cu bare Fig.3.6 Poligonul frecvenelor

  • Statistic descriptiv 59

    Diagrame circulare se traseaz din arce de cerc a cror arie este proporional cu frecvena (Fig.3.7) 3.2.4 Indicatori statistici

    Din studiul unei histograme se poate observa c datele experimentale prezint dou

    tendine: - una de localizare - datele se concentreaz n jurul unei valori;

    - una de mprtiere - datele rezultate n urma msurtorii se vor ncadra totdeauna intr-un interval;

    In practic se pune de multe ori problema comparrii a dou sau mai multe

    repartiii experimentale. Cu ajutorul tabelelor statistice sau a graficelor rezultatele sunt de afectate de erori. O comparaie eficient se poate face prin analizarea unor parametrii specifici irurilor statistice numii indicatori statistici. Specific tendinei datelor indicatorii statistici se clasific n: - indicatori de localizare;

    - indicatori de mprtiere. 3.2.4.1 Indicatori de localizare

    Indicatorul de localizare este o valoare teoretic, care poate s nu existe

    practic printre valorile msurate, el indicnd valoarea spre care tind s se grupeze

    datele reale. Indicatorul de baz al tendinei de localizare l reprezint media care poate fi calculat n mai multe feluri.

    Media aritmetic: Considernd valorile unei caracteristici X: x1, x2, ...,xn, media aritmetic este dat de relaia:

    2% 10%

    14%

    32%

    24%

    10%8%

    Fig.3.7 Diagram circular

  • Capitolul 3 60

    n

    x

    ]x[M

    n

    1ii

    = =

    (3.9)

    Media aritmetic se noteaz n general cu M[x], pentru loturi de fabricaie media este notat cu i pentru eantioane cu x . Dac x1, x2, ...,xn se repet, respectiv cu frecvenele absolute a1, a2, ...,an, atunci media aritmetic este:

    n

    xa

    ]x[M

    n

    1ii i= = (3.10)

    Media geometric: Cu valorile x1, x2, ...,xn, media geometric este:

    nn

    1iin n21g xx...xxM == = (3.11)

    Media armonic: Pentru valorile x1, x2, ...,xn, media armonic se obine cu relaia

    =

    =n

    1i i

    a

    x

    1n

    M (3.12)

    Media ptratic: Pentru aceleai valori media ptratic este:

    n

    x

    M

    n

    1ii

    p

    = = (3.13)

    Mediana: Valoarea caracteristicii care ocup locul central n irul ordonat de valori, mprind caracteristica n dou grupe egale ca numr: Dac irul conine un numr impar de valori (n=2k+1) valoarea medianei este dat de valoarea

    unitii statistice de rang (n+1)/2, adic: [ ]xM 2/)1n(e += (3.14)

    In cazul unui numr par de valori mediana este egal cu media aritmetic a celor

    dou valori centrale:

    2)xx

    M12n()2/n(

    e++= (3.15)

    Dac valorile sunt grupate pe clase intervalul care conine elementul median se numete interval median sau clas median. Mediana se determin mult mai uor dect media i nu necesit nici un calcul. Din cauza uurinei de determinare mediana este folosit frecvent n industrie la controlul statistic al fabricaiei. Mediana este preferat uneori mediei fiind mai puin afectat de valorile extreme. Mediana este mai stabil la fluctuaiile de selecie dect media aritmetic.

  • Statistic descriptiv 61

    Mod sau modal: Este valoarea caracteristicii corespunztoare celei mai mari frecvene. In cazul n care repartiia frecvenelor este reprezentat de o curb, moda corespunde valorii maxime a caracteristicii. Dup cum repartiia experimental are unul dou sau mai multe maxime, se numete unimodal, bimodal, sau polimodal. Dac valorile sunt grupate pe clase intervalul care

    conine elementul median se numete interval median sau clas median. Valoarea central: ca indicator al localizrii se utilizeaz i media extremelor

    valorilor caracteristicii:

    2XXX minmaxc

    += (3.16)Valoarea central se poate referi i la un interval de grupare de ordinul I care reprezint media valorilor limit (inferior i superior) ale intervalului:

    2xX

    Xsupi

    infi

    ci+= (3.17)

    Proprieti i observaii referitoare la indicatorii statistici de localizare: 1. Pentru repartiii unimodale simetrice, abaterea medianei fa de media

    aritmetic este egal cu o treime din abaterea modului fa de media aritmetic:

    3Mx

    Mxo

    e

    = (3.18)

    2. Mediile aritmetic i ptratic sunt influenate de valorile mari ale seriei. 3. Mediile geometric i armonic sunt influenate de valorile mici i reduc din influena valorilor mari. 4. Intre cei patru indicatori ai mediei exist relaia:

    MxMM pga

  • Capitolul 3 62

    Dac x1, x2, ...,xn se repet, respectiv cu frecvenele absolute a1, a2, ...,an, atunci dispersia este:

    [ ] =

    ==

    = n1i

    ii2

    n

    1iii

    2

    f])x[Mx(n

    a])x[Mx(xD (3.21)

    In cazul estimrii dispersiei populaiei cu ajutorul unei selecii, dispersia de selecie se ajusteaz cu un factor de corecie n/(n-1). In acest caz dispersia se numete dispersie corectat :

    [ ]1n

    ])x[Mx(xD

    1nn]x[D

    n

    1ii

    2

    C

    ===

    (3.22)

    Abaterea medie ptratic: Acest indicator, D[x], se obine din rdcina ptrat a dispersiei i se noteaz cu pentru lot i cu s pentru eantion.

    [ ] = ==

    = n1i

    22i

    n

    1ii

    2

    ]x[Mxn

    1n

    ])x[Mx(xD

    (3.23)

    Considernd frecvenele absolute sau relative expresiile abaterii medii ptratice devin:

    [ ] ]x[Mn

    ax

    n

    a])x[Mx(xD 2

    n

    1ii

    2i

    n

    1iii

    2

    =

    = ==

    [ ] ( ) = ===n

    1i

    2i

    2i

    n

    1iii

    2 ]x[Mfxf]x[MxxD

    (3.24)

    In cazul n care abaterea medie ptratic se estimeaz cu ajutorul unei selecii rezult:

    sx x

    n

    ii

    n

    =

    =2

    1

    1

    ( )

    (3.25)

    Abaterea unei caracteristici poate fi considerat n raport cu orice constant. In

    general abaterea se ia in raport cu media aritmetic i-n acest caz se numete abatere standard.

    Amplitudinea: este un indicator statistic definit ca diferena valorilor extreme. xxW minmax = (3.26)

    In mod similar se poate defini amplitudinea clasei, w, sau a intervalului de grupare

    care reprezint diferena ntre valorile extreme ale intervalului.

  • Statistic descriptiv 63

    Intervalul intercuartilic Cuartilele sunt definite de trei valori Q1, Q2, Q3, care mpart amplitudinea n patru intervale astfel ca

    frecvenele relative ale intervalelor s fie egale ntre ele.

    Rezult c 25% din numrul msurtorilor sunt inferioare cuartilei Q1, 25% din numrul observaiilor sunt superioare cuartilei Q3. Cuartila Q2 este egal cu mediana Me.

    Intervalul intercuartilic este definit de diferena dintre prima i ultima cuartil:

    QQI 13Q = (3.27) Coeficientul de variaie intercuartilic este definit de raportul:

    MQQ

    QQQ

    qe

    13

    2

    13 == (3.28) Coeficientul de variaie: Reprezint valoarea abaterii standard raportat la media aritmetic.

    [ ]x

    sCsau]x[M

    xDC vv == (3.29)

    Acest coeficient poate fi exprimat n procente. Relaiile pot fi utilizate i n cazul valorilor grupate pe clase.

    Proprieti i observaii referitoare la indicatorii de variaie. 1. Suma algebric a abaterilor fa de media aritmetic este egal cu zero. Notnd

    abaterea valorii de ordinul I n raport cu media aritmetic:

    xxii = (3.30)Media aritmetic a abaterilor este:

    0xxn

    xnx

    n

    1)xx(n

    1n

    1 n

    1i

    n

    1iii

    n

    1ii == === = ==

    (3.31)

    Dac: 1

    01n

    ii

    n = = rezult: i

    i

    n = =

    1

    0

    Deoarece suma erorilor msurtorilor fa de media aritmetic este zero, pentru aprecierea erorii totale este necesar ca aceste abateri s fie ridicate la ptrat

    i apoi nsumate, cea ce ne conduce la formula dispersiei. In consecin dintre indicatorii de mprtiere dispersia i abaterea standard reprezint cei mai buni estimatori ai dispersiei.

    ai

    Xmin Q1 Q2 Q3 Xmax

    Fig.3.8 Intervalele interquartilice

  • Capitolul 3 64

    2. Suma abaterilor ptratice are valoarea minim atunci cnd sunt calculate n

    raport cu media aritmetic. Considernd suma abaterilor ptratice n raport cu

    valoarea arbitrar x0.

    [ ] == =n

    1i

    n

    1i0i

    20i

    2 )xx()xx()xx( (3.32)

    Dezvoltnd termenul din partea dreapt se obine:

    [ ]20 2 0 201111

    2( ) ( ) ( ) ( ) ( ) ( )i i ii

    n

    i

    n

    i

    n

    i

    n

    x x x x x x x x x x x x = + ==== (3.33)

    Aplicarea proprietii 1 conform creia suma abaterilor fat de media aritmetic conduce la:

    +== =n

    1i

    n

    1i0

    2i

    20i

    2 )xx(n)xx()xx( (3.34)

    Rezult:

    >= =n

    1i

    n

    1ii

    20i

    2 )xx()xx( (3.35)

    Deci suma abaterii ptratice este minim dac:

    xx 0 = (3.36)3. Abaterile n raport cu o constant oarecare X0 sunt folosite uneori pentru

    simplificarea unor calcule. Astfel valoarea medie a caracteristicii se obine mai uor dac se calculeaz suma abaterilor xi =xi-x0 adoptndu-se astfel ordinul de mrime cel mai convenabil:

    xxxxn

    1)xx(n

    1'x

    n

    1'x 00

    n

    1i0

    n

    1i0i

    n

    1ii == == ===

    (3.37)

    de unde:

    'xx'xn

    1xx 0

    n

    1ii0 =+= =

    (3.38)

    4. Dispersia i abaterea standard sunt cei mai utilizai indicatori de variaie.

    3.3 Momente

    Pentru stabilirea formei funciei de repartiie experimentale i a unor particulariti a acesteia s-a introdus noiunea de moment. Intre acetia i indicatorii de baz exist o strns legtur. Momentele se mpart n dou categorii:

    - momente absolute de ordinul k la care valorile sunt considerate n raport cu

  • Statistic descriptiv 65

    originea;

    - momente centrate de ordinul k (la care valorile sunt exprimate n raport cu o

    valoare arbitrar)

    3.3.1 Moment absolut de ordinul K

    Prin definiie momentul absolut de ordinul k este dat de relaia:

    ==n

    1ikik x

    n

    1m

    (3.39)

    unde x1, x2,...,xn, sunt valorile msurate, ale caracteristicii X. Momentul absolut de

    ordinul k poate fi exprimat i cu ajutorul frecvenelor absolute sau relative.

    k ik

    i

    n

    i ik

    i

    n

    imn

    x a x f= = = =

    1

    1 1

    (3.40)

    Se observ c momentul absolut de ordinul 1 reprezint media aritmetic.

    11

    1m

    nx xi

    i

    n= ==

    (3.41)

    De asemenea momentul absolut de ordinul 2 este egal cu ptratul mediei

    ptratice.

    22

    1

    21m

    nx Mi

    i

    n

    p= == (3.42)

    3.3.2 Momentul centrat de ordinul k

    Prin definiie, momentul centrat de ordinul k n raport cu o origine arbitrar este:

    ==n

    1ii

    kk )x(n

    1M (3.43)

    sau n funcie de frecven: f)x(a)x(

    n

    1M i

    n

    1ii

    ki

    n

    1ii

    kk = = ==

    (3.44)

    Momentul centrat de ordinul k n raport cu media aritmetic se noteaz cu Mk

    i este dat de expresia:

    ==n

    1ii

    kk )xx(

    n

    1M

    (3.45)

    sau:

  • Capitolul 3 66

    f)xx(a)xx(n

    1M i

    n

    1ii

    ki

    n

    1ii

    kk = = ==

    (3.46)

    Momentul centrat de ordinul 2 este egal cu dispersia:

    [ ]xD)xx(n

    1M

    n

    1ii

    22 = = =

    (3.47)

    Intre momentele absolute i cele centrate se pot scrie urmtoarele relaii:

    [ ]

    m3mm6mm4mMm2mm3mM

    xDmmM

    0M

    1213144

    312133

    2122

    1

    +=+=

    ===

    (3.48)

    3.3.3 Corecia momentelor In general gruparea valorilor pe clase conduce la anumite erori, deoarece n

    calculele indicatorilor statistici frecvena este considerat corespunztoare valorii centrale a intervalului de grupare. Aceast consideraie presupune o repartiie uniform a datelor n interiorul clasei, lucru rar ntlnit. Corectarea valorilor din acest

    punct de vedere este cunoscut sub numele de corecia Sheppard. Media nu necesit nici o corecie deoarece:

    )x(n

    1x

    n

    1x

    n

    1ii

    n

    1ii +== ==

    (3.49)

    Nici momentul absolut de ordinul trei nu necesit corecii. Momentele absolute de ordinul 2 i 4 se corecteaz conform relaiilor:

    4244

    222

    2407

    m21

    mm

    121

    mm

    +=

    =

    (3.50)

    unde reprezint amplitudinea intervalului de grupare.

    3.3.4 Indicatori pentru asimetrie i aplatizare Exist diferite moduri prin care se poate aprecia asimetria unei repartiii: Cel mai utilizat este coeficientul de asimetrie i coeficientul de exces exprimat de relaiile:

    [ ]xDM

    MM

    33

    2/32

    31 == (3.51)

    [ ] 3xDM3

    MM

    24

    22

    42 == (3.52)

  • Statistic descriptiv 67

    Coeficientul de asimetrie indic tipul de asimetrie, conform celor prezentate n

    figura 9.9.

    1>0

    Fig.3.9 a Asimetrie dreapta

    1=0

    Fig.3.9 b Simetrie

    1

  • Capitolul 3 68