cursul al iv-lea - universitatea de medicina si farmacie ... mg - cursul iv.pdfآ  biostatisticؤƒ...

Download CURSUL AL IV-LEA - Universitatea de Medicina si Farmacie ... MG - Cursul IV.pdfآ  Biostatisticؤƒ - Cursul

Post on 31-Aug-2019

4 views

Category:

Documents

0 download

Embed Size (px)

TRANSCRIPT

  • Biostatistic - Cursul al IV-lea

    CURSUL AL IV-LEA

    1 Reprezentarea grafic a datelor statistice - Consideraii generale

    Sunt dou metode de baz n statistic: numeric i grafic. Folosind metoda numeric putem calcula statistici ca media i deviaia standard. Aceste statistici poart informaie despre tendina central i variabilitate, altele poart alt tip de informaie. Metoda grafic este mai potrivit dect cea numeric pentru identificarea vizual a tendinei datelor. Metoda numeric este mai obiectiv i mai precis. De vreme ce se completeaz una pe alta, este util s le folosim combinat.

    Informaia coninut n date culese i nregistrate este dup cum s-a vzut n capitolul despre indicatori statistici, greu de sintetizat pentru a avea o imagine ct mai clar despre situaia pe care acestea o reflect. Indicatorii statistici ofer o sintez mai mult sau mai puin fidel a informaiei, pierznd inerent din informaie. Totui, pierderea de informaie datorat nlocuirii unei serii de valori prin indicatorii si nu este totdeauna o pierdere de care s ne ferim, din contr, de cele mai multe ori, indicatorii statistici ofer o imagine mai util dect datele n sine. De obicei, pierderea de informaie este un ru necesar.

    De la nceputurile statisticii, o metod de sintetizare a informaiei mult folosit este reprezentarea grafic a datelor. Informaia prezentat vizual este mult mai penetrant pentru simuri i chiar pentru intelect i de obicei o imagine bun este mai util ca o mie de cifre . Reprezentarea grafic a datelor se face ns cu mult discernmnt cci, aa cum se va vedea mai jos, nu orice grafic ne spune ceva, iar cantitatea de informaie care se pierde la reprezentare trebuie foarte atent controlat.

    De-a lungul timpului au fost folosite multe tipuri de grafice perntru a reprezenta ct mai bine informaia coninut n date. Cele mai des folosite grafice sunt histograma, graficul cu bare, poligonul frecvenelor, graficul liniar de evoluie n timp, diagrame, grafice punctuale etc.

    Pentru o mai bun nelegere s discutm nti cazul unui tip de grafic care a fcut carier n toate domeniile de aplicabilitate ale statisticii: histograma.

    2. Graficul histogram Ca i concept, histograma este de fapt echivalentul grafic al tabelului de frecvene. Mai nti s lucrm pe un exemplu concret i apoi s urmrim problemele specifice care pot face din histogram un instrument util de lucru sau un balast.

    Avem mai jos un tabel care sintetizeaz situaia parametrului Greutate corporal la 1014 pacieni cu diferite afeciuni:

    Tabelul 1 Greutatea corporal a 1014 pacieni cu diferite afeciuni, pe clase din 5kg n 5kg

    Clasa Greutate(Kg)

    Frecvena

    (Nr indivizi) 1 35..40 17 2 40..45 46 3 45..50 84 4 50..55 108 5 55..60 130 6 60..65 136 7 65..70 160 8 70..75 113 9 75..80 106

    10 80..85 54 11 85..90 29 12 90..95 12 13 95..100 9

    1

  • Biostatistic - Cursul al IV-lea Acum s privim graficul din figura 1, care reprezint situaia din tabel:

    Figura 1 Histograma greutilor corporale a 1014 pacieni cu diferite afeciuni

    Mai nti, ce s-a reprezentat de fapt? Se oserv c pe orizontal sunt figurate clasele din tabel n ordine, fiecreia fiindu-i alocat un segment de aceeai lungime, iar pe vertical, dreptunghiurile au nlimi proporionale cu frecvenele absolute ale claselor. Mulimea barelor verticale este cea care ne d impresia vizual pe care trebuie s o interpretm n sensul sitetizrii informaiei. Observm:

    Din stnga se ncepe cu bare scunde care cresc n nlime pe msur ce ne apropiem de clasa din centru, dup care are loc un proces invers. Este tendina natural la cele mai multe situaii. Datele au de cele mai multe ori tendina de a se situa n stnga i drepta mediei, din ce n ce mai puine pe msur ce ne deprtm de medie. Pe acest grafic nu este figurat media dar este de bun sim s ne gndim c este situat undeva n clasele de mijloc.

    Indivizii care au sub 35 Kg i cei peste 100 Kg, probabil foarte puini, nu au fost luai n calcul. Se obinuiete totui ca ei s fie luai n considerare prin introducerea a dou clase speciale. n acest caz, clasele speciale de introdus ar fi fost: clasa sub 35 i clasa peste 100. De obicei aa este bine s se procedeze.

    Modul cum cresc barele este diferit de modul cum descresc. Aceasta este ceea ce se numea la indicatorii statistici asimetria. Aceast histogram arat o uoar asimetrie la dreapta. Dac indivizii de la care s-au cules datele ar fi fost normali, histograma ar fi avut un aspect mai simetric. Asimetria acestei hitograme ne arat c n clasele de la 40 la 65 kg sunt mai muli indivizi dect n clasele simetrice lor de la 75 la 90 kg. Avnd n vedere c majoritatea lor sunt brbai, acest asimetrie ne spune c un numr de indivizi au greutatea mai mic dect ar fi normal. Acest lucru este explicabil n acest caz, deoarece cei mai muli au afeciuni hepatice grave ca ciroz hepatic, cancer hepatic, i sunt ntr-o stare fizic mult slbit.

    n acest caz, am explicat forma histogramei pe baza realitii. De obicei ns se ntmpl exact invers. Histograma este aceea care ne ajut s nelegem mai bine realitatea.

    Pentru a realiza diferena dintre o distribuie simetric i una asimetric, s transpunem ntr-o histogram situaia din tabelul 2, care sistematizeaz situaia supravieuirilor n cazurile de cancer mamar pe un lot de 2456 de pacieni.

    Tabelul 2 Situaia supravieuirilor n cazurile de cancer mamar. Gruparea n clase de 12 luni Nr.Crt Perioada Nr.cazuri Procent % Procent Cumulat %

    1 0..12 luni 672 27.36 27.36 2 12..24 luni 446 18.16 45.52 3 24..36 luni 368 15.00 60.52 4 36..48 luni 249 10.14 70.66 5 48..60 luni 196 8.00 78.66 6 60..72 luni 172 7.00 85.66 7 72..84 luni 126 5.13 90.79 8 84..96 luni 98 4.00 94.79 9 96..108 luni 45 1.83 96.62

    10 108..120 luni 31 1.26 97.88 11 Peste 120 luni 52 2.12 100.00

    2

  • Biostatistic - Cursul al IV-lea n figura 2, este reprezentat histograma corespunztoare pentru tabelul 2. Se observ c barele histogramei au nlimi descresctoare ntocmai ca i frecvenele absolute ale claselor.

    Figura 2 Histograma corespunztoare pentru tabelul 2. Se observ c barele histogramei au nlimi

    descresctoare ntocmai ca i frecvenele absolute ale claselor

    Se observ la aceast histogram c are o asimetrie foarte puternic spre dreapta. Vom considera totdeauna (ca o convenie), s spunem c o histogram arat asimetria spre partea unde descreterea este mai lent. Tendina observat n aceast histogram este normal, avnd n vedere fenomenul surprins. Procesele de supravieuire sunt de obicei marcate de o distribuie a valorilor cu excentricitate spre dreapta, adic spre supravieuiri lungi.

    Pentru o familiarizare cu acest tip de grafic foarte important, s urmrim cteva situaii culese din practica medical. n figura 3, avem reprezentat histograma tensiunii arteriale la 593 de pacieni cu diferite afeciuni. Se observ o excentricitate puternic, spre dreapta. n figura 4 avem histograma valorilor hemoglobinei la 738 de pacieni cu diferite afeciuni. Se observ o distribuie a valorilor mai simetric dect n figurile 2 i 3. n figura 5 se vede histograma taliei la 1042 pacieni pe clase din 5cm n 5cm. Este un exemplu de distribuie cu o uoar asimetrie spre stnga, mai rar ntlnit n practic. Figura 6 prezint histograma vrstelor la 308 pacieni cu afeciuni hepatice. Se observ c graficul are dou vrfuri. Se spune despre acest tip de distribuie a datelor c este bimodal. Este un lot neomogen, alctuit din dou subloturi, unul cu maximul n jurul vrstei de 45 50 de ani i cellalt n jurul vrstei de 65 70 de ani. n practic se ntlnesc rar astfel de situaii. n mod normal, ntr-un asemenea caz, se studiaz fiecare sublot n parte din punctul de vedere al vrstei

    Figura 3 Histograma tensiunii arteriale la 593 de pacieni cu diferite afeciuni. Se observ o

    excentricitate puternic, spre dreapta

    3

  • Biostatistic - Cursul al IV-lea

    Figura 4 Histograma valorilor hemoglobinei la 738 de pacieni cu diferite afeciuni. Se observ o

    distribuie a valorilor ma simetric dect n figurile 5.2 i 5.3.

    Figura 5 Histograma taliei la 1042 pacieni pe clase din 5cm n 5cm. Este un exemplu de distribuie cu o

    uoar asimetrie spre stnga, mai rar ntlnit n practic.

    Figura 6 Histograma vrstelor la 308 pacieni cu afeciuni hepatice. Se observ c graficul are dou vrfuri. Se spune despre acest tip de distribuie a datelor c este bimodal. Este un lot neomogen, alctuit din dou subloturi, unul cu maximul n jurul vrstei de 45 50 de ani i cellalt n jurul vrstei de 65 70 de ani. n practic se ntlnesc rar astfel de situaii. n mod normal, ntr-un asemenea caz, se studiaz fiecare sublot n parte.

    4

  • Biostatistic - Cursul al IV-lea Poligonul frecvenelor

    Este un grafic care reprezint frecvenele absolute dintr-un tabel de frecven printr-o linie frnt. Clasele se realizeaz ca i la histogram. Linia frnt, leag puncte din plan care au ca ordonate frecvenele de reprezentat, iar ca abscise, mijloacele claselor. Graficul se poate realiza i din histogram, prin unirea mijloacelor laturilor superioare ale barelor.

    n figura 7 este reprezentat un exemplu de modul cum se obine poligonul frecvenelor din histogram.

    Figura 7 Poligonul frecvenelor obinut prin unirea mijloacelor laturilor superioare ale barelor unei histograme.

    n figura 8 este reprezentat poligonul frecvenelor pentru greutatea a 1042 de pacieni cu diferite afeciuni, din 5 n 5 Kg.

    Figura 8 Poligonul frecvenelor pentru greutatea a 1042 de pacieni cu diferite afeciuni, cu clase din 5 n 5 Kg.

    Dei ofer o imagine vizual foarte bun a modului cum sunt distribuite valorile din serie pe clase, poligonul frecvenelor este mai puin folosit dect histograma, care ofer i ea tot informaia despre distribuia valorilor din serie pe clase. Aceasta deoarece histograma pare ochiului un grafic mai bogat. n realitate, ntre cele dou grafice, nu exist o diferen calitativ. Ele ofer a