metodi statistici per lo studio dell’associazione tra dati qualitativi

31
METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI Le tabelle rxc

Upload: maris

Post on 20-Jan-2016

38 views

Category:

Documents


0 download

DESCRIPTION

METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI. Le tabelle rxc. Si consideri una popolazione le cui N unità siano classificate secondo le r modalità di un carattere X (esempio sesso) e le c modalità di un carattere Y (classi di età). - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI

METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE

TRA DATI QUALITATIVI

Le tabelle rxc

Page 2: METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI

Si consideri una popolazione le cui N unità siano classificate secondo le r modalità di un carattere X (esempio sesso) e le c modalità di un carattere Y (classi di età)

Y1 Y2 … Yj Yc

X1 p1.

X2 p2.

Xi pij pi.

Xr pr.

p.1 p.2 p.j p.c 1

jiij YXp Pr

Page 3: METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI

Estraiamo da questa popolazione un campione di n unità e si ha

jiij YXfreqn

Y1 Y2 … Yj Yc

X1 n1.

X2 n2.

Xi nij ni.

Xr nr.

n.1 n.2 n.j n.c 1

Sulla base delle osservazioni campionarie vogliamo sapere se i

due caratteri X ed Y sono indipendenti

Page 4: METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI

Observed

Peso assenza presenza Totale complessivo

normale 67 65 132

sovrappeso 21 23 44

obeso 9 26 35Totale complessivo 97 114 211

Reflusso gastro-esofageo

Esempio:Verificare l’ipotesi nulla di indipendenza tra reflusso gastro-esofageo e peso corporeo al livello di significatività dell’1%.

Distribuzione marginale di rigapi.

Distribuzione marginale di colonna p.j

Page 5: METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI

Test di indipendenza

2

11

1 1

2

2 .~

cr

r

i

c

j ij

ijijn

Si utilizza una statistica test che è una sorta di distanza tra la tabella delle frequenze osservate nij e la tabella delle frequenze attese υij

nell’ipotesi di indipendenza

jiij

jiij

pppH

pppH

..1

..0

*:

*:

Per la legge del prodotto di due eventi indipendenti, la probabilità del prodotto pij è uguale al prodotto delle probabilità pi. per p.j

Page 6: METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI

Generalmente le probabilità marginali non sono note. Occorre stimarle:

n

np

n

np j

ji

i.

..

. ˆ;ˆ

jiij ppn .. **Sotto H0:

r

i

c

j ji

jiij

jijiij

n

nnn

nnn

n

nn

n

n

n

nn

1 1 ..

2

..

2

....

*

*

*

Allora:

Page 7: METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI

expectedassenza presenza Totale complessivo

normale 60.68246445 71.31753555 132sovrappeso 20.22748815 23.77251185 44obeso 16.09004739 18.90995261 35

97 114 211

(E-O) 2̂/Enormale 0.657706567 0.559627517sovrappeso 0.029503147 0.025103555obeso 3.124215287 2.658323534

7.054479607Chi quadrato(2)

non significativo v.critico 9.210.029385915

Reflusso gastro-esofageo

P-value

211

97132682.60

211

11444773.23

Page 8: METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI

I gradi di libertà sono dati dal numero totale delle celle meno il numero di parametri stimati, ovvero 1 frequenza totale, r frequenze marginali di riga e c frequenze marginali di colonna:rc-1-r-c=r(c-1)-(c-1)=(r-1)(c-1)

Il chi quadro indica la misura in cui le frequenze osservate in ogni casella della tabella differiscono dalle frequenze che ci aspetteremmo se non ci fosse associazione fra i due caratteri.

Page 9: METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI

Affinché si possa utilizzare il chi quadro e' indispensabile: a) che i dati siano indipendenti, cioe' nessun soggetto puo' apparire in più di una cella della tabella;b) che non più del 20 % delle frequenze attese nella

tabella può essere < 5 (altrimenti si deve usare il test esatto di Fisher);

c) nessuna cella deve avere una frequenza attesa < 1 (altrimenti si deve usare il test esatto di Fisher).

d) Non c’è alcuna ipotesi di normalità sulla distribuzione della popolazione di provenienza del campione. Per questo fa parte della famiglia dei test non parametrici

Page 10: METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI

Abbiamo detto che per una tabella rxc il test si distribuisce approssimativamente come un Chi-quadro. Questa approssimazione è valida purché vi siano un numero sufficiente di g.l. Per tabelle 2x2, con 1 solo g.l., è meglio utilizzare un fattore di correzione per la continuità:

Correzione di Yates: consiste nel sottrarre 0.5 alla differenza tra frequenze osservate e attese in valore assoluto

21

1 1

2

2 .~5.0

r

i

c

j ij

ijijn

Page 11: METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI

Test esatto di Fisher

Quando le dimensioni campionarie sono piccole, è possibile elencare tutte le possibili combinazioni delle osservazioni e quindi calcolare le probabilità esatte associate a ogni possibile combinazione di dati.

La probabilità totale a una coda o a due code di ottenere la tabella osservata o una più estrema è il valore di P associato all’ipotesi che i due caratteri siano indipendenti

Page 12: METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI

Si consideri il seguente esempio:

Obs b1 b2a1 1 8 9a2 10 4 14

11 12 23

Exp b1 b2a1 4,3 4,7 9a2 6,7 7,3 14

11 12 23

Si deve usare il test esatto di Fisher

Page 13: METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI

. tabi 1 8\10 4, exact

| col row | 1 2 | Total-----------+----------------------+---------- 1 | 1 8 | 9 2 | 10 4 | 14 -----------+----------------------+---------- Total | 11 12 | 23

Fisher's exact = 0.009 1-sided Fisher's exact = 0.007

Page 14: METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI

Misure di rischio

Page 15: METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI

L'associazione e' il grado di dipendenza statistica tra 2 o piu' eventi variabili;

Infatti l'associazione puo' essere:- causale o eziologica (il fumo di tabacco provoca

il cancro);- secondaria o indiretta (la bronchite cronica, causata

dal fumo, e' associata al cancro);- non causale o spuria o artificiale: e' determinata da

una circostanza esterna: o un fattore di confon-dimento o una distorsione della metodologia statistica usata.

Page 16: METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI

Misure di rischioFacciamo l'esempio di due gruppi di soggetti (ad es. quelli con colesterolo alto e quelli con colesterolo basso), inizialmente sani, che esposti ad un fattore di rischio (colesterolemia alta) dopo un certo tempo sviluppano una malattia (cardiopatia).

Al termine del periodo di follow-up si avranno 4 categorie di soggetti: malati esposti (a), malati non esposti (c), non malati esposti (b) non malati non esposti (d):

Page 17: METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI

Malato (M+) Non malato (M-) TotaleEsposto (E+) a=50 b=450 500

Non esposto (E-) c=25 d=475 500

La probabilità che un soggetto esposto sia malato è detta Incidenza o rischio assoluto: a/a+b, cioe' 50/500

Si consideri uno studio prospettico (1)

Page 18: METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI

… oppure i risultati di un Trial (2)

Morti Non Morti Totale

Terapia

tradizionale (TT) 35 41 76

Terapia

Sperimentale (TS) 49 26 75

Page 19: METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI

Rischio attribuibile individuale (RA)o Riduzione del Rischio Assoluto (RRA)

Rappresenta la quantita' di rischio supplementare attribuibile al fattore di rischio ( o alla terapia tradizio-nale):

(1) RA = IE+ - IE- = 0.10 - 0.05 = 0.05(il fattore di rischio aumenta il rischio del 5%)

(2) RA = I(TT) - I(TS) = 0.46 - 0.65= -0.19 (la terapia sperimentale aumenta il rischio di morte del 19%: si noti il segno negativo di RA)

Page 20: METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI

Rischio Relativo (RR o risk ratio) Rapporto fra incidenza negli esposti e incidenza nei non esposti, cioe':

a/(a+b) 50/500 0.10RR = ________ = _______ = ___ =2 (1) c/(c+d) 25/500 0.05(cioe' gli esposti hanno un rischio doppio dei non esposti).

Se il valore e' attorno a 1 indica che il fattore non ha influenza nello sviluppo della malattia; se e' <1 indica che il fattore ha un ruolo protettivo, se e' >1 indica che esiste un'associazione tra fattore e malattia.

Page 21: METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI

Rischio Relativo (RR o risk ratio) Rapporto fra incidenza negli esposti e incidenza nei non esposti, cioe':

a/(a+b) 35/76 0.46RR = ________= _______ = ___ = 0.71

(2) c/(c+d) 49/75 0.65(cioe' i pazienti trattati con terapia tradizionale hanno un rischio minore rispetto ai pazienti trattati con terapia sperimentale)

Se il valore e' attorno a 1 indica che le due terapie sono equivalenti; se e' <1 indica che la terapia al numeratore è più efficacese e' >1 indica che è meno efficace

Page 22: METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI

Riduzione del Rischio Relativo (RRR) Rapporto fra incidenza negli esposti e incidenza nei non esposti, cioe':

RRR = 1-RR = 1- 0.71=0.29 (2) (cioe' i pazienti trattati con terapia sperimentale hanno un rischio del 29% più alto dei pazienti trattati con terapia tradizionale)

Page 23: METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI

Rischio Relativo (RR o risk ratio)

Gli intervalli di confidenza per RR possono essere ottenuti tramite una trasformazione logaritmica

dccbaa

RRES

1111ln

RRESzRR lnln 2

Page 24: METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI

Odds ratio o rapporto crociato (“Crude” OR)

Casi Controlli TotaleFattore di rischio presente 19 3 22

Fattore di rischio assente 17 11 28

Totale 36 14 50Odds è il rapporto della probabilità di essere caso rispetto alla probabilità di essere controllo

Il RR puo' essere calcolato correttamente solo negli studi longitudinali (insorgenza di una malattia nel tempo).

Page 25: METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI

Odds ratio o rapporto crociato (“Crude” OR)

Negli studi caso-controllo si puo' ottenere una stima del rischio con il c.d. odds ratio:

Odds (f.r.presente)=(19/22)/(3/22)=19/3=6.3Odds (f.r.assente)=(17/28)/(11/28)=17/11=1.5OR = Odds (f.r.presente)/Odds (f.r.assente)= (a/b) / (c/d) = a d/b c =6.3/1.5=4.2

Page 26: METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI

Odds ratio o rapporto crociato (“Crude” OR)

dcba

ORES1111

ln

ORESzOR lnln 2

Page 27: METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI

Statistica di Mantel-Haenszel

Quando nello studio osservazionale interviene una variabile di confondimento occorre stratificare casi e controlli in funzione delle sue categorie.

Page 28: METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI

Tabella di contingenza relativa all’i-esima categoria della v. di confounding

Casi

D+

Controlli

D-

Tot

E+ ai bi ai+bi

E- ci di ci+di

ai+ci bi+di

ED

Page 29: METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI

Per ogni categoria della variabile di confondimento abbiamo un OR

ii

iii cb

daOR

jiperORORH

ORORORH

ji

k

:

...:

1

210

11111

iiiii dcbaw

Occorre verificare l’ipotesi nulla

Si utilizza un test Chi-quadro:

con pesi dati dall’inverso della varianza stimata del log dell’ORi:

2)1(

2

1

1

12 .~

log

log

k

k

ik

ii

k

iii

ii

w

ORw

ORw

Test di omogeneità

Page 30: METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI

Se il test risulta non significativo, possiamo calcolare un OR globale

k

iiii

k

iiii

ncb

nda

OR

1

1

Test di associazione:

0:

0:

1

0

ORH

ORH

Page 31: METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI

Procedura

1. 1. Calcolare

2. 2. Calcolare

3. 3. Calcolare

i

iiiii n

cabae

i

iiiiiiiii n

dbcadcbav

2)1(

1

2

112 .~

k

ii

k

ii

k

ii

MH

v

ea