teste parametrice

34
TESTE PARAMETRICE SORANA D. BOLBOACĂ 12/11/2020 1

Upload: others

Post on 16-Oct-2021

9 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Teste Parametrice

TESTE PARAMETRICE

SORANA D. BOLBOACĂ

12/1

1/2

020

1

Page 2: Teste Parametrice

TESTE PARAMETRICE VS, NON-PARAMETRICE

Parametric Neparametric

Distribuţia Normală oricare

Varianţa Omogene oricare

Scala de măsură Raţie / Interval oricare

Valoarea centrală Media mediana

Dispersia Deviaţia standard (Q1 to Q3)

Parametric Neparametric

2 grupuri independente

Testul Z

Independent t-test

Mann-Whitney

2 grupuri dependente Paired t-test Wilcoxon test

> 2 grupuri ANOVA Kruskal-Wallis test

Corelaţia Pearson Spearman, Kendall, etc,

… … …

Testele parametriceo Se aplică în cazul variabilelor cantitative sau calitative ordinale cu clase multipleo Datele urmează distribuția normalăo Se pot aplica pentru a compara două sau mai multe grupuri, dependente sau independente

Page 3: Teste Parametrice

TESTE PARAMETRICE - MEDII

Teste Z pentru medii

2 populații: test student pentru eșantioane independente sau dependente

Mai mult de 2 populații: testul ANOVA

12/11/2020 3

Page 4: Teste Parametrice

12/11/2020 4

Page 5: Teste Parametrice

MEDIA: 2 GRUPURI

Testul Z Testul Student (t)

Grupuri independente Grupuri independente

Talia fiecărui grup în parte ≥ 30 Talia fiecărui grup în parte < 30

Deviațiile standard cunoscute

12/11/2020 5

𝑍 =( ത𝑋1− ത𝑋2) − (𝜇1 − 𝜇2)

𝜎12

𝑛1+𝜎22

𝑛2

Varianţe egale

Varianţe inegale

Page 6: Teste Parametrice

TESTUL Z

Page 7: Teste Parametrice

HYPOTHESIS TESTING: PHANTOMS

Abb Ex: Efectul Nebivolului și al Atenololului asupra ritmului cardiac2 populații, unul tratat cu Nebivolol (n=39) și cel de-al doilea cu Atenolol (n=38)

P Media reducerii ritmului cardiac

H H0: Reducerea medie a ritmului cardiac la pacienții tratați cu Nebivolol nu diferă semnificativ față de cea a pacienților tratați cu AtenololH1 (test bilateral): Reducerea medie a ritmului cardiac la pacienții tratați cu Nebivolol diferă semnificativ față de cea a pacienților tratați cu Atenolol

A • Grupurile sunt independente (pacienți tratați cu Nebivolol față de cei tratați cu Atenolol)

• Randomizare: grupurile sunt alcătuite aleator și asignarea tratamentului este de asemenea aleatorie

• Ritmul cardiac pentru fiecare grup în parte (cei cu Nebivolol, respectiv cei cu Atenolol) urmează distribuția normală

Page 8: Teste Parametrice

Abb Ex: Efectul Nebivolului și a Atenololului asupra ritmului cardiac2 populații, unul tratat cu Nebivolol (n=39) și cel de-al doilea cu Atenolol (n=38)

N Test pentru grupuri independente:• Varianțe egale? Student t-test for equal variances• Varianțe inegale? Student t-test for unequal variances

T Nebivolol (n=39): 14,51±4,69Atenolol (n=38): 17,55±5,06Z = (14,51-17,55)/sqrt(4,69^2/39+5,06^2/38)) = -2,73

O Valoarea P = 0,0032 (=NORSDIST(Z))

M (-∞;-Zα)⋃(Zα;+∞) unde Zα=0.05 = 1,96 - 𝑍 ∈ −∞;−1,96 ⋃ 1,96;+∞ - avem suficiente dovezi să respingem H0

Deoarece valorea p < 0,05 → avem suficiente dovezi să respingem H0

Există diferențe semnificative statistic în reducerea ritmului cardiac la pacienții tratați cu Nebivolol comparativ cu cei tratați cu Atenolol

S Reducerea medie a ritmului cardiac este mai mare la pacienții tratați cu Atenolol comparativ cu cei tratați cu Nebivolol→ vom opta pentru administrarea Atenololului dacă dorim o reducere mai mare a ritmului cardiac

Page 10: Teste Parametrice

PANIC VS. PHANTOMS

o Nebivolol (n=39): 14,51±4,69

o Atenolol (n=38): 17,55±5,06

Este Nebivololul la fel de eficient ca și Atenololul în reducerea ritmului cardiac?

o PANIC: (14,51-17,55) ± t(n1+n2-2),α*sqrt(((39-1)*4,69^2+(38-1)*5,06^2)/(39+38-2)) = -3,04 ± 1,99*0,56 = -3,04 ±1,11 = (-4,15 la -1,93)

o Valoare zero nu este în intervalul de încredere al diferenței medii deci reducerea medie a ritmului cardiac la pacienții tratați cu Nebivolol este semnificativ diferită comparativ cu media reducerii la pacienții cu Atenolol

o PHANTOMS: P=0,0032 – avem suficiente dovezi să respingem H0

ത𝑋1 − ത𝑋2 ± 𝑡𝑛1+𝑛2−2;0,05𝑛1−1 𝑠1

2+ 𝑛2−1 𝑠22

𝑛1+𝑛2−2

Page 11: Teste Parametrice

TESTUL STUDENT PENTRU EȘANTIOANE INDEPENDENTE

Page 12: Teste Parametrice

TESTUL STUDENT PENTRU EȘANTIOANE INDEPENDENTE

o Scop: să determinăm dacă diferenţa dintre mediile eşantioanelor studiate indică o diferenţă reală între cele două populaţii sau dacă diferenţa obţinută este datorată erorii de eşantionare,o De reţinut! Dacă două eşantioane se extrag din aceeaşi populaţie şi la fiecare

eşantion se administrează acelaşi tratament, pot exista diferenţe între mediile celor două eşantioane

Formularea generică a ipotezelor statistice:o H0: Nu există diferenţe semnificative statistic între mediile celor două populaţii

o H1 (test bilateral): Există diferenţe semnificative statistic între mediile celor

două populaţii

6-Dec-167 12

Page 13: Teste Parametrice

6-Dec-167 13

Testarea egalităţii varianţelor se face cu testul LEVENE sau BARTLETT (teste bazate pe statistica F)

Dacă varianţele nu sunt semnificativ statistic diferite (p>0,05) atunci pot fi considerate egale ➔ test student pentru eşantioane independente varianţe egale

Sunt varianțele

egale?

t-test assuming unequal variances

t-test assuming equal variances

Page 14: Teste Parametrice

HYPOTHESIS TESTING: PHANTOMS

Abb Ex: Acidul uric la femei şi bărbaţi cu diabet zaharat

P Media acidului uric

H H0: media acidului uric a subiecţilor de gen feminin nu diferă semnificativ de medie acidului uric a subiecţilor de gen masculin (μM= μF)H1 (test bilateral): media acidului uric a subiecţilor de gen feminin diferă semnificativ de medie acidului uric a subiecţilor de gen masculin (μM≠ μF)

A • Femeile și bărbații nu provin din aceleași familii• Randomizare: subiecții sunt incluși aleatoriu• Acidul uric la subiecții de gen feminin și cei masculini cu diabet urmează distribuția

normală

N Testul student pentru varianțe egale - Student t-test for equal variances

M F

Media 5 4

Variaţia 2 2

n 16 16

Page 15: Teste Parametrice

Abb Ex: Acidul uric la femei şi bărbaţi cu diabet zaharat

T M (n=16): 5±4F (n=16): 4±4sqrt(15*4+15*4)/(16+16-2) = 2t = (5-4)/(2*sqrt(1/16+1/16)) = 1,41

O Valoarea P = 0,1676 (=TDIST(t, df, 2))

M (-∞;-tdf,α)⋃(tdf,α;+∞) unde tdf,α = 2,04 - 𝑡 ∈ −∞;−2,04 ⋃ 2,04;+∞ - nu avem suficiente dovezi să respingem H0

Deoarece valorea p > 0,05 → nu avem suficiente dovezi să respingem H0

S Media acidului uric nu diferă semnificativ statistic la pacienţii diabetici de gen feminin comparativ cu cei de gen masculin

M F

Media 5 4

Variaţia 2 2

n 16 16

Page 16: Teste Parametrice

TESTUL STUDENT PENTRU EȘANTIOANE DEPENDENTE

Page 17: Teste Parametrice

PHANTOMS: EȘANTIOANE PERECHI/DEPENDENTE

Abb Ex: Efectul Nebivolului asupra ritmului cardiac (n=39)

P μdif

Media reducerii ritmului cardiac (2 evaluări perechi, înainte și după tratamentul cu Nebivolol)

H H0: Nu există o scădere semnificativă statistic a ritmului cardiac după administrarea Nebiololului (μdif = 0)H1 (test unilateral): Ritmul cardiac se reduce semnificativ după tratamentul cu Nebivolol(μdif < 0)

A • Independența: observațiile sunt dependente• Randomizare: includerea subiecților în eșantion este prin randomizare• Ritmul cardiac înainte și după tratamentul cu Nebivolol urmează distribuția normală

N Testul student pentru eșantioane perechi

Page 18: Teste Parametrice

PHANTOMS: EȘANTIOANE PERECHI/DEPENDENTE

Abb Ex: Efectul Nebivolului asupra ritmului cardiac (n=39)

T Înainte de tratament: 78,05±5,84După tratament: 63,53±3,86Diferența: 14,51±4,69t = avem nevoie de datele brute pentru a obține acest parametru (estimat: 14,51/(4,69/sqrt(38)) = 19,07

O P-value = 9,86E-21 (0,000000000000000000009860)

M o tcritic (df, α) = 2,03→ t (19,07) > tcritic (2,03) → avem suficientedovezi să respingem ipoteza nulă

o p < 0,05 → avem suficiente dovezi să respingem H0

o → diferența între frecvența cardiacă înainte și după tratament cu Nebivolol este semnificativ diferită de zero

S Tratamentul cu Nebivolol este eficient în reducerea frecvenței cardiace

Page 19: Teste Parametrice

TESTUL ANOVA

Page 20: Teste Parametrice

12/11/2020 20

Abb Ex:

P Diferențe între mediile variabilei de tip răspuns

H H0: μA = μB = ...= μx

H1: μA ≠ μB ≠ ... ≠ μx

A • Factorul (variabila independentă) este o variabilă calitativă cu cel puțin 3 valori distincte• Variabila de tip răspuns este cantitativă (scala interval sau rație/raport) iar datele în

populațiile de unde s-au extras eșantioanele fiecărui grup urmează o distribuție aproximativ normală

• Independența observațiilor: nu există nici o relație între observațiile unui grup sau între observațiile grupurilor diferite (același subiect într-un singur grup)

• În fiecare subgrup nu există valori extreme (date individuale care nu urmează pattern-ulcelorlalte date)

• Varianțele sunt omogene: Test Levene

N One way ANOVA test

T Testul ANOVA utilizează testul F de semnificație statistică

O Valoarea p este calculată de programul statistic utilizat

M o Nivelul de semnificație trebuie ajustat. Ajustarea Bonfferoni se face în conformitate cu numărul de grupuri evaluate: dacă variabile independentă are 3 grupuri α* = α/3 (0,05/3 = 0,017)

ANOVA

Page 21: Teste Parametrice

ANOVA: EXEMPLU

o Este masa grasă asociată cu deficitul devitamină D la copii care practică atletism?

o Masa grasă (kg, variabila dependentă sau detip răspuns) și nivelul seric de vitamină D(variabila independentă) la copii carepractică atletism

o Variabila de grupare (factorul) = clasa înconformitate cu nivelul seric al vit D: deficit(<30 nmol/L, 5 copii), insuficient (30–50nmol/L, 30 copii), adecvat (50 nmol/L, 12copii)

12/11/2020 21

Page 22: Teste Parametrice

PHANTOMS: ANOVA

12/11/2020 22

Abb Ex: Masa grasă (kg) și nivelul seric de vitamină D (variabila independentă) la copii care practică atletism

P Diferențe între mediile masei grase (kg)

H H0: μdeficit = μinadecvat = μadecvat

H1: μdeficit ≠ μinadecvat≠ μadecvat

A • Clasa vit. D: deficit, inadecvat, adecvat• Masa grasă (rație/raport) • Masa grasă în populație urmează distribuția normală• Independența observațiilor: un copil este într-o singură clasă• Varianțele sunt omogene (test Levene p > 0,05)

N One way ANOVA test

T F = 4,62

O P=0,0151

M o F (4,62) > Fcritic (3,20) → avem suficiente evidenție să respingem H0

o P < 0,017 → avem suficiente evidențe să respingem H0 - avem diferențe semnificative a masei de grăsime între grupurile de copii realizate în conformitate cu valoarea serică a Vit. D

S o Există o asociere între masă grasă și nivelul seric al vitaminei D la copii care practică atletism

ANOVA

Putem spune între care perechi de grupuri avem diferențe semnificative?

Page 23: Teste Parametrice

PHANTOMS: ANOVA PENTRU MĂSURĂTORI REPETATE

Page 24: Teste Parametrice

Abb Ex: Efectul Nebivololului asupra presiunii arteriale sistolice (cinci evaluări)

P Diferența mediilor în evaluări multiple (5 evaluări)

H H0: Mediile PAS nu sunt semnificativ diferite la evaluările repetate. H0: μ0(baseline) = μ1(2 weeks) = μ2(4 weeks) = μ3(8 weeks) = μ4(12 weeks)

H1 (test bilateral): O diferență semnificativă există undeva printre evaluările PAS atuncicând pacienții sunt tratați cu NebivololH1:μ0 ≠ μ1 ≠ μ2 ≠ μ3 ≠ μ4

A • Dependența: aceeași pacienți sunt evaluați în momente diferite de timp• Randomizare: subiecții sunt incluși aleator în eșantion• PAS la includerea în studiu, la 2, 4, 8 și 12 luni după inițierea tratamentului cu Nebivolol

urmează distribuția normală• Varianțele sunt omogene

N Testul Anova pentru măsurători repetate

T Avem nevoie de datele brute pentru aceste calcule ...

O P < 0,0001

M P < 0,0001 (0,05/5 = 0,01)→ avem suficiente evidențe să respingem H0

S Există diferențe semnificative în tensiunea arterială sistolică printre evaluări dupătratamentul cu Nebivolol (nu putem spune însă care perechi de evaluări au avut diferențesemnificative – pentru aceasta trebuie să aplicăm analiza post-hoc)

Page 25: Teste Parametrice

TESTAREA IPOTEZELORVS. INTERVALUL DE ÎNCREDERE

Page 26: Teste Parametrice

PHANTOMS VS. PANIC

12/11/2020 27

Ce? Valoarea P Intervalul de încredere

Decizia Binar: respingem sau nu respingem H0

Nivel de semnificație (α=0,05) stabilit a

priori

Un interval de valori care include

parametrul adevărat al populației cu o

probabilitate definită în prealabil

Nivel de încredere stabilit a priori (ex. 95%)

Semnificația Statistică Statistică

Relevanța clinică

Efectul Nu se aplică Direcția și puterea efectului

Depinde de Magnitudinea asocierii factor-rezultat și

precizia estimării (talia eșantionului)

Erori și factori de confuzie

Precizia statistică (talia eșantionului și

marginile de eroare)

Page 27: Teste Parametrice

PHANTOMS VS. PANIC

12/11/2020 28

Ce? Valoarea P Intervalul de încredereSemnificativstatistic

Valoarea P < nivelul de semnificație (α) Intervalul de încredere nu conține valoareaipotezei nule

Utilizat atunci când este de interes o comparație strictă a unei ipoteze la un nivel de semnificație predefinit

pentru a descrie magnitudinea efectuluisaucând dorim să descriem un singur grup

Semnificația statistică arată probabilitatea ca rezultatul unui studiu să fie datorat întâmplării →

diferența observată în eșantion există și în populație.

Relevanța clinică se referă la magnitudinea clinică a efectului și reflectarea acesteia în practica

medicală curentă.

Page 28: Teste Parametrice

SEMNIFICAȚIA STATISTICĂ VS. RELEVANȚA CLINICĂ

12/11/2020 29

Page 29: Teste Parametrice

SEMNIFICAȚIA STATISTICĂ VS. RELEVANȚA CLINICĂ

12/11/2020 30

• Mărimea efectului ? <7,5 ore/săpt → 0,15 kg în plus față de grupul cu ≥21 • Extrapolare: dacă studiul se continuă 13 ani grupul cu ≥21 va acumula în greutate cu

0,635 kg mai puțin comparativ cu grupul cu < 7,5!

Studiu de cohortă n=34,079 femei → greutatea câștigată de grupul care a efectuat exercițiu fizic >21 ore/săptămână față de grupul cu <7,5 ore de exercițiu fizic/săptămână (p<0,001)

Page 30: Teste Parametrice

SEMNIFICAȚIA STATISTICĂ VS. RELEVANȚA CLINICĂ

Rezultatele unui studiu pot fi:

o Nesemnificative statistic și fără relevanță clinică

o Semnificative statistic dar fără relevanță – aceasta poate să apară când talia eșantionului este mare și o diferență mică este semnificativă statistic. Un tratament semnificativ statistic comparativ cu un tratament alternativ nu înseamnă neapărat că diferențele observate sunt importante din punct de vedere clinic sau că sunt relevante pentru pacient.

o Semnificative statistic și relevante clinic

o Nesemnificative statistic dar relevante clinic – apare atunci când puterea studiului este mică și diferențe mici între grupuri nu sunt clasificate ca semnificative statistic.

12/11/2020 31

Page 31: Teste Parametrice

ALEGEREA TESTULUI STATISTIC

Page 32: Teste Parametrice

12/11/2020 33

Page 33: Teste Parametrice

23-Oct-2015 34

o Compararea mediilor se face doar în cazul variabilelor de tip rezultat cantitative sau calitative ordinale cu clase multiple ce urmează o distribuție aproximativ normală.

o Testul Z sau t se utilizează pentru a compara două grupuri.

o Dacă grupurile sunt independente, înaintea comparării mediilor trebuie să testăm varianțele.

o Nu testăm varianțele dacă eșantioanele sunt dependente.

o Utilizăm testul ANOVA pentru a compara mai mult de două eșantioane, fiecare cu date normal distribuite.

Page 34: Teste Parametrice

12/11/2020 35