przedział ufności i wartość p

Artur Sołtysiak – pielęgniarz, uczestnik programuSentinel Reader Uniwersytetu McMaster w Kanadzie

adres do korespondencji:[email protected]

strona domowa:http://sites.google.com/site/ebnpPoland

PRZEDZIAŁ UFNOŚCII

WARTOŚĆ p2013

https://mail.google.com/mail/?view=cm&fs=1&tf=1&[email protected]

https://mail.google.com/mail/?view=cm&fs=1&tf=1&[email protected]

http://sites.google.com/site/ebnppoland

http://sites.google.com/site/ebnppoland

https://sites.google.com/site/ebnppoland/

TEORIA TO BADANIA I WNIOSKI Z BADAŃ DOTYCZĄCE CODZIENNEJ

PRAKTYKI

PRAKTYKA SWOIMI WĄTPLIWOŚCIAMI INSPIRUJE

BADANIA

TEORIA BADAŃ I CODZIENNA PRAKTYKA

PRAKTYKA INSPIRUJE BADANIA

PRZEGLĄD BADAŃ PORZĄDKUJE I AKTUALIZUJE WIEDZĘ

KORZYSTANIEZ BADAŃ

"PRZY ŁÓŻKU PACJENTA"

POZIOM ISTOTNOŚCI

(significance level)

WIELKOŚĆ PRÓBY

(sample size)

WIELKOŚĆ EFEKTU

(effect size)

MOC STATYSTYCZNA BADANIA

(statistical power)

WIELKOŚĆ PRÓBY (sample size)kalkulator TUTAJ program obliczeniowy TUTAJ

● OBLICZANA PRZEZ STATYSTYKÓW ZANIM ROZPOCZNIE SIĘ BADANIE. RAPORT Z BADANIA POWINIEN ZAWIERAĆ SZCZEGÓŁOWE WYLICZENIA

● OBLICZENIA WIELKOŚCI PRÓBY POWINNY WZIĄĆ POD UWAGĘ:

a. liczbę różnych właściwościb. liczbę grupc. różnorodność, zmienność badanej właściwościd. szacunkową proponowaną różnicę między porównywanymi

grupami (najmniejsza prawdziwa średnia różnica która byłaby klinicznie możliwa)

e. wymagany poziom istotności (np p<0.05)f. wymagany stopień mocy (by nie popełnić Type II Error,

przyjmuje się 0.8=80% prawdopodobieństwo)

http://www.macorr.com/sample-size-calculator.htm

http://biostat.mc.vanderbilt.edu/twiki/bin/view/Main/PowerSampleSize

WIELKOŚĆ EFEKTU (effect size)

● WYBRANA MIARA PUNKTU KOŃCOWEGO WYRAŻA WIELKOŚĆ EFEKTU (np OR, RR, NNT, NNH, ARI, ARR...)

● MIARY PUNKTU KOŃCOWEGO MOGĄ BYĆ RELATYWNE LUB ABSOLUTNE

JEDNOSTKA SKRÓT OPIS BRAK EFEKTU PEŁEN SUKCES

iloraz zdarzeń(Odds Ratio)

OR=oE/oC

szanse zdarzenia w grupie

eksperymentalnej dzielone przez szanse

zdarzenia w grupie kontrolnej; wyrażany

przez proporcję dziesiętną

OR = 1

OR = 0

OR<1(exp redukuje outcome, mniej zdarzeń w gr.ex)

OR>1(exp wzmaga outcome, więcej zdarzeń w gr.ex)

liczba konieczna by leczyć

(Number Needed to Treat)

NNT=1/ARR

(wartość zaokrągla

się w górę)

liczba pacjentów która musi być podana terapii aby zapobiec jednemu zdarzeniu; odwrotność ARR (wyrażana wtedy

jako ułamek dziesiętny)

NNT = ∝ NNT = 1/ryzyko początkowe

MIARY WIELKOŚCI EFEKTU W METAANALIZACH

Materiał uzupełniający TUTAJ

https://docs.google.com/open?id=0B1oMZUGcFN70MndWMTZTNDB2dGM


absolutne obniżenie ryzyka(Absolute Risk Reduction lub

Risk Difference)

(RD)ARR=

EER-CER

absolutna zmiana ryzyka; ryzyko

zdarzenia w grupie kontrolnej minus ryzyko

zdarzenia w grupie eksperymentalnej

wyrażone najcz. w %ODWROTNOŚĆ NNT

ARR = 0%ARR = ryzyko początkowe (wyjściowe)

relatywne obniżenie ryzyka

(Relative Risk Reduction)

RRR=(EER-CER)

/CER

proporcja ryzyka usuniętego przez

terapię; ARR dzielone przez ryzyko

początkowe w grupie kontrolnej

RRR = 0% RRR = 100%

ryzyko relatywne (Relative Risk lub

Risk Ratio)

RR=EER/CER

ryzyko zdarzenia w grupie eksperymantalnej

dzielone przez ryzyko zdarzenia w grupie

kontrolnej; wyrażana przez proporcję

dziesiętną lub w %

brak różnicy w ryzyku

RR = 1

lub

RR = 100%

RR = 0 RR = 0%

RR<1obniżone ryzykoRR>1podwyższone ryzyko


różnica średnich lub

różnica między średnimi

(Mean Difference)lub

średnia ważonaróżnic

(Weighted Mean Difference)

MDlub

WMD

absolutna różnica między wartościami

średniej w dwu grupach gdy efekt jest mierzony

tą samą skalą ciągłą

WMD = 0

EFEKT:● mały:

0.2 - 0.4

● umiarkowany:0.5 - 0.7

● duży >0,7

standaryzowana średnia różnic(Standardized

Mean Difference)

SMD

wielkość efektu interwencji w każdym badaniu w stosunku do

zmienności obserwowanej w tym

badaniu(jedno zjawisko

mierzone różnymi sposobami)

SMD = 0

EFEKT:● mały:

0.2 - 0.4

● umiarkowany:0.5 - 0.7

● duży >0,7

NA PODSTAWIE: Perera R., Heneghan C., Badenoch D., Statistics Toolkit, Blackwell Publishing, BMJ Books, 2008, USA & UK MATERIAŁ UZUPEŁNIAJĄCY TUTAJ i TUTAJ

MIERNIKI RELATYWNE MIERNIKI ABSOLUTNE

dla oddania proporcji jednego zdarzenia lub jednej zmiennej do innej

dla oddania bezwzględnej różnicy jednego zdarzenia lub jednej zmiennej względem innej

HR (hazard ratio) ARD (absolute risk difference)

OR (odds ratio) AR (attributable risk)

RR (relative risk) NNT (number needed to treat)

RRR (relative risk reduction)RD lub ARR(risk difference)(absolute risk reduction)

RRI (relative risk increase) ARI (absolute risk increase)

MD (mean difference) (difference in means) lubWMD (weighted mean difference)

SMD(standardized mean difference)

https://docs.google.com/open?id=0B1oMZUGcFN70MndWMTZTNDB2dGM

https://docs.google.com/file/d/0B1oMZUGcFN70a3Zyek81WFZ2WEE/edit?usp=sharing

POZIOM ISTOTNOŚCI (significance level)

Są tylko dwa wyjścia:1) nie odrzucamy H0 (nie ma wystarczającego dowodu przeciw H0 na korzyść H1)2) odrzucamy H0 na korzyść H1

HIPOTEZA ZEROWA (H0)

H0 to twierdzenie które testujemy.H1 to hipoteza alternatywna. Twierdzenie hipotezy alternatywnej zostanie przyjęte jeśli H0 zostanie odrzucona.Wynik testu statystycznego prezentujemy w świetle H0.

Wniosek "nie odrzucam H0"nie oznacza to automatycznie że H0 jest prawdziwa.Oznacza to, że nie ma wystarczającego dowodu by odrzucić H0 na korzyść H1.

Wniosek "odrzucam H0" na korzyść H1,czyli sugeruję że H1 MOŻE być prawdziwa (a nie że z pewnością H1 jest prawdziwa).



MOŻLIWE SĄ DWA BŁĘDY

Type I error (α-error)H0 jest odrzucona chociaż jest prawdziwa(obrona: test istotności)

Type II error (β-error)H0 zostaje zaakceptowana chociaż na prawdę jest fałszywa. (Nie znaleziono różnicy pomiędzy próbami chociaż ona naprawdę istnieje = słaba moc badania)

P-VALUE czyli wartość p

- to umowna wartość prawdopodobieństwa wyrażająca szansę uzyskania danego rezultatu w świetle prawdziwej hipotezy zerowej (H0, null hypothesis)

Istotne rezultaty (significant results): p<0.05wykazano statystycznie że jest wątpliwe by były dziełem przypadku (H0 jest fałszywa, odrzucają H0).

Nie-istotne rezultaty (non-significant results): p>0.05nie wyeliminowano roli przypadku w uzyskaniu danego rezultatu; (nie obalono H0)

P-VALUE czyli wartość p (ciąg dalszy)

Jeśli H0 byłaby prawdziwa:

■ p<0.5 możliwość że dany rezultat jest dziełem przypadku, jest mniejsza niż 1:2


■ p<0.05 możliwość że dany rezultat jest dziełem przypadku, jest mniejsza niż 1:20 (5%)



p>0.05 OZNACZA STATYSTYCZNĄ NIE-ISTOTNOŚĆ

STATYSTYCZNA NIE-ISTOTNOŚĆNIE ZNACZY ŻE COŚ JEST

NIEISTOTNE!

STATYSTYCZNA ISTOTNOŚĆ NIE OZNACZA ŻE COŚ JEST ISTOTNE

KLINICZNIE!

CONFIDENCE INTERVAL (CI)czyli Przedział Ufności

● tradycyjnie CI przyjmuje się jako CI95% (p<0.05)

● odnosi się do wielkości efektu terapii, ekspozycji, interwencji

● ideał: duża próba z wąskimi przedziałami

● przed interpretacją CI należy zbadać tendencyjność badań(biased studies)

Przedział wartości, w którym z danym prawdopodobieństwem (wyrażonym w %) znajduje się wartość parametru (np: RR, RRR, ARR, ARI, NNT, średnia itp.) dla populacji ogólnej

CONFIDENCE INTERVAL (CI)czyli Przedział Ufności

(ciąg dalszy)

● efekt statystycznie istotny nie koniecznie musi być klinicznie ważny (wielkość efektu określa jego kliniczną doniosłość)

● wielkość efektu (effect size) może być mierzona na różne sposoby (RRR, ARR, NNT), gdzie względne wartości(relative measures) podkreślają potencjalne korzyści; wartości absolutne dają lepszy obraz

● "nie-istotność" (non-significance) nie oznacza braku efektu; małe badania często podają "nie-istotność" nawet wtedy kiedy są ważne: gdyby badanie było większe, istotność byłaby wykryta

FOREST PLOTczyli przez las na skróty do celu

● wykres charakterystyczny dla prac przeglądowych (metaanaliza i przegląd systematyczny z metaanalizą)

● umożliwia analizę i porównanie wielu badań odnoszących się do postawionego w pracy przeglądowej pytania

● zawiera informację o cząstkowej wartości każdego badania, poziomie heterogeniczności, podaje wartość p oraz przedział ufności (istotność statystyczna), RR, NNT

NA PODSTAWIE: Karin Ried, Interpreting and understanding meta-analysis graphs. A practical Guide. Australian Family Physician Vol. 35, No. 8, August 2006

ID badań szczegóły przeglądu

- miara efektu punktu końcowegoprzedstawiona graficznie i liczbowo

- model fixed effect użyty dla metaanalizy

N=całkowita liczba badanych w grupie

n=liczba badanych w grupie z punktem

końcowym

wpływ cząstkowy badań na metaanalizę

wartość p, wskazuje poziom

istotnościstatystycznej

Heterogeniczność:niejednolitość

pomiędzy badaniami

efekt całkowity

skala efektu interwencji

linia braku efektu

ID badań szczegóły przeglądu

- miara efektu punktu końcowegoprzedstawiona graficznie i liczbowo

- model fixed effect użyty dla metaanalizy

wartość p, wskazuje poziom

istotnościstatystycznej

Heterogeniczność:niejednolitość

pomiędzy badaniami linia braku efektuskala efektu interwencji

efekt całkowity

wpływ cząstkowy badań na

metaanalizę

N=całkowita liczbabadanych w grupie;Średnia (odchylenie

standardowe)dla punktu końcowego

PIŚMIENNICTWO

1. "The Meaning of Translational Research and Why It Matters", Steven H. Woolf JAMA, (styczeń 2008) Vol 299

2. "The emergence of translational epidemiology: from scientific discovery to population health impact", Khoury MJ, Gwinn M, Ioannidis JP; Am J Epidemiol. 2010 Sep 1;172(5):517-24. doi: 10.1093/aje/kwq211. Epub 2010 Aug 5.

3. "How Can We Use Epidemiology to Bridge Evidence Gaps in Translating Research Discoveries into Clinical and Public Health Practice?", The Epidemiology and Genomics Research Program’s Workshop Science Advisory Group, 26 września 2012, U.S. National Institutes of Health, strona internetowa: http://blog-epi.grants.cancer.gov/2012/09/26/how-can-we-use-epidemiology-to-bridge-evidence-gaps-in-translating-research-discoveries-into-clinical-and-public-health-practice/ (stan: 03 maja 2013 godz.12:57CET)

http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2927741/

http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2927741/

PIŚMIENNICTWO

4. "Making sense of critical appraisal", Olajide Ajetunmobi, Hodder Arnold 2002,Oxford University Press Inc,. USA

5. "Dzień III", Artur Sołtysiak,prezentacja, część pięciodniowych warsztatów EBNP, 2012 z późniejszymi aktualizacjami.https://sites.google.com/site/ebnppoland/ebnp/warsztaty

https://sites.google.com/site/ebnppoland/ebnp/warsztaty

https://sites.google.com/site/ebnppoland/ebnp/warsztaty

przedział ufności i wartość p

Health & Medicine