przedział ufności i wartość p
TRANSCRIPT
Artur Sołtysiak – pielęgniarz, uczestnik programuSentinel Reader Uniwersytetu McMaster w Kanadzie
adres do korespondencji:[email protected]
strona domowa:http://sites.google.com/site/ebnpPoland
PRZEDZIAŁ UFNOŚCII
WARTOŚĆ p2013
TEORIA TO BADANIA I WNIOSKI Z BADAŃ DOTYCZĄCE CODZIENNEJ
PRAKTYKI
PRAKTYKA SWOIMI WĄTPLIWOŚCIAMI INSPIRUJE
BADANIA
TEORIA BADAŃ I CODZIENNA PRAKTYKA
PRAKTYKA INSPIRUJE BADANIA
PRZEGLĄD BADAŃ PORZĄDKUJE I AKTUALIZUJE WIEDZĘ
KORZYSTANIEZ BADAŃ
"PRZY ŁÓŻKU PACJENTA"
POZIOM ISTOTNOŚCI
(significance level)
WIELKOŚĆ PRÓBY
(sample size)
WIELKOŚĆ EFEKTU
(effect size)
MOC STATYSTYCZNA BADANIA
(statistical power)
WIELKOŚĆ PRÓBY (sample size)kalkulator TUTAJ program obliczeniowy TUTAJ
● OBLICZANA PRZEZ STATYSTYKÓW ZANIM ROZPOCZNIE SIĘ BADANIE. RAPORT Z BADANIA POWINIEN ZAWIERAĆ SZCZEGÓŁOWE WYLICZENIA
● OBLICZENIA WIELKOŚCI PRÓBY POWINNY WZIĄĆ POD UWAGĘ:
a. liczbę różnych właściwościb. liczbę grupc. różnorodność, zmienność badanej właściwościd. szacunkową proponowaną różnicę między porównywanymi
grupami (najmniejsza prawdziwa średnia różnica która byłaby klinicznie możliwa)
e. wymagany poziom istotności (np p<0.05)f. wymagany stopień mocy (by nie popełnić Type II Error,
przyjmuje się 0.8=80% prawdopodobieństwo)
WIELKOŚĆ EFEKTU (effect size)
● WYBRANA MIARA PUNKTU KOŃCOWEGO WYRAŻA WIELKOŚĆ EFEKTU (np OR, RR, NNT, NNH, ARI, ARR...)
● MIARY PUNKTU KOŃCOWEGO MOGĄ BYĆ RELATYWNE LUB ABSOLUTNE
JEDNOSTKA SKRÓT OPIS BRAK EFEKTU PEŁEN SUKCES
iloraz zdarzeń(Odds Ratio)
OR=oE/oC
szanse zdarzenia w grupie
eksperymentalnej dzielone przez szanse
zdarzenia w grupie kontrolnej; wyrażany
przez proporcję dziesiętną
OR = 1
OR = 0
OR<1(exp redukuje outcome, mniej zdarzeń w gr.ex)
OR>1(exp wzmaga outcome, więcej zdarzeń w gr.ex)
liczba konieczna by leczyć
(Number Needed to Treat)
NNT=1/ARR
(wartość zaokrągla
się w górę)
liczba pacjentów która musi być podana terapii aby zapobiec jednemu zdarzeniu; odwrotność ARR (wyrażana wtedy
jako ułamek dziesiętny)
NNT = ∝ NNT = 1/ryzyko początkowe
MIARY WIELKOŚCI EFEKTU W METAANALIZACH
Materiał uzupełniający TUTAJ
JEDNOSTKA SKRÓT OPIS BRAK EFEKTU PEŁEN SUKCES
absolutne obniżenie ryzyka(Absolute Risk Reduction lub
Risk Difference)
(RD)ARR=
EER-CER
absolutna zmiana ryzyka; ryzyko
zdarzenia w grupie kontrolnej minus ryzyko
zdarzenia w grupie eksperymentalnej
wyrażone najcz. w %ODWROTNOŚĆ NNT
ARR = 0%ARR = ryzyko początkowe (wyjściowe)
relatywne obniżenie ryzyka
(Relative Risk Reduction)
RRR=(EER-CER)
/CER
proporcja ryzyka usuniętego przez
terapię; ARR dzielone przez ryzyko
początkowe w grupie kontrolnej
RRR = 0% RRR = 100%
ryzyko relatywne (Relative Risk lub
Risk Ratio)
RR=EER/CER
ryzyko zdarzenia w grupie eksperymantalnej
dzielone przez ryzyko zdarzenia w grupie
kontrolnej; wyrażana przez proporcję
dziesiętną lub w %
brak różnicy w ryzyku
RR = 1
lub
RR = 100%
RR = 0 RR = 0%
RR<1obniżone ryzykoRR>1podwyższone ryzyko
JEDNOSTKA SKRÓT OPIS BRAK EFEKTU PEŁEN SUKCES
różnica średnich lub
różnica między średnimi
(Mean Difference)lub
średnia ważonaróżnic
(Weighted Mean Difference)
MDlub
WMD
absolutna różnica między wartościami
średniej w dwu grupach gdy efekt jest mierzony
tą samą skalą ciągłą
WMD = 0
EFEKT:● mały:
0.2 - 0.4
● umiarkowany:0.5 - 0.7
● duży >0,7
standaryzowana średnia różnic(Standardized
Mean Difference)
SMD
wielkość efektu interwencji w każdym badaniu w stosunku do
zmienności obserwowanej w tym
badaniu(jedno zjawisko
mierzone różnymi sposobami)
SMD = 0
EFEKT:● mały:
0.2 - 0.4
● umiarkowany:0.5 - 0.7
● duży >0,7
NA PODSTAWIE: Perera R., Heneghan C., Badenoch D., Statistics Toolkit, Blackwell Publishing, BMJ Books, 2008, USA & UK MATERIAŁ UZUPEŁNIAJĄCY TUTAJ i TUTAJ
MIERNIKI RELATYWNE MIERNIKI ABSOLUTNE
dla oddania proporcji jednego zdarzenia lub jednej zmiennej do innej
dla oddania bezwzględnej różnicy jednego zdarzenia lub jednej zmiennej względem innej
HR (hazard ratio) ARD (absolute risk difference)
OR (odds ratio) AR (attributable risk)
RR (relative risk) NNT (number needed to treat)
RRR (relative risk reduction)RD lub ARR(risk difference)(absolute risk reduction)
RRI (relative risk increase) ARI (absolute risk increase)
MD (mean difference) (difference in means) lubWMD (weighted mean difference)
SMD(standardized mean difference)
POZIOM ISTOTNOŚCI (significance level)
Są tylko dwa wyjścia:1) nie odrzucamy H0 (nie ma wystarczającego dowodu przeciw H0 na korzyść H1)2) odrzucamy H0 na korzyść H1
HIPOTEZA ZEROWA (H0)
H0 to twierdzenie które testujemy.H1 to hipoteza alternatywna. Twierdzenie hipotezy alternatywnej zostanie przyjęte jeśli H0 zostanie odrzucona.Wynik testu statystycznego prezentujemy w świetle H0.
Wniosek "nie odrzucam H0"nie oznacza to automatycznie że H0 jest prawdziwa.Oznacza to, że nie ma wystarczającego dowodu by odrzucić H0 na korzyść H1.
Wniosek "odrzucam H0" na korzyść H1,czyli sugeruję że H1 MOŻE być prawdziwa (a nie że z pewnością H1 jest prawdziwa).
POZIOM ISTOTNOŚCI (significance level)
POZIOM ISTOTNOŚCI (significance level)
MOŻLIWE SĄ DWA BŁĘDY
Type I error (α-error)H0 jest odrzucona chociaż jest prawdziwa(obrona: test istotności)
Type II error (β-error)H0 zostaje zaakceptowana chociaż na prawdę jest fałszywa. (Nie znaleziono różnicy pomiędzy próbami chociaż ona naprawdę istnieje = słaba moc badania)
P-VALUE czyli wartość p
- to umowna wartość prawdopodobieństwa wyrażająca szansę uzyskania danego rezultatu w świetle prawdziwej hipotezy zerowej (H0, null hypothesis)
Istotne rezultaty (significant results): p<0.05wykazano statystycznie że jest wątpliwe by były dziełem przypadku (H0 jest fałszywa, odrzucają H0).
Nie-istotne rezultaty (non-significant results): p>0.05nie wyeliminowano roli przypadku w uzyskaniu danego rezultatu; (nie obalono H0)
P-VALUE czyli wartość p (ciąg dalszy)
Jeśli H0 byłaby prawdziwa:
■ p<0.5 możliwość że dany rezultat jest dziełem przypadku, jest mniejsza niż 1:2
■ p<0.1 możliwość że dany rezultat jest dziełem przypadku, jest mniejsza niż 1:10
■ p<0.05 możliwość że dany rezultat jest dziełem przypadku, jest mniejsza niż 1:20 (5%)
■ p<0.025 możliwość że dany rezultat jest dziełem przypadku, jest mniejsza niż 1:40
■ p<0.01 możliwość że dany rezultat jest dziełem przypadku, jest mniejsza niż 1:100
p>0.05 OZNACZA STATYSTYCZNĄ NIE-ISTOTNOŚĆ
STATYSTYCZNA NIE-ISTOTNOŚĆNIE ZNACZY ŻE COŚ JEST
NIEISTOTNE!
STATYSTYCZNA ISTOTNOŚĆ NIE OZNACZA ŻE COŚ JEST ISTOTNE
KLINICZNIE!
CONFIDENCE INTERVAL (CI)czyli Przedział Ufności
● tradycyjnie CI przyjmuje się jako CI95% (p<0.05)
● odnosi się do wielkości efektu terapii, ekspozycji, interwencji
● ideał: duża próba z wąskimi przedziałami
● przed interpretacją CI należy zbadać tendencyjność badań(biased studies)
Przedział wartości, w którym z danym prawdopodobieństwem (wyrażonym w %) znajduje się wartość parametru (np: RR, RRR, ARR, ARI, NNT, średnia itp.) dla populacji ogólnej
CONFIDENCE INTERVAL (CI)czyli Przedział Ufności
(ciąg dalszy)
● efekt statystycznie istotny nie koniecznie musi być klinicznie ważny (wielkość efektu określa jego kliniczną doniosłość)
● wielkość efektu (effect size) może być mierzona na różne sposoby (RRR, ARR, NNT), gdzie względne wartości(relative measures) podkreślają potencjalne korzyści; wartości absolutne dają lepszy obraz
● "nie-istotność" (non-significance) nie oznacza braku efektu; małe badania często podają "nie-istotność" nawet wtedy kiedy są ważne: gdyby badanie było większe, istotność byłaby wykryta
FOREST PLOTczyli przez las na skróty do celu
● wykres charakterystyczny dla prac przeglądowych (metaanaliza i przegląd systematyczny z metaanalizą)
● umożliwia analizę i porównanie wielu badań odnoszących się do postawionego w pracy przeglądowej pytania
● zawiera informację o cząstkowej wartości każdego badania, poziomie heterogeniczności, podaje wartość p oraz przedział ufności (istotność statystyczna), RR, NNT
NA PODSTAWIE: Karin Ried, Interpreting and understanding meta-analysis graphs. A practical Guide. Australian Family Physician Vol. 35, No. 8, August 2006
ID badań szczegóły przeglądu
- miara efektu punktu końcowegoprzedstawiona graficznie i liczbowo
- model fixed effect użyty dla metaanalizy
N=całkowita liczba badanych w grupie
n=liczba badanych w grupie z punktem
końcowym
wpływ cząstkowy badań na metaanalizę
wartość p, wskazuje poziom
istotnościstatystycznej
Heterogeniczność:niejednolitość
pomiędzy badaniami
efekt całkowity
skala efektu interwencji
linia braku efektu
ID badań szczegóły przeglądu
- miara efektu punktu końcowegoprzedstawiona graficznie i liczbowo
- model fixed effect użyty dla metaanalizy
wartość p, wskazuje poziom
istotnościstatystycznej
Heterogeniczność:niejednolitość
pomiędzy badaniami linia braku efektuskala efektu interwencji
efekt całkowity
wpływ cząstkowy badań na
metaanalizę
N=całkowita liczbabadanych w grupie;Średnia (odchylenie
standardowe)dla punktu końcowego
PIŚMIENNICTWO
1. "The Meaning of Translational Research and Why It Matters", Steven H. Woolf JAMA, (styczeń 2008) Vol 299
2. "The emergence of translational epidemiology: from scientific discovery to population health impact", Khoury MJ, Gwinn M, Ioannidis JP; Am J Epidemiol. 2010 Sep 1;172(5):517-24. doi: 10.1093/aje/kwq211. Epub 2010 Aug 5.
3. "How Can We Use Epidemiology to Bridge Evidence Gaps in Translating Research Discoveries into Clinical and Public Health Practice?", The Epidemiology and Genomics Research Program’s Workshop Science Advisory Group, 26 września 2012, U.S. National Institutes of Health, strona internetowa: http://blog-epi.grants.cancer.gov/2012/09/26/how-can-we-use-epidemiology-to-bridge-evidence-gaps-in-translating-research-discoveries-into-clinical-and-public-health-practice/ (stan: 03 maja 2013 godz.12:57CET)
PIŚMIENNICTWO
4. "Making sense of critical appraisal", Olajide Ajetunmobi, Hodder Arnold 2002,Oxford University Press Inc,. USA
5. "Dzień III", Artur Sołtysiak,prezentacja, część pięciodniowych warsztatów EBNP, 2012 z późniejszymi aktualizacjami.https://sites.google.com/site/ebnppoland/ebnp/warsztaty