vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf ·...

52
VILNIAUS PEDAGOGINIS UNIVERSITETAS MATEMATIKOS IR INFORMATIKOS FAKULTETAS ALGEBROS IR STATISTIKOS KATEDRA Vaistų efektyvumo statistinė analizė Statistical analysis of the medicine effectiveness Baigiamasis magistro darbas Vaiva Žuraulytė Mokslinis vadovas prof. habil. dr. K. Kubilius VILNIUS 2008

Upload: trinhkhanh

Post on 25-Aug-2019

216 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

VILNIAUS PEDAGOGINIS UNIVERSITETASMATEMATIKOS IR INFORMATIKOS FAKULTETAS

ALGEBROS IR STATISTIKOS KATEDRA

Vaistų efektyvumo statistinė analizėStatistical analysis of the medicine effectiveness

Baigiamasis magistro darbas

Vaiva Žuraulytė

Mokslinis vadovasprof. habil. dr. K. Kubilius

VILNIUS2008

Page 2: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

TURINYS

ĮVADAS.................................................................................................................................................... 3DARBO TIKSLAI IR UŽDAVINIAI....................................................................................................... 6DUOMENYS ............................................................................................................................................ 7IMČIŲ SKIRSTINIŲ NORMALUMO TYRIMAS ............................................................................... 11DVIEJŲ NEPRIKLAUSOMŲ IMČIŲ PALYGINIMAS....................................................................... 14

t-testas..................................................................................................................................................14Mano ir Vitnio U testas .......................................................................................................................19

DVIEJŲ PRIKLAUSOMŲ IMČIŲ PALYGINIMAS............................................................................ 22Vilkoksono testas.................................................................................................................................22Ženklų testas ........................................................................................................................................28

KAPLAN-MEIERIO IŠGYVENAMUMO ANALIZĖ .......................................................................... 30Cenzūravimas ......................................................................................................................................30Išgyvenamumo analizė. Kaplan-Meierio metodas ..............................................................................32Išgyvenimo kreivių lyginimas .............................................................................................................34Išgyvenamumo laiko pasiskirstymas ...................................................................................................35Išgyvenimo laiko vidurkiai..................................................................................................................38

RIZIKOS FAKTORIŲ ĮVERTINIMAS. KOKSO REGRESIJOS MODELIS ...................................... 39Proporcingųjų rizikų modelis ..............................................................................................................39

LOGISTINĖ REGRESIJA ...................................................................................................................... 41Logistinės regresijos modelis ..............................................................................................................41Prognozavimas ....................................................................................................................................47

IŠVADOS................................................................................................................................................ 49LITERATŪRA........................................................................................................................................ 50SANTRAUKA ........................................................................................................................................ 51SUMMERY............................................................................................................................................. 52

Page 3: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

3

ĮVADAS

Inkstų persodinimas yra aktuali priemonė gydant inkstų ligas. Nuo inkstų ligų visame pasaulyje

kenčia apie 10 % suaugusių žmonių. Vienas suaugęs žmogus iš dešimties kenčia nuo chroniškų inkstų

ligų. Apie 1,5 mln. žmonių gyvybė palaikoma dializės būdu, vidutiniškai jie inkstų persodinimo laukia

apie septynerius metus. Deja ne visi jos sulaukia.

Lietuvoje inkstų pakaitinis gydymas taikomas visiems ligoniams, kuriems jo prireikia.

1 pav.

Lietuvoje kasmet atliekama 60-70 inkstų persodinimo operacijų, maždaug iki 50 per metus.

Jei inkstų sutrikimai negydomi, tai žmogaus laukia širdies ir kraujagyslių komplikacijos, kartais netgi

priešlaikinė mirtis.

Ligos priežastys

Inkstą reikia persodinti tada, kai savi inkstai nebesugeba atlikti savo funkcijų ir nepašalina iš

organizmo nereikalingų medžiagų. Esant ūmiam inkstų funkcijos nepakankamumui, inkstų veikla gali

visiškai atsistatyti, tačiau, esant lėtiniam nepakankamumui, inkstų veikla vis blogėja ir reikia gelbėti

žmogaus gyvybę atliekant dializes ar persodinant kito žmogaus inkstą.

Inkstų nepakankamumą gali sukelti pačių inkstų ligos (glomerulonefritas, pielonefritas, intersticinis

nefritas), širdies ligos, aterosklerozė, lėtinis šlapimo nutekėjimo sutrikimas, cukrinis diabetas,

sisteminės ligos (sisteminė raudonoji vilkligė, vaskulitai), kuriomis sergant pažeidžiami daugelis

organų, tarp jų ir inkstai. Įvairių vaistų vartojimas taip pat gali būti inkstų nepakankamumo priežastis.

Page 4: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

4

Operacijos metu persodinamas vienas inkstas. Inkstą ligoniui gali dovanoti sveiki tam tikro amžiaus

artimi giminaičiai (tėvai, broliai, seserys, vyras žmonai ar žmona vyrui), jei jų inkstas tinka ligoniui.

Taip pat persodinimui gali būti panaudoti inkstai žmonių po jų smegenų mirties, pačiam žmogui

apsisprendus iki nelaimingo įvykio po mirties padovanoti tinkamus transplantacijai organus, ar sutikus

mirusiojo artimiesiems duoti inkstą. Gyvo donoro inkstas paprastai geriau ir ilgiau funkcionuoja.

Ligos eiga

Jei donoras atitinka tam tikrus reikalavimus (sutampa kraujo grupė, teigiami imuninės sistemos

rodikliai, neserga ligomis, kurios galėtų paūmėti persodinus inkstą), atliekama inksto persodinimo

operacija.

Pirmaisiais metais po inkstų transplantacijos ligoniams labai dažnai reikia lankytis pas gydytojus,

nes, net ir taikant įprastinį gydymą, gali atsirasti inksto atmetimo krizės, pasireikšti vaistų toksinis

poveikis, kartotis pavojingos ligonio gyvybei infekcijos.

Vėliau paprastai vizitai pas gydytoja retėja, nes imuninė sistema ne taip audringai reaguoja į

svetimą organą, taip pat reikia mažesnių vaistų dozių.

Tačiau, net gydant moderniausiais vaistais, gali sutrikti donoro inksto veikla, tekti vėl pradėti

dializes, galimas ir pakartotinas inkstų persodinimas. Tačiau gydytojams ir ligoniams tokiais atvejais

iškyla dar didesnių problemų.

Komplikacijos

Net gydant imuninę sistemą slopinančiais vaistais gali išsivystyti ūmi persodinto inksto atmetimo

krizė. Tada blogėja inksto funkcija, jis padidėja, ligonis gali karščiuoti. Esant tokiai situacijai, būtinas

neatidėliotinas gydymas, kad būtų išsaugotas persodintas inkstas.

Kartojantis atmetimo krizėms bei infekcijoms, prasideda lėtai progresuojantis lėtinis persodinto

inksto nepakankamumas, tada ligoniui vėl reikia pradėti dializes ar pakartotinai persodinti inkstą iš kito

donoro.

Ligoniams po inksto persodinimo infekcijas sukelia net tokie sukėlėjai, kurie sveikiems žmonėms

yra nepavojingi. Tai citomegalo virusas, pneumocystis carinii, herpes virusai. Taip pat ir įprastinės

infekcijos vargina tokius ligonius dažniau nei sveikus žmones, nes jų imuninė sistema yra nuslopinta

vaistais.

Šiems ligoniams dažnesnės ir navikinės ligos, ypač odos, kraujo sistemos. Yra nemažai gydymo

komplikacijų. Tai diabetas, osteoporozė, navikinės ligos.

Page 5: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

5

Tyrimai

Po inkstų transplantacijos atliekami įvairūs kraujo tyrimai, nustatomas kraujo ląstelių skaičius,

kreatino, šlapalo koncentracija. Šie tyrimai rodo, ar gerai funkcionuoja persodintas inkstas, tiriama

vaistų koncentracija kraujyje, kad būtų galima parinkti tinkamą vaisto dozę.

Gydymas

Ligoniai gydomi imuninę sistemą slopinančiais vaistais. Paprastai tai būna vaistų deriniai. Kaskart

išrandami vis modernesni vaistai, kurie pagerina persodinto organo išgyvenamumą. Vaistus būtina gerti

reguliariai, tomis pačiomis valandomis. Ar tinkama vaisto dozė, nustatoma tiriant vaisto koncentraciją

kraujyje.

Po transplantacijos dažniausiai skiriami tokie vaistai: steroidai (prednisolonas), kalcineurino

inhibitoriai (ciklosporinas A, tacrolimas), nekalcineurino inhibitoriai(rapamycin), azatioprinas,

mikofenolato mofetilis.

Statistikos taikymas medicinoje – tai įvairių gydymo metodų lyginimas, susirgimų diagnostika ir

statistinė analizė. Statistinių metodų pagalba išanalizavus duomenis galima vertinti rezultatų

reikšmingumą, aptinkami paslėpti dėsningumai bei ryšiai. Medicinoje statistika taikoma jau nuo VIII

amžiaus.

Page 6: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

6

DARBO TIKSLAI IR UŽDAVINIAI

1. Įvertinti įvairių rizikos veiksnių įtaka inksto atmetimui.

2. Ištirti išgyvenimo kreivių priklausomybę nuo gydymo.

3. Palyginti dviejų terapijų gydymo rezultatus.

4. Ištirti kokie faktoriai turi įtakos išgyvenamumui iki inksto atmetimo.

Page 7: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

7

DUOMENYS

Duomenų bazėje buvo pateikti duomenys apie ligonius, kuriems buvo persodintas

inkstas. Tiriamieji buvo suskirstyti į dvi grupes po 302. Kiekvienai tų grupių skirta

atskira gydymo terapija: gydomoji arba kontrolinė.

Visa duomenų bazė sudaryta remiantis 604 pacientų duomenimis. Kiekvienam

pacientui užpildytas specialus protokolas, kuriame nurodyta:

Amžius (metais)

Lytis

Svoris (kg.)

Ūgis (cm.)

Donoro amžius (metais)

Bendro tyrimo trukmė (dienomis)

Parinktas gydymas (terapija)

Kreatino švarumas tyrimo pradžioje

Kreatino švarumas tyrimo pabaigoje

Ar sergama cukralige (1 — taip, 2 — ne)

Ar sergama hiperlipidemija (1 — taip, 2 — ne)

Ar sergama hipertenzija (1 — taip, 2 — ne)

Page 8: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

8

2 pav.

Page 9: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

9

Rizikos faktorių įtakai komplikacijoms ir atmetimui įvertinti bei jų tarpusavio

ryšiams nustatyti pasirenkama dalis šių duomenų:

demografiniai duomenys,

duomenys nusakantys priešoperacinės rizikos faktorius,

duomenys nusakantys pooperacinį laikotarpį.

Kintamasis Kintamojo tipas Aprašymas

Lytis kategorinis dvireikšmis

Amžius kiekybinis

Ūgis kiekybinis

Svoris kiekybinis

Donoro amžius kiekybinis

Cukraligė kategorinis dvireikšmis

Medžiagų apykaitos sutrikimas,

kuriam būdingas gausus šlapimo

išskyrimas

Hiperlipidemija kategorinis dvireikšmis

Į riebalus panašių medžiagų

pagausėjimas kraujyje;

dažniausiai paveldima liga.

Pri

ešop

erac

inia

id

uom

eny

s

Hipertenzija kategorinis dvireikšmisArterinio kraujospūdžio

padidėjimas

Donoro atmetimas kategorinis dvireikšmis

Gydymas kategorinis dvireikšmis

Laikas kiekybinis

Kreatinas pradžioje kiekybinis

Po

oper

acin

iai

duo

men

ys

Kreatinas pabaigoje kiekybinis

Inkstų funkcijai sutrikus

mažėja kreatino ekskrecijos ir

jo kiekis serume didėja, todėl

šis rodiklis naudojamas

vertinti inkstų funkcijai.

1 lentelė. Duomenys.

Page 10: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

10

Priešoperaciniai duomenys svarbūs vertinant pooperacinio laikotarpio rizikos

faktorius.

Pooperacinis laikotarpis apibrėžiamas kaip parų skaičius nuo transplantacijos

dienos iki tyrimų nutraukimo arba iki persodinto inksto atmetimo ar ligonio mirties

dienos.

Tiriant inkstų funkcijos sutrikimus ir pagerėjimus labai svarbus yra kreatino

kiekis. Kreatino kiekis organizme yra pastovus dydis ir jei jis padidėja, tai parodo, kad

sutriko inkstų veikla, o kai kreatino kiekis organizme sumažėja ir nebekinta, vadinasi

inkstai atlieka savo funkciją gerai.

Tyrime grupių normalumui tikrinti buvo naudojamas Šapiro–Vilko testas, dviem

priklausomom imtim Vilkoksono bei ženklų testai, kiekybinio kintamojo priklausomybės

nuo nepriklausomų kintamųjų paieškai taikomas logistinės regresijos modelis. Tyrimai

buvo atliekami vienodame reikšmingumo lygmenyje α = 0,05.

Statistikoje daugelis tyrimų yra atliekami statistinių duomenų apdorojimo paketų

pagalba. Logistinės regresijos modelis, ženklų bei Vilkoksono testai, Kaplan-Meierio

įverčiai, Kokso regresija buvo apdorojami su SPSS paketu.

Page 11: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

11

IMČIŲ SKIRSTINIŲ NORMALUMO TYRIMAS

Svarbus kiekvieno statistinio tyrimo etapas yra imties kintamųjų skirstinio tipo

nustatymas.

Normalusis skirstinys (angl. normal distribution) – vienas plačiausiai naudojamų

matematinėje statistikoje skirstinių. Jau XVIII a. vokiečių matematikas Karlas Gausas

nustatė, kad matavimo paklaidos turi normalųjį skirstinį. Todėl, kartais normalusis

skirstinys dar vadinamas Gauso skirstiniu.

Sakome, kad atsitiktinis dydis X turi normalųjį skirstinį, jei jo tankio funkcija

užrašoma tokia formule:

.,

,0,,,2

12

2

1

nuokrypisskvadratinividutinisvidurkiskur

xexf

x

Tankio funkcija įgyja maksimumą 2

1taške μ ir turi vingio taškus nutolusius

nuo vidurkio per σ. Tankio funkcija yra simetrinė. Sakysime, kad atsitiktinis dydis X turi

standartinį normalųjį skirstinį, jei jo tankis

.,2

12

2

xexfx

Jis žymimas: X~N(0, 1).

Standartinio normaliojo skirstinio skaitinės charakteristikos yra tokios:

EX = 0, DX = 1.

Standartinis normalusis skirstinys yra atskiras bendrojo normaliojo skirstinio

atvejis.

Daugelis statistinių išvadų remiasi prielaida, kad stebimas atsitiktinis dydis turi

normalųjį skirstinį. Žinoma, sakydami, kad atsitiktinis dydis turi normalųjį skirstinį, mes

tik pritaikome matematinį modelį, ignoruodami tai, kad stebimas dydis paprastai neįgyja

be galo didelių arba be galo mažų reikšmių. Normalusis skirstinys gerai aprašo žmogaus

ūgį, svorį, vidutinę oro temperatūrą, matavimo paklaidas, molekulės judėjimo dujose

greitį, vidutinį pelną, intelekto koeficientą ir kt.

Page 12: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

12

Tikrinsim, ar imčių skirstiniai yra pasiskirstę pagal normalųjį dėsnį, kadangi nuo

to priklauso, kokie kriterijai bus naudojami. Jei abu skirstiniai yra normalieji, galima

taikyti parametrinius kriterijus. Jei bent vienas skirstinys nėra normalusis, tada naudosiu

neparametrinius kriterijus. Normalumui tikrinti naudosime Kolmogorovo-Smirnovo ir

Šapyro-Vilko kriterijus.

Tests of Normality

,042 220 ,200* ,990 220 ,117

,031 384 ,200* ,993 384 ,096

,166 220 ,000 ,692 220 ,000

,172 384 ,000 ,513 384 ,000

VarMFEMALE

MALE

FEMALE

MALE

KreatinasP

KreatinasG

Statistic df Sig. Statistic df Sig.

Kolmogorov-Smirnova

Shapiro-Wilk

This is a lower bound of the true significance.*.

Lilliefors Significance Correctiona.

2 lentelė. Normalumo testas.

2 lentelėje pateikti normalaus skirstinio testo rezultatai. Remsimės Šapyro-Vilko

testo rezultatais. Stebimas reikšmingumo lygmuo Sig., t.y.: p-reikšmė, kai kreatino kiekis

tyrimo pradžioje vyrams bei moterims, viršija 0,05. Taigi šie duomenys turi normalųjį

skirstinį. Visi kiti duomenys normaliojo skirstinio neturi.

Skirstinio normalumo grafikas taip pat padeda nustatyti, ar skirtiniai pasiskirstę

pagal normalųjį dėsnį.

3 pav. Moterų kiekio tyrimo pradžioje normalumo (Q-Q) grafikas.

Page 13: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

13

4 pav. Vyrų kreatino kiekio tyrimo pradžioje normalumo (Q-Q) grafikas.

3 paveiksle pateiktas moterų, o 4 paveiksle — vyrų, kuriems buvo kreatinas

tyrimo pradžioje normalumo grafikai, kuriame stebėjimų duomenų reikšmės pakankamai

arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo.

Paėmę kreatino kiekį tyrimo pabaigoje iš 2 lentelės matome, kad reikšmingumo

lygmuo Sig., t.y.: p-reikšmė, kai kreatino kiekis leidžiamas tyrimo pabaigoje vyrams bei

moterims, neviršija 0,05. Taigi šie duomenys normaliojo skirstinio neturi. Tai matosi ir

skirstinio normalumo grafikuose 5 paveiksle.

5 pav. Moterų ir vyrų kreatino kiekio tyrimo pabaigoje normalumo (Q-Q) grafikai.

Page 14: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

14

DVIEJŲ NEPRIKLAUSOMŲ IMČIŲ PALYGINIMAS

t-testas

Duomenys.

Dvi intervalinių duomenų imtys (x1, x2, ..., xn) ir (y1, y2, ..., ym) gautos matuojant

du nepriklausomus normaliuosius atsitiktinius dydžius X ~ Ɲ( 2, XX ) ir Y ~

Ɲ( 2, YY ). Vidurkiai YX , ir dispersijos 22 , YX nežinomi.

Statistinė hipotezė:

.:

,:

1 YX

YXo

H

H

Kriterijaus statistika.

,// 22 msns

yxt

yx

čia

yx, yra imčių vidurkiai, —, 22yx ss imčių dispersija, o n, m — imčių didumai.

Sprendimo priėmimo taisyklė.

Tegul reikšmingumo lygmuo α. Hipotezė Ho atmetama, jeigu ktt 2/ . Čia

kt 2/ yra Stjudento skirstinio su k laisvės laipsniu α/2 lygmens kritinė reikšmė. Laisvės

laipsnių k yra mažiausias sveikasis skaičius, tenkinantis sąlygą:

.

//

//3434

222

msns

msnsk

yx

yx

Page 15: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

15

Hipotezė Ho atmetama, jeigu ktt 2/ . Vienpusėms alternatyvoms naudojama

ta pati statistika ir tas pats laisvės laipsnių skaičius k. Vienpusei alternatyvai H1:

YX parenkama kritinė sritis W = (-∞, kt ), t.y. Ho atmetama, kai t < - kt .

Vienpusei alternatyvai H1: YX parenkama kritinė sritis W = ( kt ,∞), t.y. Ho

atmetama, kai t > kt .

Patikrinsime, ar imčių dispersijos lygios. Tam tarsime, kad:

1) jei YXH :1 , tai:

Ho atmetama, kai p < α,

Ho neatmetama, kai p ≥ α;

2) jei H1: YX ir ,

yx tai:

Ho atmetama, kai p < 2α,

Ho neatmetama, jeigu

yx ir p ≥ 2α arba

;yx

3) jei H1: YX ir ,

yx tai:

Ho atmetama, kai p < 2α,

Ho neatmetama, jeigu

yx ir p ≥ 2α arba .

yx

Priklausomai nuo to, ar dispersijas laikome statistiškai nereikšmingai (p-reikšmė

> α), ar statistiškai reikšmingai (p-reikšmė < α) besiskiriančioms, hipotezei apie vidurkių

lygybę tikrinti parenkama atitinkamai viršutinė arba apatinė stulpelio Sig. (2-tailed) p-

reikšmė.

Išnagrinėsime vyrų bei moterų kreatino vidutinį kiekį tyrimo pradžioje, taip pat

vyrų bei moterų kreatino vidutinį kiekį tyrimo pradžioje pagal terapijas, taikant Stjudento

testą, kadangi šie duomenys pagal Šapyro-Vilko normalumo tyrimą yra pasiskirstę pagal

normalųjį dėsnį.

Page 16: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

16

Group Statistics

220 58,02492 23,928151 1,613236

384 61,86007 24,842452 1,267736

VarMFEMALE

MALE

KreatinasPN Mean Std. Deviation

Std. ErrorMean

3 lentelė. Grupių statistika.

Grupių statistikos 3 lentelėje pateikiamos kiekvienos kreatino kiekio tyrimopradžioje vyrų bei moterų grupių charakteristika: stebėjimų skaičius N (vyrų 384,moterų), vidurkis Mean (moterų ≈ 58; vyrų ≈ 61,86), standartinis nuokrypis Std.Deviation (vyrų ≈ 24,8; moterų ≈ 23,9) bei standartinė paklaida Std. Error Mean (vyrų ≈1,27; moterų ≈ 1,6).

Independent Samples Test

,215 ,643 -1,850 602 ,065 -3,835149 2,072774 -7,905895 ,235598

-1,869 470,418 ,062 -3,835149 2,051751 -7,866880 ,196583

Equal variancesassumed

Equal variancesnot assumed

KreatinasPF Sig.

Levene's Test forEquality of Variances

t df Sig. (2-tailed)Mean

DifferenceStd. ErrorDifference Lower Upper

95% ConfidenceInterval of the

Difference

t-test for Equality of Means

4 lentelė. Nepriklausomų imčių t kriterijus.

4 lentelės grafoje Levene‘s Test for Equality of Variances pateikta statistikos F

reikšmė (0,215) ir p-reikšmė (0,643), o lentelės grafoje t-test Equality of Means, skirtoje

išvadoms apie pačių vidurkių lygybę, pateiktos:

statistikos t reikšmes stulpelyje t,

laisvės laipsnių skaičius stulpelyje df ,

p-reikšmės stulpelyje Sig. (2-tailed),

vidurkių skirtumų įverčiai likusiuose stulpeliuose: Menn Differences, Std. Error

Differences ir 95% Confidence Interval of the Difference (Lower bei Upper).

Eilutėje Equal variances assumed p-reikšmė yra didesnė už reikšmingumo lygmenį

α: 0,643 > 0,05, taigi t kriterijaus p-reikšmė yra 0,065 (stulpelyje Sig. (2-tailed)), o

dispersijos galima sakyti yra nesiskiriančios.

Page 17: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

17

Kriterijau t p-reikšmė yra didesne už 0,05 (0,065 > 0,05), taigi moterų kreatino

kiekis tyrimo pradžioje statistiškai reikšmingai nesiskiria nuo vyrų kreatino kiekio tyrimo

pradžioje.

Patikrinsime kreatino kiekį tyrimo pradžioje atskirai moterims ir vyrams pagal

terapijos tipą.

Pirmiausia išnagrinėsime moterų kreatino kiekį tyrimo pradžioje pagal terapijas.

Group Statistics

108 56,88923 23,828552 2,292903

112 59,12005 24,079756 2,275323

TerapijaACTIVE CONTROL

ACTIVE TREATMENT

KreatinasPN Mean Std. Deviation

Std. ErrorMean

5 lentelė. Grupių statistika.

5 grupių statistikos lentelėje pateikiamos kiekvienos kreatino kiekio tyrimo

pradžioje moterų terapijos grupių charakteristikos: stebėjimų skaičius N (kontrolinės

terapijos atveju 108, o gydomosios terapijos 112), vidurkis Mean (kontrolinės terapijos

atveju 56,88923, o gydomosios terapijos atveju ≈ 59), standartinis nuokrypis Std.

Deviation (kontrolinės terapijos atveju ≈ 23,83, o gydomosios terapijos ≈ 24,08) bei

standartinė paklaida Std. Error Mean (kontrolinės terapijos atveju 2,29, o gydomosios

terapijos atveju yra ≈ 2,28).

Independent Samples Test

,503 ,479 -,690 218 ,491 -2,230821 3,230867 -8,598554 4,136912

-,691 217,852 ,491 -2,230821 3,230248 -8,597359 4,135717

Equal variancesassumed

Equal variancesnot assumed

KreatinasPF Sig.

Levene's Test forEquality of Variances

t df Sig. (2-tailed)Mean

DifferenceStd. ErrorDifference Lower Upper

95% ConfidenceInterval of the

Difference

t-test for Equality of Means

6 lentelė. Nepriklausomų imčių t kriterijus.

6 lentelės grafoje Levene‘s Test for Equality of Variances pateikta statistikos F

reikšmė (0,503) ir p-reikšmė (0,479). Kadangi p-reikšmė yra didesnė už reikšmingumo

lygmenį α = 0,05 (0,497 > 0,05), taigi dispersijos statistiškai reikšmingai nesiskiria ir

Page 18: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

18

pasinaudosime t-test Equality of Means grafa, kuri skirta išvadoms apie pačių vidurkių

lygybę.

Šios grafos eilutėje Equal variances assumed p-reikšmė yra viršutinis stulpelio

Sig. (2-tailed) skaičius, kuris yra didesnis už reikšmingumo lygmenį α: 0,491 > 0,05.

Vadinasi moterų kreatino kiekis tyrimo pradžioje taikant kontrolinę terapiją

statistiškai reikšmingai nesiskiria nuo moterų kreatino kiekio tyrimo pradžioje taikant

gydomąją terapiją.

Išnagrinėsime vyrų kreatino kiekį tyrimo pradžioje pagal terapijas.

Group Statistics

192 63,17647 23,870910 1,722735

192 60,54367 25,772499 1,859970

Terapija1

2

KreatinasPN Mean Std. Deviation

Std. ErrorMean

7 lentelė. Grupių statistika.

7 grupių statistikos lentelėje pateikiamos kiekvienos kreatino kiekio tyrimo

pradžioje vyrų terapijos grupių charakteristikos: stebėjimų skaičius N (kontrolinės

terapijos atveju 192, o gydomosios terapijos 192), vidurkis Mean (kontrolinės terapijos

atveju ≈ 63,18, o gydomosios terapijos atveju ≈ 60,54), standartinis nuokrypis Std.

Deviation (kontrolinės terapijos atveju ≈ 23,87, o gydomosios terapijos ≈ 25,77) bei

standartinė paklaida Std. Error Mean (kontrolinės terapijos atveju ≈ 1,723, o gydomosios

terapijos atveju yra ≈ 1,86).

Independent Samples Test

2,566 ,110 1,038 382 ,300 2,632799 2,535212 -2,351920 7,617517

1,038 379,778 ,300 2,632799 2,535212 -2,352012 7,617610

Equal variancesassumed

Equal variancesnot assumed

KreatinasPF Sig.

Levene's Test forEquality of Variances

t df Sig. (2-tailed)Mean

DifferenceStd. ErrorDifference Lower Upper

95% ConfidenceInterval of the

Difference

t-test for Equality of Means

8 lentelė. Nepriklausomų imčių t kriterijus.

Page 19: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

19

8 lentelės grafoje Levene‘s Test for Equality of Variances pateikta statistikos F

reikšmė (2,566) ir p-reikšmė (0,110). Kadangi p-reikšmė yra didesnė už reikšmingumo

lygmenį α = 0,05 (0,110 > 0,05), taigi dispersijos statistiškai reikšmingai nesiskiria ir

pasinaudosime t-test Equality of Means grafa, kuri skirta išvadoms apie pačių vidurkių

lygybę.

Šios grafos eilutėje Equal variances assumed p-reikšmė yra viršutinis stulpelio

Sig. (2-tailed) skaičius, kuris yra didesnis už reikšmingumo lygmenį α: 0,3 > 0,05.

Vadinasi, vyrų kreatino kiekis tyrimo pradžioje taikant kontrolinę terapiją

statistiškai reikšmingai nesiskiria nuo vyrų kreatino kiekio tyrimo pradžioje taikant

gydomąją terapiją.

Mano ir Vitnio U testas

Mano ir Vitnio U testo esmė yra ta, kad jungtiniai abiejų imčių duomenys, gauti

testuojant tuo pačiu testu, išdėstomi pagal rangus. Tada kiekvienos imties rangai, gauti

ranguojant jungtinius duomenis, sumuojami atskirai.

Duomenys:Tarkime dviejų nepriklausomų tolydžių kintamųjų X ir Y stebėjimai yra x1, x2, ...,

xn1 ir y1, y2, ..., yn2.

Statistinė hipotezė:

kintamųjų skirstiniai yra vienodi,

kintamųjų skirstiniai nėra vienodi.

Kriterijau statistika:

.

12

1,

2; 2121211

nnnnnn

čiaU

Z

Sprendimo priėmimo taisyklė.

Tarkime reikšmingumo lygmuo yra α. Jei |Z| > 2/z , tai hipotezę Ho atmetama

(skirstiniai skiriasi); čia 2/z — standartinio normaliojo skirstinio α/2 lygmens kritinė

reikšmė. Priešingu atveju Ho neatmetama.

:

:

1

0

H

H

Page 20: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

20

Išnagrinėsime vyrų bei moterų kreatino kiekį tyrimo pabaigoje, taikydami Mano

ir Vitnio U testą.

Ranks

220 254,07 55895,00

384 330,25 126815,00

604

VarMFEMALE

MALE

Total

KreatinasGN Mean Rank Sum of Ranks

9 lentelė. Rangų lentelė.

9 lentelėje pateikiama kiekvienos grupės rangų suma (Sum of Ranks): vyrų rango

suma yra 126815, o moterų — 55895. Lentelės N stulpelyje nurodomas duomenų kiekis:

vyrų — 384, o moterų —220.

Vidutinis rangas nurodytas stulpelyje Mean Rank. Vyrų vidutinis rangas yra:

126815/384 = 330,25, o moterų vidutinis rangas yra: 55895/220 = 254,07. Iš jų matome,

kad didesnių kreatino kiekio tyrimo pabaigoje reikšmių buvo daugiau pas vyrus.

Test Statisticsa

31585,000

55895,000

-5,163

,000

Mann-Whitney U

Wilcoxon W

Z

Asymp. Sig. (2-tailed)

KreatinasG

Grouping Variable: VarMa.

10 lentelė. Mano-Vitnio lentelė.

10 lentelėje pateikta parametro U = min (U1, U2) = 31585 reikšmė, taip pat

mažesnioji rangų sumos reikšmė Vilkoksono W = min (R1, R2) = 55895, Z reikšmė yra

-5,163 bei parametro p-reikšmė lygi 0.

Tegu p-reikšmė yra p, o reikšmingumo lygmuo α, tuomet, kai p < α, skirstiniai

skiriasi, o kai p ≥ α, tai nesiskiria. Šiuo atveju: p = 0 yra mažesnis už α = 0,05, taigi

Page 21: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

21

nulinė hipotezė yra atmetama, tad vyrų kreatino kiekis tyrimo pabaigoje statistiškai

skiriasi nuo moterų kreatino kiekio tyrimo pabaigoje.

Page 22: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

22

DVIEJŲ PRIKLAUSOMŲ IMČIŲ PALYGINIMAS

Vilkoksono testas

Vilkoksono testas taikomas tolydiems duomenims. Jo esmė ta, kad yra randamas

skirtumas tarp abiejų testavimo reikšmių (iš pirmojo testavimo reikšmių atimamos tam

tikros antrojo testavimo reikšmės) ir absoliučiosios gautų skirtumų reikšmės yra

išdėstomos pagal rangus, paliekant rangams turėtus skirtumų ženklus. Kriterijaus

statistika Z gaunama įvertinant rangų su minuso ir pliuso ženklais sumos bei nulinių

skirtumų skaičių. Remiantis šia statistika priimamas sprendimas dėl statistinės hipotezės:

:

:

1

0

H

H

Stebima tolydžiųjų kintamųjų pora (X, Y). Duomenys nn yxyx ,,,, 11 gauti

matavimams naudojant rangų skalę.

Kriterijaus statistika:

,,

24

121,

4

1

TZ

nnnnn

—Tkur teigiamasis rangas, atitinkantis teigiamą niyxdreikšmęd iiii ,,1,, .

Tegu reikšmingumo lygmuo yra α, o p-reikšmė lygi p. Tuomet daroma išvada,

kad:

skirstiniai skiriasi, jei p < α;

skirstiniai nesiskiria, jeigu p ≥ α.

Išnagrinėsime kreatino kiekį tyrimo pradžioje bei pabaigoje abiems terapijoms bei

kiekvienai terapijai atskirai tiek vyrams, tiek moterims, naudodami Vilkoksono testą. Šis

testas taikomas todėl, kad kreatino kiekis pradžioje yra pasiskirstęs pagal normalųjį dėsnį,

o pabaigoje nėra pasiskirstę pagal normalųjį dėsnį.

kintamųjų skirstiniai yra vienodi,kintamųjų skirstiniai nėra vienodi.

Page 23: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

23

Ranks

581a 312,93 181815,00

23b 38,91 895,00

0c

604

Negative Ranks

Positive Ranks

Ties

Total

KreatinasG - KreatinasPN Mean Rank Sum of Ranks

KreatinasG < KreatinasPa.

KreatinasG > KreatinasPb.

KreatinasG = KreatinasPc.

11 lentelė. Vilkoksono testas

Palyginome kreatino kiekį tyrimo pradžioje bei pabaigoje abiems terapijoms.

Vienuoliktos lentelės Negative Ranks eilutėje pažymėta, kiek buvo atveju, kai kreatino

kiekis pradžioje viršijo kreatino kiekį tyrimo pabaigoje: N = 581. Šiuos atvejus

atitinkančių rangų suma yra 181815, o vidutinis rangas: 312,93.

Vienuoliktos lentelės Positive Ranks eilutėje pažymėta, kiek buvo atveju, kai

kreatino kiekis pabaigoje viršijo kreatino kiekį tyrimo pradžioje: N = 23. Šiuos atvejus

atitinkančių rangų suma yra 895, o vidutinis rangas: 38,91.

Matome, kad atvejų, kai kreatino kiekis tyrimo pradžioje viršijo kreatino kiekį

tyrimo pabaigoje yra daugiau nei atvejų, kai kreatino kiekis pabaigoje viršijo kreatino

kiekį tyrimo pradžioje.

Test Statisticsb

-21,084a

,000

Z

Asymp. Sig. (2-tailed)

KreatinasG -KreatinasP

Based on positive ranks.a.

Wilcoxon Signed Ranks Testb.

12 lentelė. Vilkoksono testas

12 lentelėje pateikta statistikos Z reikšmė lygi -21,084 bei p-reikšmė lygi 0,000.

Kadangi 0 < 0,05, tai nulinė hipotezė H0 atmetama. Kreatino kiekis tyrimo pradžioje

statistiškai skiriasi nuo kreatino kiekio tyrimo gale.

Page 24: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

24

Ranks

109a 57,92 6313,00

3b 5,00 15,00

0c

112

Negative Ranks

Positive Ranks

Ties

Total

KreatinasG - KreatinasPN Mean Rank Sum of Ranks

KreatinasG < KreatinasPa.

KreatinasG > KreatinasPb.

KreatinasG = KreatinasPc.

13 lentelė. Vilkoksono rangų testas.

Palyginome moterų kreatino kiekį tyrimo pradžioje bei pabaigoje, kai buvo

taikoma gydomoji terapija. 13 lentelės Negative Ranks eilutėje pažymėta, kiek buvo

atveju, kai moterų kreatino kiekis pradžioje viršijo moterų kreatino kiekį tyrimo

pabaigoje, kai buvo taikoma gydomoji terapija: N = 109. Šiuos atvejus atitinkančių rangų

suma yra 6313, o vidutinis rangas: 57,92.

Tryliktos lentelės Positive Ranks eilutėje pažymėta, kiek buvo atveju, kai moterų

kreatino kiekis pabaigoje viršijo kreatino kiekį tyrimo pradžioje: N = 3. Šiuos atvejus

atitinkančių rangų suma yra 15, o vidutinis rangas: 5.

Matome, kad atvejų, kai moterų kreatino kiekis tyrimo pradžioje viršijo kreatino

kiekį tyrimo pabaigoje, taikant gydomąją terapiją yra daugiau nei atvejų, kai moterų

kreatino kiekis pabaigoje viršijo kreatino kiekį tyrimo pradžioje, taikant tą pačią terapiją.

Test Statisticsb

-9,142a

,000

Z

Asymp. Sig. (2-tailed)

KreatinasG -KreatinasP

Based on positive ranks.a.

Wilcoxon Signed Ranks Testb.

14 lentelė. Vilkoksono testo statistika.

Page 25: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

25

14 lentelėje pateikta statistikos Z reikšmė lygi -9,142 bei p-reikšmė lygi 0,000.

Kadangi 0 < 0,05, tai nulinė hipotezė H0 atmetama. Moterų kreatino kiekis tyrimo

pradžioje statistiškai skiriasi nuo kreatino kiekio tyrimo gale, taikant gydomąją terapiją.

Tokie pat rezultatai gaunami ir moterų kreatino kiekiui tyrimo pradžioje bei

pabaigoje, kai buvo taikoma kontrolinė terapija. Tai aiškiai matome 15 ir 16 lentelėse.

Ranks

109a 57,92 6313,00

3b 5,00 15,00

0c

112

Negative Ranks

Positive Ranks

Ties

Total

KreatinasG - KreatinasPN Mean Rank Sum of Ranks

KreatinasG < KreatinasPa.

KreatinasG > KreatinasPb.

KreatinasG = KreatinasPc.

15 lentelė. Vilkoksono rangų testas.

Test Statisticsb

-9,142a

,000

Z

Asymp. Sig. (2-tailed)

KreatinasG -KreatinasP

Based on positive ranks.a.

Wilcoxon Signed Ranks Testb.

16 lentelė. Vilkoksono testo statistika.

Taigi moterų kreatino kiekis tyrimo pradžioje statistiškai skiriasi nuo kreatino

kiekio tyrimo gale, taikant ir kontrolinę terapiją.

Palyginsime vyrų kreatino kiekį tyrimo pradžioje bei pabaigoje, kai buvo taikoma

gydomoji terapija.

Page 26: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

26

Ranks

181a 101,31 18338,00

11b 17,27 190,00

0c

192

Negative Ranks

Positive Ranks

Ties

Total

KreatinasG - KreatinasPN Mean Rank Sum of Ranks

KreatinasG < KreatinasPa.

KreatinasG > KreatinasPb.

KreatinasG = KreatinasPc.

17 lentelė. Vilkoksono rangų testas.

17 lentelės Negative Ranks eilutėje nurodyti atvejai, kai vyrų kreatino kiekis

pradžioje viršijo vyrų kreatino kiekį tyrimo pabaigoje, kai buvo taikoma gydomoji

terapija: N = 181. Šiuos atvejus atitinkančių rangų suma yra 18338, o vidutinis rangas:

101,31.

Šios lentelės Positive Ranks eilutėje taip pat nurodyti atvejai, kai vyrų kreatino

kiekis pabaigoje viršijo kreatino kiekį tyrimo pradžioje: N = 11. Šiuos atvejus

atitinkančių rangų suma yra 190, o vidutinis rangas: 17,27.

Taigi atvejų, kai vyrų kreatino kiekis tyrimo pradžioje viršijo kreatino kiekį

tyrimo pabaigoje, taikant gydomąją terapiją yra daugiau nei atvejų, kai vyrų kreatino

kiekis pabaigoje viršijo kreatino kiekį tyrimo pradžioje, taikant tą pačią terapiją.

Test Statisticsb

-11,769a

,000

Z

Asymp. Sig. (2-tailed)

KreatinasG -KreatinasP

Based on positive ranks.a.

Wilcoxon Signed Ranks Testb.

18 lentelė. Vilkoksono testo statistika.

Page 27: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

27

18 lentelėje pateikta statistikos Z reikšmė lygi -11,769 bei p-reikšmė lygi 0,000.

Kadangi 0 < 0,05, tai nulinė hipotezė H0 atmetama. Vyrų kreatino kiekis tyrimo pradžioje

statistiškai skiriasi nuo kreatino kiekio tyrimo gale, taikant gydomąją terapiją.

Tokie pat rezultatai gaunami ir vyrų kreatino kiekiui tyrimo pradžioje bei

pabaigoje, kai buvo taikoma kontrolinė terapija. Tai matome 19 ir 20 lentelėse.

Ranks

187a 98,81 18478,00

5b 10,00 50,00

0c

192

Negative Ranks

Positive Ranks

Ties

Total

KreatinasG - KreatinasPN Mean Rank Sum of Ranks

KreatinasG < KreatinasPa.

KreatinasG > KreatinasPb.

KreatinasG = KreatinasPc.

19 lentelė. Vilkoksono rangų testas.

Test Statisticsb

-11,951a

,000

Z

Asymp. Sig. (2-tailed)

KreatinasG -KreatinasP

Based on positive ranks.a.

Wilcoxon Signed Ranks Testb.

20 lentelė. Vilkoksono testo statistika.

Taigi vyrų kreatino kiekis tyrimo pradžioje statistiškai skiriasi nuo kreatino kiekio

tyrimo gale, taikant kontrolinę terapiją.

Matome, kad visais atvejai skirstiniai skiriasi, tai atitinkama terapija, t.y.

gydomoji arba kontrolinė, turėjo įtakos kreatino kiekiui gydymo metu.

Page 28: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

28

Ženklų testas

Turime n dydžio kintamųjų pavyzdį nxxx ,...,, 21 . Nulinė hipotezė yra, kad

populiacijos mediana yra lygi tam tikrai reikšmei M. Kintamuosius, kurie yra didesni už

M vadinsime r , o reikšmes, kurios mažesnės už M vadinsimer (kai ženklų testas yra

naudojamas kintamųjų porai M reikšmė yra nulis). Reikšmės x kurios yra lygios M tiesiog

ignoruojamos. Suma rr gali būti mažiau už n, tai mes laikysime kaip n‘. Jei bendras

abiejų duomenų porų skaičius yra didesnis nei 20, tai sakysime, kad duomenų daug.

Vietoj binominio skirstinio dideliam duomenų kiekiui ženklų testui, mes naudosime

normaliojo tikėtinumo skirstinį. Abi np ir n(1-p) reikšmės turi būti didesnės už 5, kad

galėtume vykdyti testą.

Normaliojo skirstinio vidurkis:

n5,0 ;

Standartinis nuokrypis:

n5,0 ;

Testo statistika z:

)5,0(Xz ;

Jei pliusų ar minusų skaičius yra didesnis nei2

n, mes naudosime sekančią testo

statistikos skaičiavimo formą:

n

nXXz

5,0

5,0)5,0()5,0(

;

Jei pliusų ar minusų skaičius yra mažesnis už2

n, statistika yra:

n

nXXz

5,0

5,0)5,0()5,0(

;

Šiose formulėse X yra pliusų (arba minusų) skaičius.

Palyginsime vidutinį kreatino kiekį tyrimo pabaigoje bei pradžioje, taikydamiženklų testą.

Page 29: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

29

Frequencies

581

23

0

604

Negative Differencesa

Positive Differencesb

Tiesc

Total

KreatinasG - KreatinasPN

KreatinasG < KreatinasPa.

KreatinasG > KreatinasPb.

KreatinasG = KreatinasPc.

21 lentelė. Ženklų testas

Test Statisticsa

-22,664

,000

Z

Asymp. Sig. (2-tailed)

KreatinasG -KreatinasP

Sign Testa.

22 lentelė. Ženklų testas

Atlikę testą, 21 lentelėje matome, kad didžioji duomenų dalis yra Negative

Diferences grupėje, tai reiškia, kad atvejų, kai vidutinis kreatino kiekis tyrimo pradžioje

viršija vidutinį kreatino kiekį tyrimo pabaigoje yra daugiau nei atvejų, kada vidutinis

kreatino kiekis pabaigoje viršija vidutinį kreatino kiekį tyrimo pradžioje.

22 lentelėje Test statistics, kriterijaus Asymp. Sig. (2-tailed) skiltyje matome, kad

p-reikšmė lygi 0, taigi p < 0,05, todėl matome, kad vidutinis kreatino kiekis pradžioje

skiriasi nuo vidutinio kreatino kiekio pabaigoje.

Darome išvadą, kad abiejuose terapijos naudojami vaistai daro įtaką kreatino

kiekiui organizme. Vaistai mažina kreatino kiekį organizme.

Page 30: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

30

KAPLAN-MEIERIO IŠGYVENAMUMO ANALIZĖ

Cenzūravimas

Ne visada išgyvenamumo duomenys turi cenzūruotų stebėjimų, kaip ir

cenzūravimas pasitaiko ne vien išgyvenamumo analizėje. Nepaisant to, cenzūruoti

išgyvenamumo duomenys yra labai paplitę ir reikalauja specialaus apdorojimo, ir būtent

cenzūravimas daugiau nei bet kas kitas jungia daugelį metodų į išgyvenamumo analizę.

Cenzūravimas – tai situacija, kai individas stebimas iki įvykio įvykimo momento

ne visą laiką. Tarkim, kad i-jo individo iš n dydžio imties stebėjimo trukmė yra iT , čia iT

yra atsitiktinis dydis. Taip pat tarkime, kad individo stebėjimas nutraukiamas laiko

momentu ic . Tada stebimi dydžiai iii cTX ,min su indikatoriniu kintamuoju

ii

ii

icTjei

cTjei

,0

,1

Cenzūravimas būna įvairių formų ir atsiranda dėl skirtingų priežasčių. Esminis

skirtumas yra tarp cenzūravimo iš kairės ir cenzūravimo iš dešinės. Kintamojo T

stebėjimas yra cenzūruotas iš dešinės, kai apie jį žinoma tik tiek, kad jis didesnis už

reikšmę c. Kintamasis T yra cenzūruotas iš dešinės, kai stebėjimas nutraukiamas anksčiau

nei įvykis įvyksta. Aišku, ši cenzūravimo sąvoka neapsiriboja tik įvykio laiku.

Panašiai apibrėžiamas ir cenzūravimas iš kairės. Taip atsitinka, T < c.

Išgyvenamumo analizėje toks cenzūravimas iš kairės atsiranda, kai įvykis pasireškia iki

stebėjimo pabaigos.

Paprasčiausia ir dažniausia pasitaikančia situacija pavaizduota 6 paveiksle. Šiame

paveiksle pavaizduojama dalis duomenų, t.y. tiriamųjų, kurie buvo stebimi po inksto

persodinimo operacijos. Horizontalioje ašyje išsidėstęs tyrimo laikotarpis, o vertikalioje

pavaizduoti tiriamieji. Kiekviena raidė atitinka tam tikrą tiriamąjį. Simbolis X žymi

inksto atmetimo atvejus konkrečiu laiko momentu. Po 1 metų tiriamieji nebestebimi, taigi

įrašas pažymėtas raide D yra cenzūruotas iš dešinės, o A, B, C yra cenzūruotas iš kairės.

(subjektas cenzūruotas),

(subjektas necenzūruotas).

Page 31: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

31

6 pav. Cenzūravimas

Standartiniai išgyvenamumo metodai palaiko tik cenzūravimą iš dešinės.

Paciento pašalinimas iš išgyvenamumo kreivės, stebėjimo laikotarpio pabaigoje,

vadinamas paciento „cenzūravimu“. Šios procedūros tikslas yra gauti kaip įmanoma

tikslesnę išgyvenimo kreivę, įtraukiant visą įmanomą informaciją. Kai pacientas yra

cenzūruojamas (inkstas nebuvo atmestas) kreivė nekrenta žemyn, ji krenta žemyn kai

persodintas inkstas pacientui yra atmetamas. Vienintelis būdas pamatyti, kur pacientas

buvo cenzūruotas, tai atžymos, esančios ant išgyvenimo kreivės. Dėl cenzūravimo mažėja

pacientų, įtraukiamų į kreivę. Kiekvienas inksto atmetimo atvejis po atžymos atvaizduoja

didesnį populiacijos sumažėjimą, taigi kiekvienas žingsnis žemyn bus truputi didesnis.

Šis efektas paprastai nėra matomas tiesiog pažiūrėjus į išgyvenimo kreivę.

Pacientų cenzūravimas mažina duomenų kiekį. Duomenų kiekio mažinimas

visada mažina patikimumą, taigi kuo daugiau ir kuo anksčiau pacientai yra cenzūruojami

tuo nepatikimesnė išgyvenimo kreivė. Kadangi kiekvienas cenzūruotas pacientas mažina

kreivės patikimumą nuo esamo taško į priekį, kreivės pabaiga yra labiausiai paveikta.

Kaplan-Meierio modelis yra paremtas sąlyginių tikimybių skaičiavimu kiekvienu

laiko momentu, kai įvyksta įvykis, ir išgyvenimo tikimybės apskaičiavimas kiekvienu

laiko momentu.

Page 32: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

32

Išgyvenamumo analizė. Kaplan-Meierio metodas

Išgyvenamumo analizė – tai statistiniai metodai nagrinėjantys laiko intervalus nuo

tam tikro proceso pradžios iki jo pabaigos.

Išgyvenamumo analizėje naudojami duomenys gali būti retrospektyviniai

(praeities), kai apklausos metu užrašomi praeities įvykiai ir perspektyviniai (ateities), kai

individai stebimi numatytą laiko intervalą. Perspektyvinė duomenų analizė yra

neabejotinai patikimesnė. Išgyvenamumo duomenys turi kelis ypatumus, dėl kurių

įprastinius statistinius metodus taikyti būtų sudėtinga. Tai duomenų cenzūravimas bei

priklausomi nuo laiko aiškinamieji kintamieji.

Kaplan-Meierio metodas tinkamas nedideliems duomenų rinkiniams su

pakankamai tiksliai išmatuotu išgyvenamumo laiku. Šis metodas plačiai taikomas

biomedicinoje išgyvenamumo funkcijos įvertinimui. Taip pat buvo naudojamas daugeli

metų, kol 1958 metais Kaplanas ir Meieris parodė, kad faktiškai tai yra neparametrinis

maksimalaus tikėtinumo statistinis įvertis. Taip metodas tapo teoriškai pagristu.

Kai nėra cenzūruotų duomenų, Kaplan-Meierio įvertis yra gana aiškus ir

paprastas. Išgyvenamumo funkcija tS yra tikimybė, kad įvykio laikas T > t, kur t ≥ 0,

t.y. tTPtS .

Situacija lieka nesudėtinga ir esant vienkartiniam cenzūravimui iš dešinės, kai

tyrimas baigiamas nustatytu laiko momentu ir visi stebėto įvykio laiko momentai yra

mažesni už c. Tada, visiems ct , funkcija tS taip pat yra visų stebėjimų ir stebėjimų,

kurių įvykio laikas didesnis už t, santykis, o kai ct , tS yra neapibrėžta.

Kai vienas kitas cenzūruotas laikas tampa mažesnis už kai kuriuos įvykių laikus,

situacija tampa daug sudėtingesnė. Šiuo atveju, santykis, kur stebėjimų įvykio laikas

didesnis už t, gali sumažėti, kadangi tie stebėjimai, kurie buvo cenzūruoti anksčiau laiko

momento t, iš tikrųjų vėliau gali pradingti be mūsų žinios. Tarkim, yra k skirtingų laiko

momentų: kttt ...21 .

Page 33: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

33

Kiekvienam laiko momentui priskiriama in tiriamųjų, kuriems persodintas inkstas

galėjo būti atmestas. Tai reiškia, kad tiriamiesiems persodintas inkstas nebuvo nei

atmestas, nei cezūruotas iki laiko momento it . Tegul, id yra tiriamųjų, kuriems atmetė

inkstą tam tikru laiko momentu it , skaičius. Tada Kaplan-Meierio įvertis apibrėžiamas

taip:

tti i

i

jn

dtS

:

1ˆ , kttt 1 .

Reikšmė, kuri apskaičiuojama skliaustuose, interpretuojama kaip sąlyginė

išgyvenamumo tikimybė laiko momentu 1it , atsižvelgiant į tai, kad kiekvienam iš šių

tiriamųjų inkstas nebuvo atmestas iki laiko momento it . Funkcija 1ˆ tS , kai 1tt .

Kai ktt , tS funkcijos apibrėžimas priklauso nuo cenzūruotų stebėjimų

konfigūracijos. Jei cenzūruotų stebėjimų didesnių už kt nėra, tai 0ˆ tS visiems ktt .

Jei yra cenzūruotų stebėjimų didesnių už kt , tai tS neapibrėžta visiems ktt .

Standartinė Kaplan-Meierio įverčio paklaida skaičiuojama pagal Grenwudo

formulę:

21

1

ˆˆ

t

i iii

i

dnn

dtStSse .

Kaplan-Meierio metodu galima įvertinti ir palyginti išgyvenamumo funkcijas

kiekvienoje iš ligonių grupių.

Tiriamas pooperacinis laikotarpis yra laikas praleistas po inksto persodinimo,

kurio trukmė priklauso nuo atskiro ligonio gydimo proceso. Daliai ligonių persodintas

inkstas atmetamas. Vertinant ir lyginant ligonių persodinto inksto išgyvenamumą

naudojami du kintamieji: kiekybinis laiko kintamasis Laikas ir kategorinis dvireikšmis

atmetimo atveju kintamasis atmetimas. Šiuo atveju cenzūruotais laikomi ligoniai,

kuriems inkstas nebuvo atmestas.

Page 34: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

34

250200150100500

Laikas

1,0

0,8

0,6

0,4

0,2

0,0

Cu

mS

urv

ival

ACTIVETREATMENT-censored

ACTIVECONTROL-censored

ACTIVETREATMENT

ACTIVECONTROL

Terapija

Survival Functions

7 pav. Kaplan-Meierio išgyvenamumo grafikas.

7 paveikslo grafiko horizontalioje ašyje išsidėstęs pacientų stebėjimo laikas, o

vertikalioje ašyje yra pacientams persodintų inkstų išgyvenimo tikimybės. Kiekviena iš

išgyvenimo kreivių parodo išgyvenimo tikimybę kiekvienu laikotarpiu kiekvienai iš

terapijos grupių. Kadangi abi kreivės yra beveik vienodos, skirtumus tarp jų padės

pastebėti palyginimo lentelė.

Išgyvenimo kreivių lyginimas

Lentelėje pateikti keli išgyvenimo kreivių lyginimo metodai: Log Rank, Breslovo,

Tarono-Varo testai.

Page 35: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

35

Log Rank testas skirtas palyginti išgyvenimo kreivių pasiskirstymo panašumą.

Šiame teste visi laiko taškai yra vienodo svorio.

Breslovo testas skirtas palyginti išgyvenimo kreivių pasiskirstymo panašumą.

Laiko svoris priklauso nuo pavojingų atvejų esančių tuo laiko momentu.

Tarono-Varo testas skirtas palyginti išgyvenimo kreivių pasiskirstymo panašumą.

Laiko svoris priklauso nuo kvadratinės šaknies iš pavojingų atvejų skaičiaus esančio tuo

laiko momentu.

Overall Comparisons

,289 1 ,591

,475 1 ,491

,375 1 ,540

Log Rank (Mantel-Cox)

Breslow (GeneralizedWilcoxon)

Tarone-Ware

Chi-Square df Sig.

The vector of trend weights is -1, 1. This is the default.

23 lentelė. Išgyvenamumo kreivių lentelė.

Ši lentelė parodo skirtumus tarp dviejų terapijų grupių išgyvenimo kreivių.

Kadangi kiekvieno atliekamo testo Sig. reikšmė didesnė už 0,1 todėl galime teigti, kad

skirtumo tarp išgyvenimo kreivių nėra.

Atlikę Kaplan-Meierio išgyvenimo analizės procedūrą, išanalizavome laiko iki

įvykio pasiskirstymą skirtingoms terapijų grupėms. Palyginimo testas parodė, kad nėra

statistiškai žymaus skirtumo tarp išgyvenimo kreivių.

Išgyvenamumo laiko pasiskirstymas

Visi standartiniai išgyvenamumo analizės metodai yra tikimybiniai arba

stochastiniai. Laiko momentai kuriais įvykiai įvyksta yra suprantami kaip tam tikro

atsitiktinio proceso realizacijos. Tai reiškia, kad įvykio įvykimo laikas T atskiram

individui yra atsitiktinis dydis turintis tikimybinį pasiskirstymą. Dažnai išgyvenamumo

duomenų metodai vieni nuo kitų skiriasi būtent dydžio T pasiskirstymu. Dydžio T

pasiskirstymo funkcija

Page 36: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

36

)()( tTPtF .

Tada išgyvenamumo funkcija apibrėžiama taip:

tFtTPtS 1)( .

Kai kintamieji tolydūs, tai tikimybinis pasiskirstymas gali būti aprašytas

tikimybine tankio funkcija:

dt

tdS

dt

tdFtf .

Aišku, kad

duuftFt

0

,

duuftSt

.

Rizikos funkcija naudinga apibrėžiant išgyvenamumo laiko pasiskirstymą,

kuris naudojamas aprašant populiacijos senėjimo procesą.

Tiriamas pooperacinis laikotarpis yra laikas praleistas po inkstų persodinimo

operacijos, kurio trukmė priklauso nuo atskiro ligonio būklės. Daliai ligonių inkstas

atmetamas. Vertinant ir lyginant ligoniams persodinto inksto išgyvenamumą naudojami

du kintamieji: kiekybinis laiko kintamasis Laikas ir kategorinis dvireikšmis atmetimo

atvejų kintamasis atmetimas. Cenzūruoti ligoniai tie, kuriems inksto organizmas

neatmetė.

Page 37: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

37

24 lentelė. Išgyvenimo laiko lentelė.

Įvertintos išgyvenamumo funkcijos reikšmės pateikiamos 24 lentelėje. Kiekviena

skaičių eilutė ( Survival Table) atitinka vieną iš turimų 604 įrašų, išdėstytų laiko didėjimo

tvarka (nuo 0 iki 365 parų).

Pirmame stulpelyje, nurodyta gydymo terapija, antrame (ID) ir ketvirtame

(Status) — ar inkstą atmetė, ar ne, trečiame stulpelyje (Time) pateiktas terapijos laikas,

per kurį ligoniai buvo stebimi.

Page 38: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

38

Išgyvenimo lentelė tai pacientų išgyvenimo laiko bei tikimybės ir tikimybės

paklaidos atvaizdavimas. Visa tai nurodyta penktame (Estimate) ir šeštame (Std. Error)

stulpeliuose.

Kadangi ši lentelė yra labai didelė, čia pateikta tik vienos terapijos grupės dalies

išgyvenimo laikas ir tikimybės.

Galima teigti, kad ligoniui organizmas inksto neatmes per 5 paras su tikimybe

didesne nei 0,953. Panašiai didelės neatmetimo tikimybės yra gaunamos, kai taikoma ir

gydomoji terapija. Taigi inksto atmetimo laikas nepriklauso nuo terapijos tipo.

Išgyvenimo laiko vidurkiai

25 lentelė. Išgyvenimo laiko vidurkiai.

Iš šios lentelės matome, kad vidutinis išgyvenamumas atitinkamai keičiasi pagal

terapijos tipą. Kai taikoma ligoniui kontrolinė terapija, tai inksto neatmetimo vidutinis

laikas yra didesnis, o kai terapija taikoma gydomoji, tai inksto neatmetimo vidutinis

laikas mažesnis.

Page 39: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

39

RIZIKOS FAKTORIŲ ĮVERTINIMAS. KOKSO REGRESIJOSMODELIS

Vienas iš svarbiausių uždavinių statistiniuose medicininiuose tyrimuose yra

nustatyti, ar tam tikri kintamieji priklauso nuo išgyvenimo laiko. Literatūroje, skirtoje

laiko trukmės modeliavimui vienas iš išskiriamų modelių yra proporcingųjų rizikų

modelis (Kokso regresijos modelis).

Kokso proporcingųjų rizikų modelis nereikalauja išgyvenamumo laiko

pasiskirstymo prielaidų. Šis modelis numato, kad rizikos funkcija yra nepriklausomų

kintamųjų funkcija ir nedaroma jokių prielaidų dėl funkcijos pavidalo. Todėl, Kokso

modelis tam tikra prasme nagrinėjamas kaip neparametrinis.

Kelios modelio savybės:

įtraukia priklausomus nuo laiko aiškinamuosius kintamuosius;

sluoksninės analizės galimybė, kuri labai efektyvi kontroliuojant netinkamus

kintamuosius;

galimybė naudoti ir diskrečius ir tolydžius išgyvenamumo laiko įverčius.

Šis regresijos metodas pirma karta buvo pasiūlytas 1972 metais britų statistiko

Davido Kokso jo garsiajame straipsnyje “Regression Models and Life Tables”.

Proporcingųjų rizikų modelis

Bendras modelis, į kurį nėra įtraukti priklausomi nuo laiko aiškinamieji kintamieji

arba neproporcingosios rizikos, užrašomas taip:

kk xxtt ...exp 110

Ši lygtis reiškia, kad rizika kiekvienam i laiko momentu t yra pradinės rizikos

funkcijos t0 , kuri neapibrėžta iš kairės ir neneigiama, bei eksponentės, kurios

rodiklyje yra tiesinė k fiksuotų aiškinamųjų kintamųjų funkcija, sandauga.

Kai 0j , jx didėjant, didėja rizikos funkcija, kai 0j , jx didėjant, rizikos

funkcija mažėja.

Page 40: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

40

Variables in the Equation

-,013 ,004 12,575 1 ,000 ,987

-,022 ,007 9,583 1 ,002 ,978

-,015 ,004 16,902 1 ,000 ,985

-,029 ,008 14,632 1 ,000 ,971

,016 ,006 8,608 1 ,003 1,016

-,017 ,004 20,928 1 ,000 ,984

KreatinasPStep 1

Amzius

KreatinasP

Step 2

Amzius

Svoris

KreatinasP

Step 3

B SE Wald df Sig. Exp(B)

26 lentelė. Proporcingųjų modelių lentelė.

26 lentelėje pateikti duomenys nurodo, kad išgyvenamumui įtakos turi kreatino

kiekis tyrimo pradžioje (KreatinasP), ligonio amžius bei svoris.

Įvertintas regresijos modelis atrodo taip:

KreatinasPSvorisAmziustt 017,0016,0029,0exp0 .

Iš įvertinto modelio matyti, kad nuo kreatino kiekio tyrimo pradžioje ir ligonio

amžiaus bei svorio priklauso inksto atmetimo rizika. Nuo kreatino kiekio tyrimo

pradžioje ir amžiaus didėjimo rizika, kad inkstą atmes mažėja, o kuo didesnį svorį turi

tiriamasis, tuo rizika, kad inkstas jam bus atmestas padidėja.

Page 41: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

41

LOGISTINĖ REGRESIJA

Dažniausiai persodinto inksto būklė priklauso nuo kelių kokių nors parametrų.

Ieškosime faktorių, nuo kurių priklauso, ar persodintas inkstas buvo atmestas, ar ne.

Radus tuos faktorius prognozuosime inksto atmetimo tikimybę.

Kalbama apie įvykius, kurie gali įvykti arba neįvykti. Šiuo atveju logistinė

regresija skaičiuoja tikimybę įvykti tam tikram įvykiui, priklausomai nuo nepriklausomų

kintamųjų reikšmių. Logistinė regresija taikoma, kai kategoriniai prognozuojami

kintamieji yra dvireikšmiai. Šio dvireikšmio kategorinio kintamojo reikšmių

prognozavimas tam tikra prasme yra klasifikavimo uždavinys. Nepriklausomi kintamieji

gali būti bet kokio skaitinio tipo.

Logistinės regresijos modelis

Binarinė logistinė regresija yra naudojama tyrinėti binarinių kintamųjų

priklausomybei nuo bet kurios skalės nepriklausomų kintamųjų.

Logistinės regresijos modelis yra:

(1),...)(,)}(exp{1

)}(exp{2211 kikiii

i

ii xbxbxbaxz

xz

xzp

kur jix – nepriklausomo kintamojo reikšmės, jb – koeficientai, kuriuos rasti yra

logistinės regresijos uždavinys, a – konstanta.

Nagrinėjamų kintamųjų reikšmes žymėsime kiiii xxxx ,...,, 21

. Laikysime, kad

ii yx , yra tam tikrų atsitiktinių vektorių ii YX , realizacijos. Be to, ii YX , laikysime

nepriklausomomis tam tikro atsitiktinio vektoriaus YX , kopijomis.

Logistinė regresija tinka galiojant gana bendroms prielaidoms: kintamieji

kXX ,...,1 nebūtinai turi būti normalieji; nereikalaujama normaliai pasiskirsčiusių

paklaidų, nekalbama apie priklausomo kintamojo homoskedastiškumą (dispersijų

vienodumą). Kita vertus modelis gali netikti dėl sudėtingesnės kintamųjų tarpusavio

Page 42: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

42

priklausomybės arba dėl kintamųjų multikolinearumo (t.y.: glaudaus koreliacinio ryšio tarp

analizei atrinktų veiksnių, darančių bendrą įtaką rezultatui).

Tirsime nuo kokių veiksnių priklauso inksto atmetimas. Priklausomu kintamuoju

imsime inksto atmetimą. Nepriklausomus kintamuosius — amžių, ūgį, svorį, lytį, donoro

amžių, kreatino kiekį tyrimo pradžioje, cukraligę, hiperlipidemiją bei hipertenziją.

Modelio suderinamumo tikrinimas

Jeigu prognozuojama tikimybė nuo kintamojo xj nepriklauso, tai (1) modelio

parametras bj = 0. Prognozės priklausomybė nuo nepriklausomų kintamųjų ekvivalenti

klausimui apie parametrų b1, b2, ..., bj lygybę nuliui.

Modelio χ² suderinamumo kriterijus.

Jei visi koeficientai bj = 0, tai reiškia, jog (1) logistinės regresijos modelis netinka

prognozėms daryti.

Tarkime, kad didžiausio tikėtinumo metodu parinkome parametrus ,,,, 1 kbba

,

įstatėme juos į didžiausio tikėtinumo funkciją

0:1:

1ji yi

jyi

i ppL ir radome L

maksimumą, žymimą

baL , . Tada tarkime, kad pasirinkome logistinės regresijos

modelį, kur visi bj = 0, t. y. zi = a.

Didžiausio tikėtinumo funkcijos maksimumą žymėsime

0,

~

aL .

2 kriterijus remiasi tuo, kad

baL , mažai skiriasi nuo

0,

~

aL , jei visi

koeficientai bj = 0.

Statistinė hipotezė:

.0:

,0:

1

3210

j

n

bvienasbentH

bbbbH

Kriterijaus statistika:

Page 43: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

43

baLaL ,ln20,ln2~

2 .

Sprendimo priėmimo taisyklė.

Tegul pasirinktas reikšmingumo lygmuo lygus α. Pagal p-reikšmę

sprendžiame taip:

jei p < α, tai H0 atmetama;

jei p ≥ α, tai H0 neatmetama.

Neatmesta hipotezė H0 rodo, kad logistinės regresijos modelis netinka.

Patikrinsime hipotezę, kad mūsų sudaryto modelio bent vienas koeficientas

nelygus nuliui.

SPSS paketu gauta p-reikšmė pateikta 15 lentelėje.

Omnibus Tests of Model Coefficients

6,695 1 ,010

6,695 1 ,010

6,695 1 ,010

7,338 1 ,007

14,033 2 ,001

14,033 2 ,001

7,603 1 ,006

21,636 3 ,000

21,636 3 ,000

Step

Block

Model

Step

Block

Model

Step

Block

Model

Step 1

Step 2

Step 3

Chi-square df Sig.

27 lentelė.

Kadangi p = 0,006 < 0,05, tai hipotezę apie visų modelio koeficientų lygybę

nuliui atmetame. Galime spręsti, kad bent vieno kintamojo modelyje reikia.

Voldo kriterijus.

Voldo kriterijus atsako į klausimą ar konkretus koeficientas b1 ≠ 0. Voldo

statistika yra2

/

jj SEbW ; čia SEj yra standartinio nuokrypio įvertis. Ši statistika

turi 2 skirstinį su 1 laisvės laipsniu.

Page 44: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

44

Statistinė hipotezė:

.0:

,0:

1

0

bjH

bH j

Sprendimo priėmimo taisyklė:

Tegul reikšmingumo lygmuo lygus α. Hipotezė H0 atmetama 0jb , jei p-

reikšmė p < α. Hipotezė H0 neatmetama, jei p ≥ α.

Variables in the Equation

-,010 ,004 6,566 1 ,010 ,990

-,519 ,246 4,450 1 ,035 ,595

-,023 ,009 7,343 1 ,007 ,977

-,012 ,004 9,039 1 ,003 ,988

,613 ,482 1,614 1 ,204 1,846

-,031 ,009 11,567 1 ,001 ,969

,019 ,007 7,547 1 ,006 1,019

-,014 ,004 11,873 1 ,001 ,986

-,303 ,588 ,265 1 ,607 ,739

KreatinasP

Constant

Step1

a

Amzius

KreatinasP

Constant

Step2

b

Amzius

Svoris

KreatinasP

Constant

Step3

c

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: KreatinasP.a.

Variable(s) entered on step 2: Amzius.b.

Variable(s) entered on step 3: Svoris.c.

28 lentelė.

28 lentelės stulpelyje Sig. pateiktos kiekvieno šio modelio kintamojo p-reikšmės.

Iš šios informacijos galime spręsti, kad inksto atmetimui turi įtakos ligonio amžius, svoris

bei leidžiamo kreatino kiekis tyrimo pradžioje.

Hosmerio Lemešou kriterijus

Hosmerio-Lemešou kriterijaus esmė ta, kad visų stebėjimų prognozuojamų tikimybių

ii xYPp |1 variacinė eilutė padalijama į keletą grupių. Kiekvienos grupės

tikimybės sudedamos. Gautos sumos parodo, kiek kartų kiekvienoje grupėje yi turėtų įgyti

reikšmę 1, jei duotas (1) modelis būtų suderintas su duomenimis. Šių dydžių skirtumą

aprašo skirstinys su (k - 2) laisvės laipsnių, kur k yra grupių skaičius.

Page 45: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

45

Kai reikšmingumo lygmenyje α, Hosmerio-Lemešou statistikos p-reikšmė p ≥ α, tai

gauname patvirtinimą, kad logistinės regresijos modelis su duomenimis yra suderintas.

Hosmer and Lemeshow Test

9,567 8 ,297

3,976 8 ,859

6,876 8 ,550

Step1

2

3

Chi-square df Sig.

29 lentelėje pateikti Hosmerio-Lemešou testo rezultatai.

Contingency Table for Hosmer and Lemeshow Test

48 49,709 12 10,291 60

46 47,944 14 12,056 60

46 47,087 14 12,913 60

49 46,261 11 13,739 60

47 45,613 13 14,387 60

45 44,967 15 15,033 60

52 44,309 8 15,691 60

44 43,414 16 16,586 60

37 42,263 23 17,737 60

34 36,433 21 18,567 55

52 50,811 8 9,189 60

46 49,047 14 10,953 60

48 47,951 12 12,049 60

47 47,105 13 12,895 60

47 46,168 13 13,832 60

44 45,238 16 14,762 60

46 44,345 14 15,655 60

47 42,817 13 17,183 60

41 41,105 19 18,895 60

30 33,413 25 21,587 55

55 51,584 5 8,416 60

46 49,997 14 10,003 60

52 48,845 8 11,155 60

45 47,716 15 12,284 60

45 46,712 15 13,288 60

45 45,603 15 14,397 60

45 44,126 15 15,874 60

43 42,367 17 17,633 60

43 39,874 17 20,126 60

29 31,175 26 23,825 55

1

2

3

4

5

6

7

8

9

10

Step1

1

2

3

4

5

6

7

8

9

10

Step2

1

2

3

4

5

6

7

8

9

10

Step3

Observed Expected

Atmetimas = neatmetë

Observed Expected

Atmetimas = atmetë

Total

30 lentelėje pateikti Hosmerio-Lemešou testo rezultatai.

Page 46: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

46

29 lentelėje Sig skilties trečiajame žingsnyje pateikta p-reikšmė. Akivaizdu, jog p-

reikšmė 0,550 > 0,05, taigi Hosmerio-Lemešou kriterijus patvirtina, kad duomenys su

logistinės regresijos modeliu yra suderinti.

30 lentelėje parodyta, kiek iš tikrųjų inksto atmetimų bei neatmetimų buvo kiekvienoje

iš 10 grupių ir kiek jų turėjo būti taikant logistinę regresiją. Pavyzdžiui, septintoje

grupėje buvo 60 ligonių, iš kurių 45 inksto neatmetė, o visų tikimybių 1-pt suma lygi

44,126, o 15 ligonių inkstą atmetė, ir visų tikimybių pt suma lygi 15,874.

Hosmerio-Lemešou kriterijų paprastai rekomenduojama taikyti, kai į kiekvieną grupę

pakliūna bent 5 stebėjimai. Kaip kad šiuo atveju.

Determinacijos koeficientai

Kai tiesinėje regresijoje norime skaitiškai įvertinti, ar nepriklausomų kintamųjų ir

priklausomo kintamojo priklausomybė yra stipri, skaičiuojamas determinacijos

koeficientas 12 r . Kuo koeficientas didesnis, tuo geriau logistinė regresija suderinta su

duomenimis.

Model Summary

658,611a ,011 ,017

651,274a ,023 ,035

643,670a ,036 ,053

Step1

2

3

-2 Loglikelihood

Cox & SnellR Square

NagelkerkeR Square

Estimation terminated at iteration number 4 becauseparameter estimates changed by less than ,001.

a.

31 lentelė. Determinacijos koeficientai

Yra daug determinacijos koeficiento atmainų. 31 lentelėje pateikti Koks‘o-Snell‘o

ir Nagelkerkės pseudodeterminacijos koeficientai.

Gauto logistinės regresijos modelio koeficientai pateikti 32 lentelės B skiltyje.

Page 47: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

47

Variables in the Equation

-,010 ,004 6,566 1 ,010 ,990

-,519 ,246 4,450 1 ,035 ,595

-,023 ,009 7,343 1 ,007 ,977

-,012 ,004 9,039 1 ,003 ,988

,613 ,482 1,614 1 ,204 1,846

-,031 ,009 11,567 1 ,001 ,969

,019 ,007 7,547 1 ,006 1,019

-,014 ,004 11,873 1 ,001 ,986

-,303 ,588 ,265 1 ,607 ,739

KreatinasP

Constant

Step1

a

Amzius

KreatinasP

Constant

Step2

b

Amzius

Svoris

KreatinasP

Constant

Step3

c

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: KreatinasP.a.

Variable(s) entered on step 2: Amzius.b.

Variable(s) entered on step 3: Svoris.c.

32 pav. Logistinės regresijos modelio koeficientai.

Užrašome z formulę:

KreatinasPz 014,0Svoris019,0Amžius310,0303,0 .

Lygties koeficientai rodo, kaip kinta z reikšmė kintant lygties kintamųjų reikšmėms.

Prognozavimas

Tarkime, kad duomenis sudaro stebėjimai nixxxy kiiii ,,2,1,,,,,, 21 , yi

yra vienetas arba nulis, o ii xx 21 , — intervalinių kintamųjų arba pseudokintamųjų

reikšmės. Parametrų kbbba ,,,, 21 įverčius kbba

,,, 1 reikia parinkti taip, kad (1)

modelis būtų kuo geriau suderintas su turimais duomenimis. Tam taikomas didžiausio

tikėtinumo metodas. Kiekvienam stebėjimui pagal (1) formulę skaičiuojama tikimybė pi.

Parametrų įverčiai kbbira

,,1 parenkami taip, kad tikėtinumo funkcija

0:1:

1ii yi

iyi

i ppL

būtų maksimali. Čia

Page 48: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

48

.,

exp1

exp

2211 kikiii

i

i

i xbxbxbaxz

xz

xz

p

Parametrų įverčių skaičiavimas - iteracinis procesas, t.y. pasirenkamos pradinės jų

reikšmės ir, taikant tam tikrą skaičiavimo metodą, keičiamos tol, kol stabilizuojasi.

Gauti koeficientai kbbira

,,1 naudojami

ixz skaičiuoti. Be to, pagal (2) formulę

galima rasti tikimybės, kad Y = 1, įvertį.

Apibrėžimas. Tikimybės P(Y = 1) įvertis, kai nepriklausomų kintamųjų reikšmių x1,

x2,..., xk vektorius yra kxxxx ,,, 21

, skaičiuojamas pagal formulę

.;exp1/exp|1 2211 kk xbxbxbaxzčiaxzxzxYP

Svarbu, kad tikimybės įvertis būtų skaičiuojamas tik toms x reikšmėms, kurios

patenka į duomenų aibės intervalą, pavyzdžiui, x1 būtinai turi būti iš intervalo maxmin , xx .

Pagal

,...)(,)}(exp{1

)}(exp{2211 kikiii

i

ii xbxbxbaxz

xz

xzp

formulę galima prognozuoti z reikšmę.

Pasinaudoję 32 lentelėje pateiktais duomenimis, galime prognozuoti tokias inksto

atmetimo tikimybes, kaip ši:

kai ligonio amžius yra 18 metų, svoris 64, o kreatino kiekis pradžioje 14,65824, tai

z = -4,87221536, o P(Inkstas atmestas|(18; 64; 14,65824)) = exp(-4,87221536)/(1+

+ exp(-4,87221536)) = 0,0076.

(2)

Page 49: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

49

IŠVADOS

Atlikus pateiktų duomenų apie ligonius, kuriems buvo persodintas inkstas statistinį

tyrimą, nustatyta:

1) Tiek vyrų, tiek moterų kreatino kiekis tyrimo pradžioje pasiskirstęs pagal

normalųjį dėsnį, o tuo tarpu kreatino kiekis tyrimo pabaigoje ne.

2) Moterų vidutinis kreatino kiekis tyrimo pradžioje statistiškai reikšmingai

nesiskiria nuo vyrų vidutinio kreatino kiekio, o tuo tarpu tyrimo pabaigoje vyrų ir

moterų kreatino kiekiai skiriasi.

3) Tiek gydymo, tiek kontrolinės terapijos grupėse naudojami vaistai daro įtaką

kreatino kiekiui organizme. Vaistai mažina kreatino kiekį organizme.

4) Laikas iki inksto atmetimo nepriklauso nuo gydymo.

5) Rizikos faktorių tyrimai parodė, kad kuo žmogus vyresnis bei kreatino kiekis

didesnis, tuo mažesnė riziką, kad inkstą atmes, o kuo didesnis ligonio svoris tuo ta

rizika didėja.

6) Veiksniai įtakojantys inksto atmetimą yra tiriamojo svoris, amžius, kreatino kiekis

tyrimo pradžioje.

Page 50: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

50

LITERATŪRA

1) V. Čekanavičius, G. Murauskas, E. Tatarinavičiūtė. Statistika ir jos taikymai I,Vilnius, TEV, 2000.

2) V. Čekanavičius, G. Murauskas, E. Tatarinavičiūtė. Statistika ir jos taikymai II,Vilnius, TEV, 2002.

3) Allison, P. D. Survival Analysis Using the SAS System: A Practical Guide. Cary,NC: SAS Institute Inc., 1995. 292 p.

4) http://www.donoryste.eu/lt/Naujienos.html?article=30&

5) http://www.sveikas.lt/ligos_placiau2.asp?

6) www.medikai.mf.vu.lt/consp/Laboratorine_medicina.doc

7) http://www.ctstransplant.org/

8) http://www.livekidney.com/

9) http://sti.upmc.edu/default.htm

10) http://www.transweb.org/

11) http://www.transplantation.org/

12) K. Pukėnas. Sportinių tyrimų duomenų analizė SPSS programa, Kaunas, 2005.

13) T. Leonavičienė. SPSS programų paketo taikymas statistiniuose tyrimuose,Vilnius, 2006.

Page 51: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

51

SANTRAUKA

Inkstų persodinimas yra aktuali priemonė gydant inkstų ligas. Nuo inkstų ligų

visame pasaulyje kenčia apie 10 % suaugusių žmonių. Vienas suaugęs žmogus iš

dešimties kenčia nuo chroniškų inkstų ligų. Apie 1,5 mln. žmonių gyvybė palaikoma

dializės būdu, vidutiniškai jie inkstų persodinimo laukia apie septynerius metus.

Šio darbo tikslas — nustatyti ligoniams persodinto inksto atmetimo riziką,

išgyvenamumo galimybes bei terapijos įtaką.

Darbe buvo tiriami duomenys pasitelkiant Kaplan-Meierio išgyvenamumo

analizę, Kokso regresiją, logistinę regresiją ir t.t.

Iš viso buvo ištirti 604 tiriamieji, kuriems buvo persodintas inkstas ir nustatyta,

kad veiksniai įtakojantys inksto atmetimą yra ligonio amžius, svoris bei kreatino kiekis

tyrimo pradžioje. Kaplan-Meierio išgyvenamumo analizė parodė, kad išgyvenamumo

kreivės iki inksto atmetimo nepriklauso nuo gydymo. Kokso regresijos modelis atskleidė,

kad inksto atmetimas susijęs su kreatino kiekiu pradžioje, svoriu bei amžiumi. Be to,

tyrimas rodo, kad kreatino kiekis pabaigoje sumažėja, taikant tiek kontrolinę, tiek

gydomąją terapiją.

Reikšminiai žodžiai: p-reikšmė, Šapiro–Vilko W kriterijus, Hosmerio–Lemešou

kriterijus, Voldo kriterijus.

Page 52: Vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf · arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo. Paėmękreatino

52

SUMMERY

Kidney transplantation is the actual measure when treating kidney diseases.Approximately 10 percents of adults are suffering from kidney diseases. One adult personfrom ten suffers from chronic kidney diseases. Lifes of 1,5 millions persons are supportedby dialysis. They are waiting for kidney transplantation approximately seven years.

The goal of this work is to determine the risk of rejection of kidney transplantedto the patients, possibilities of survival and the influence of therapy.

The data were researched in the work, invoking Kaplan-Meyer survival analysis,Cox regression and the logistics regression, and so on.

In total 604 studies have been researched with the transplanted kidney and it hasbeen determined that the factors, influencing the kidney rejection are the age of thepatient, weight and quantity of creatine in the beginning of the research. Kaplan-Meyersurvival analysis has shown that the survival curves until kidney rejection do not dependupon the treatment. Cox regression model has revealed that the kidney rejection is relatedto the quantity of creatine in the beginning, weight and age. In addition, the researchshows that the quantity of creatine has decreased at the end, when either treatment orcontrol therapies were applied.

Keywords: P-meaning, Shapiro & Wilk W test, Hosmer & Lemeshow test, Voldtest.