vaistųefektyvumo statistin analiz - gs.elaba.ltgs.elaba.lt/object/elaba:1730124/1730124.pdf ·...
TRANSCRIPT
VILNIAUS PEDAGOGINIS UNIVERSITETASMATEMATIKOS IR INFORMATIKOS FAKULTETAS
ALGEBROS IR STATISTIKOS KATEDRA
Vaistų efektyvumo statistinė analizėStatistical analysis of the medicine effectiveness
Baigiamasis magistro darbas
Vaiva Žuraulytė
Mokslinis vadovasprof. habil. dr. K. Kubilius
VILNIUS2008
TURINYS
ĮVADAS.................................................................................................................................................... 3DARBO TIKSLAI IR UŽDAVINIAI....................................................................................................... 6DUOMENYS ............................................................................................................................................ 7IMČIŲ SKIRSTINIŲ NORMALUMO TYRIMAS ............................................................................... 11DVIEJŲ NEPRIKLAUSOMŲ IMČIŲ PALYGINIMAS....................................................................... 14
t-testas..................................................................................................................................................14Mano ir Vitnio U testas .......................................................................................................................19
DVIEJŲ PRIKLAUSOMŲ IMČIŲ PALYGINIMAS............................................................................ 22Vilkoksono testas.................................................................................................................................22Ženklų testas ........................................................................................................................................28
KAPLAN-MEIERIO IŠGYVENAMUMO ANALIZĖ .......................................................................... 30Cenzūravimas ......................................................................................................................................30Išgyvenamumo analizė. Kaplan-Meierio metodas ..............................................................................32Išgyvenimo kreivių lyginimas .............................................................................................................34Išgyvenamumo laiko pasiskirstymas ...................................................................................................35Išgyvenimo laiko vidurkiai..................................................................................................................38
RIZIKOS FAKTORIŲ ĮVERTINIMAS. KOKSO REGRESIJOS MODELIS ...................................... 39Proporcingųjų rizikų modelis ..............................................................................................................39
LOGISTINĖ REGRESIJA ...................................................................................................................... 41Logistinės regresijos modelis ..............................................................................................................41Prognozavimas ....................................................................................................................................47
IŠVADOS................................................................................................................................................ 49LITERATŪRA........................................................................................................................................ 50SANTRAUKA ........................................................................................................................................ 51SUMMERY............................................................................................................................................. 52
3
ĮVADAS
Inkstų persodinimas yra aktuali priemonė gydant inkstų ligas. Nuo inkstų ligų visame pasaulyje
kenčia apie 10 % suaugusių žmonių. Vienas suaugęs žmogus iš dešimties kenčia nuo chroniškų inkstų
ligų. Apie 1,5 mln. žmonių gyvybė palaikoma dializės būdu, vidutiniškai jie inkstų persodinimo laukia
apie septynerius metus. Deja ne visi jos sulaukia.
Lietuvoje inkstų pakaitinis gydymas taikomas visiems ligoniams, kuriems jo prireikia.
1 pav.
Lietuvoje kasmet atliekama 60-70 inkstų persodinimo operacijų, maždaug iki 50 per metus.
Jei inkstų sutrikimai negydomi, tai žmogaus laukia širdies ir kraujagyslių komplikacijos, kartais netgi
priešlaikinė mirtis.
Ligos priežastys
Inkstą reikia persodinti tada, kai savi inkstai nebesugeba atlikti savo funkcijų ir nepašalina iš
organizmo nereikalingų medžiagų. Esant ūmiam inkstų funkcijos nepakankamumui, inkstų veikla gali
visiškai atsistatyti, tačiau, esant lėtiniam nepakankamumui, inkstų veikla vis blogėja ir reikia gelbėti
žmogaus gyvybę atliekant dializes ar persodinant kito žmogaus inkstą.
Inkstų nepakankamumą gali sukelti pačių inkstų ligos (glomerulonefritas, pielonefritas, intersticinis
nefritas), širdies ligos, aterosklerozė, lėtinis šlapimo nutekėjimo sutrikimas, cukrinis diabetas,
sisteminės ligos (sisteminė raudonoji vilkligė, vaskulitai), kuriomis sergant pažeidžiami daugelis
organų, tarp jų ir inkstai. Įvairių vaistų vartojimas taip pat gali būti inkstų nepakankamumo priežastis.
4
Operacijos metu persodinamas vienas inkstas. Inkstą ligoniui gali dovanoti sveiki tam tikro amžiaus
artimi giminaičiai (tėvai, broliai, seserys, vyras žmonai ar žmona vyrui), jei jų inkstas tinka ligoniui.
Taip pat persodinimui gali būti panaudoti inkstai žmonių po jų smegenų mirties, pačiam žmogui
apsisprendus iki nelaimingo įvykio po mirties padovanoti tinkamus transplantacijai organus, ar sutikus
mirusiojo artimiesiems duoti inkstą. Gyvo donoro inkstas paprastai geriau ir ilgiau funkcionuoja.
Ligos eiga
Jei donoras atitinka tam tikrus reikalavimus (sutampa kraujo grupė, teigiami imuninės sistemos
rodikliai, neserga ligomis, kurios galėtų paūmėti persodinus inkstą), atliekama inksto persodinimo
operacija.
Pirmaisiais metais po inkstų transplantacijos ligoniams labai dažnai reikia lankytis pas gydytojus,
nes, net ir taikant įprastinį gydymą, gali atsirasti inksto atmetimo krizės, pasireikšti vaistų toksinis
poveikis, kartotis pavojingos ligonio gyvybei infekcijos.
Vėliau paprastai vizitai pas gydytoja retėja, nes imuninė sistema ne taip audringai reaguoja į
svetimą organą, taip pat reikia mažesnių vaistų dozių.
Tačiau, net gydant moderniausiais vaistais, gali sutrikti donoro inksto veikla, tekti vėl pradėti
dializes, galimas ir pakartotinas inkstų persodinimas. Tačiau gydytojams ir ligoniams tokiais atvejais
iškyla dar didesnių problemų.
Komplikacijos
Net gydant imuninę sistemą slopinančiais vaistais gali išsivystyti ūmi persodinto inksto atmetimo
krizė. Tada blogėja inksto funkcija, jis padidėja, ligonis gali karščiuoti. Esant tokiai situacijai, būtinas
neatidėliotinas gydymas, kad būtų išsaugotas persodintas inkstas.
Kartojantis atmetimo krizėms bei infekcijoms, prasideda lėtai progresuojantis lėtinis persodinto
inksto nepakankamumas, tada ligoniui vėl reikia pradėti dializes ar pakartotinai persodinti inkstą iš kito
donoro.
Ligoniams po inksto persodinimo infekcijas sukelia net tokie sukėlėjai, kurie sveikiems žmonėms
yra nepavojingi. Tai citomegalo virusas, pneumocystis carinii, herpes virusai. Taip pat ir įprastinės
infekcijos vargina tokius ligonius dažniau nei sveikus žmones, nes jų imuninė sistema yra nuslopinta
vaistais.
Šiems ligoniams dažnesnės ir navikinės ligos, ypač odos, kraujo sistemos. Yra nemažai gydymo
komplikacijų. Tai diabetas, osteoporozė, navikinės ligos.
5
Tyrimai
Po inkstų transplantacijos atliekami įvairūs kraujo tyrimai, nustatomas kraujo ląstelių skaičius,
kreatino, šlapalo koncentracija. Šie tyrimai rodo, ar gerai funkcionuoja persodintas inkstas, tiriama
vaistų koncentracija kraujyje, kad būtų galima parinkti tinkamą vaisto dozę.
Gydymas
Ligoniai gydomi imuninę sistemą slopinančiais vaistais. Paprastai tai būna vaistų deriniai. Kaskart
išrandami vis modernesni vaistai, kurie pagerina persodinto organo išgyvenamumą. Vaistus būtina gerti
reguliariai, tomis pačiomis valandomis. Ar tinkama vaisto dozė, nustatoma tiriant vaisto koncentraciją
kraujyje.
Po transplantacijos dažniausiai skiriami tokie vaistai: steroidai (prednisolonas), kalcineurino
inhibitoriai (ciklosporinas A, tacrolimas), nekalcineurino inhibitoriai(rapamycin), azatioprinas,
mikofenolato mofetilis.
Statistikos taikymas medicinoje – tai įvairių gydymo metodų lyginimas, susirgimų diagnostika ir
statistinė analizė. Statistinių metodų pagalba išanalizavus duomenis galima vertinti rezultatų
reikšmingumą, aptinkami paslėpti dėsningumai bei ryšiai. Medicinoje statistika taikoma jau nuo VIII
amžiaus.
6
DARBO TIKSLAI IR UŽDAVINIAI
1. Įvertinti įvairių rizikos veiksnių įtaka inksto atmetimui.
2. Ištirti išgyvenimo kreivių priklausomybę nuo gydymo.
3. Palyginti dviejų terapijų gydymo rezultatus.
4. Ištirti kokie faktoriai turi įtakos išgyvenamumui iki inksto atmetimo.
7
DUOMENYS
Duomenų bazėje buvo pateikti duomenys apie ligonius, kuriems buvo persodintas
inkstas. Tiriamieji buvo suskirstyti į dvi grupes po 302. Kiekvienai tų grupių skirta
atskira gydymo terapija: gydomoji arba kontrolinė.
Visa duomenų bazė sudaryta remiantis 604 pacientų duomenimis. Kiekvienam
pacientui užpildytas specialus protokolas, kuriame nurodyta:
Amžius (metais)
Lytis
Svoris (kg.)
Ūgis (cm.)
Donoro amžius (metais)
Bendro tyrimo trukmė (dienomis)
Parinktas gydymas (terapija)
Kreatino švarumas tyrimo pradžioje
Kreatino švarumas tyrimo pabaigoje
Ar sergama cukralige (1 — taip, 2 — ne)
Ar sergama hiperlipidemija (1 — taip, 2 — ne)
Ar sergama hipertenzija (1 — taip, 2 — ne)
8
2 pav.
9
Rizikos faktorių įtakai komplikacijoms ir atmetimui įvertinti bei jų tarpusavio
ryšiams nustatyti pasirenkama dalis šių duomenų:
demografiniai duomenys,
duomenys nusakantys priešoperacinės rizikos faktorius,
duomenys nusakantys pooperacinį laikotarpį.
Kintamasis Kintamojo tipas Aprašymas
Lytis kategorinis dvireikšmis
Amžius kiekybinis
Ūgis kiekybinis
Svoris kiekybinis
Donoro amžius kiekybinis
Cukraligė kategorinis dvireikšmis
Medžiagų apykaitos sutrikimas,
kuriam būdingas gausus šlapimo
išskyrimas
Hiperlipidemija kategorinis dvireikšmis
Į riebalus panašių medžiagų
pagausėjimas kraujyje;
dažniausiai paveldima liga.
Pri
ešop
erac
inia
id
uom
eny
s
Hipertenzija kategorinis dvireikšmisArterinio kraujospūdžio
padidėjimas
Donoro atmetimas kategorinis dvireikšmis
Gydymas kategorinis dvireikšmis
Laikas kiekybinis
Kreatinas pradžioje kiekybinis
Po
oper
acin
iai
duo
men
ys
Kreatinas pabaigoje kiekybinis
Inkstų funkcijai sutrikus
mažėja kreatino ekskrecijos ir
jo kiekis serume didėja, todėl
šis rodiklis naudojamas
vertinti inkstų funkcijai.
1 lentelė. Duomenys.
10
Priešoperaciniai duomenys svarbūs vertinant pooperacinio laikotarpio rizikos
faktorius.
Pooperacinis laikotarpis apibrėžiamas kaip parų skaičius nuo transplantacijos
dienos iki tyrimų nutraukimo arba iki persodinto inksto atmetimo ar ligonio mirties
dienos.
Tiriant inkstų funkcijos sutrikimus ir pagerėjimus labai svarbus yra kreatino
kiekis. Kreatino kiekis organizme yra pastovus dydis ir jei jis padidėja, tai parodo, kad
sutriko inkstų veikla, o kai kreatino kiekis organizme sumažėja ir nebekinta, vadinasi
inkstai atlieka savo funkciją gerai.
Tyrime grupių normalumui tikrinti buvo naudojamas Šapiro–Vilko testas, dviem
priklausomom imtim Vilkoksono bei ženklų testai, kiekybinio kintamojo priklausomybės
nuo nepriklausomų kintamųjų paieškai taikomas logistinės regresijos modelis. Tyrimai
buvo atliekami vienodame reikšmingumo lygmenyje α = 0,05.
Statistikoje daugelis tyrimų yra atliekami statistinių duomenų apdorojimo paketų
pagalba. Logistinės regresijos modelis, ženklų bei Vilkoksono testai, Kaplan-Meierio
įverčiai, Kokso regresija buvo apdorojami su SPSS paketu.
11
IMČIŲ SKIRSTINIŲ NORMALUMO TYRIMAS
Svarbus kiekvieno statistinio tyrimo etapas yra imties kintamųjų skirstinio tipo
nustatymas.
Normalusis skirstinys (angl. normal distribution) – vienas plačiausiai naudojamų
matematinėje statistikoje skirstinių. Jau XVIII a. vokiečių matematikas Karlas Gausas
nustatė, kad matavimo paklaidos turi normalųjį skirstinį. Todėl, kartais normalusis
skirstinys dar vadinamas Gauso skirstiniu.
Sakome, kad atsitiktinis dydis X turi normalųjį skirstinį, jei jo tankio funkcija
užrašoma tokia formule:
.,
,0,,,2
12
2
1
nuokrypisskvadratinividutinisvidurkiskur
xexf
x
Tankio funkcija įgyja maksimumą 2
1taške μ ir turi vingio taškus nutolusius
nuo vidurkio per σ. Tankio funkcija yra simetrinė. Sakysime, kad atsitiktinis dydis X turi
standartinį normalųjį skirstinį, jei jo tankis
.,2
12
2
xexfx
Jis žymimas: X~N(0, 1).
Standartinio normaliojo skirstinio skaitinės charakteristikos yra tokios:
EX = 0, DX = 1.
Standartinis normalusis skirstinys yra atskiras bendrojo normaliojo skirstinio
atvejis.
Daugelis statistinių išvadų remiasi prielaida, kad stebimas atsitiktinis dydis turi
normalųjį skirstinį. Žinoma, sakydami, kad atsitiktinis dydis turi normalųjį skirstinį, mes
tik pritaikome matematinį modelį, ignoruodami tai, kad stebimas dydis paprastai neįgyja
be galo didelių arba be galo mažų reikšmių. Normalusis skirstinys gerai aprašo žmogaus
ūgį, svorį, vidutinę oro temperatūrą, matavimo paklaidas, molekulės judėjimo dujose
greitį, vidutinį pelną, intelekto koeficientą ir kt.
12
Tikrinsim, ar imčių skirstiniai yra pasiskirstę pagal normalųjį dėsnį, kadangi nuo
to priklauso, kokie kriterijai bus naudojami. Jei abu skirstiniai yra normalieji, galima
taikyti parametrinius kriterijus. Jei bent vienas skirstinys nėra normalusis, tada naudosiu
neparametrinius kriterijus. Normalumui tikrinti naudosime Kolmogorovo-Smirnovo ir
Šapyro-Vilko kriterijus.
Tests of Normality
,042 220 ,200* ,990 220 ,117
,031 384 ,200* ,993 384 ,096
,166 220 ,000 ,692 220 ,000
,172 384 ,000 ,513 384 ,000
VarMFEMALE
MALE
FEMALE
MALE
KreatinasP
KreatinasG
Statistic df Sig. Statistic df Sig.
Kolmogorov-Smirnova
Shapiro-Wilk
This is a lower bound of the true significance.*.
Lilliefors Significance Correctiona.
2 lentelė. Normalumo testas.
2 lentelėje pateikti normalaus skirstinio testo rezultatai. Remsimės Šapyro-Vilko
testo rezultatais. Stebimas reikšmingumo lygmuo Sig., t.y.: p-reikšmė, kai kreatino kiekis
tyrimo pradžioje vyrams bei moterims, viršija 0,05. Taigi šie duomenys turi normalųjį
skirstinį. Visi kiti duomenys normaliojo skirstinio neturi.
Skirstinio normalumo grafikas taip pat padeda nustatyti, ar skirtiniai pasiskirstę
pagal normalųjį dėsnį.
3 pav. Moterų kiekio tyrimo pradžioje normalumo (Q-Q) grafikas.
13
4 pav. Vyrų kreatino kiekio tyrimo pradžioje normalumo (Q-Q) grafikas.
3 paveiksle pateiktas moterų, o 4 paveiksle — vyrų, kuriems buvo kreatinas
tyrimo pradžioje normalumo grafikai, kuriame stebėjimų duomenų reikšmės pakankamai
arti tiesės, taigi skirstinys esmiškai nesiskiria nuo normaliojo.
Paėmę kreatino kiekį tyrimo pabaigoje iš 2 lentelės matome, kad reikšmingumo
lygmuo Sig., t.y.: p-reikšmė, kai kreatino kiekis leidžiamas tyrimo pabaigoje vyrams bei
moterims, neviršija 0,05. Taigi šie duomenys normaliojo skirstinio neturi. Tai matosi ir
skirstinio normalumo grafikuose 5 paveiksle.
5 pav. Moterų ir vyrų kreatino kiekio tyrimo pabaigoje normalumo (Q-Q) grafikai.
14
DVIEJŲ NEPRIKLAUSOMŲ IMČIŲ PALYGINIMAS
t-testas
Duomenys.
Dvi intervalinių duomenų imtys (x1, x2, ..., xn) ir (y1, y2, ..., ym) gautos matuojant
du nepriklausomus normaliuosius atsitiktinius dydžius X ~ Ɲ( 2, XX ) ir Y ~
Ɲ( 2, YY ). Vidurkiai YX , ir dispersijos 22 , YX nežinomi.
Statistinė hipotezė:
.:
,:
1 YX
YXo
H
H
Kriterijaus statistika.
,// 22 msns
yxt
yx
čia
yx, yra imčių vidurkiai, —, 22yx ss imčių dispersija, o n, m — imčių didumai.
Sprendimo priėmimo taisyklė.
Tegul reikšmingumo lygmuo α. Hipotezė Ho atmetama, jeigu ktt 2/ . Čia
kt 2/ yra Stjudento skirstinio su k laisvės laipsniu α/2 lygmens kritinė reikšmė. Laisvės
laipsnių k yra mažiausias sveikasis skaičius, tenkinantis sąlygą:
.
//
//3434
222
msns
msnsk
yx
yx
15
Hipotezė Ho atmetama, jeigu ktt 2/ . Vienpusėms alternatyvoms naudojama
ta pati statistika ir tas pats laisvės laipsnių skaičius k. Vienpusei alternatyvai H1:
YX parenkama kritinė sritis W = (-∞, kt ), t.y. Ho atmetama, kai t < - kt .
Vienpusei alternatyvai H1: YX parenkama kritinė sritis W = ( kt ,∞), t.y. Ho
atmetama, kai t > kt .
Patikrinsime, ar imčių dispersijos lygios. Tam tarsime, kad:
1) jei YXH :1 , tai:
Ho atmetama, kai p < α,
Ho neatmetama, kai p ≥ α;
2) jei H1: YX ir ,
yx tai:
Ho atmetama, kai p < 2α,
Ho neatmetama, jeigu
yx ir p ≥ 2α arba
;yx
3) jei H1: YX ir ,
yx tai:
Ho atmetama, kai p < 2α,
Ho neatmetama, jeigu
yx ir p ≥ 2α arba .
yx
Priklausomai nuo to, ar dispersijas laikome statistiškai nereikšmingai (p-reikšmė
> α), ar statistiškai reikšmingai (p-reikšmė < α) besiskiriančioms, hipotezei apie vidurkių
lygybę tikrinti parenkama atitinkamai viršutinė arba apatinė stulpelio Sig. (2-tailed) p-
reikšmė.
Išnagrinėsime vyrų bei moterų kreatino vidutinį kiekį tyrimo pradžioje, taip pat
vyrų bei moterų kreatino vidutinį kiekį tyrimo pradžioje pagal terapijas, taikant Stjudento
testą, kadangi šie duomenys pagal Šapyro-Vilko normalumo tyrimą yra pasiskirstę pagal
normalųjį dėsnį.
16
Group Statistics
220 58,02492 23,928151 1,613236
384 61,86007 24,842452 1,267736
VarMFEMALE
MALE
KreatinasPN Mean Std. Deviation
Std. ErrorMean
3 lentelė. Grupių statistika.
Grupių statistikos 3 lentelėje pateikiamos kiekvienos kreatino kiekio tyrimopradžioje vyrų bei moterų grupių charakteristika: stebėjimų skaičius N (vyrų 384,moterų), vidurkis Mean (moterų ≈ 58; vyrų ≈ 61,86), standartinis nuokrypis Std.Deviation (vyrų ≈ 24,8; moterų ≈ 23,9) bei standartinė paklaida Std. Error Mean (vyrų ≈1,27; moterų ≈ 1,6).
Independent Samples Test
,215 ,643 -1,850 602 ,065 -3,835149 2,072774 -7,905895 ,235598
-1,869 470,418 ,062 -3,835149 2,051751 -7,866880 ,196583
Equal variancesassumed
Equal variancesnot assumed
KreatinasPF Sig.
Levene's Test forEquality of Variances
t df Sig. (2-tailed)Mean
DifferenceStd. ErrorDifference Lower Upper
95% ConfidenceInterval of the
Difference
t-test for Equality of Means
4 lentelė. Nepriklausomų imčių t kriterijus.
4 lentelės grafoje Levene‘s Test for Equality of Variances pateikta statistikos F
reikšmė (0,215) ir p-reikšmė (0,643), o lentelės grafoje t-test Equality of Means, skirtoje
išvadoms apie pačių vidurkių lygybę, pateiktos:
statistikos t reikšmes stulpelyje t,
laisvės laipsnių skaičius stulpelyje df ,
p-reikšmės stulpelyje Sig. (2-tailed),
vidurkių skirtumų įverčiai likusiuose stulpeliuose: Menn Differences, Std. Error
Differences ir 95% Confidence Interval of the Difference (Lower bei Upper).
Eilutėje Equal variances assumed p-reikšmė yra didesnė už reikšmingumo lygmenį
α: 0,643 > 0,05, taigi t kriterijaus p-reikšmė yra 0,065 (stulpelyje Sig. (2-tailed)), o
dispersijos galima sakyti yra nesiskiriančios.
17
Kriterijau t p-reikšmė yra didesne už 0,05 (0,065 > 0,05), taigi moterų kreatino
kiekis tyrimo pradžioje statistiškai reikšmingai nesiskiria nuo vyrų kreatino kiekio tyrimo
pradžioje.
Patikrinsime kreatino kiekį tyrimo pradžioje atskirai moterims ir vyrams pagal
terapijos tipą.
Pirmiausia išnagrinėsime moterų kreatino kiekį tyrimo pradžioje pagal terapijas.
Group Statistics
108 56,88923 23,828552 2,292903
112 59,12005 24,079756 2,275323
TerapijaACTIVE CONTROL
ACTIVE TREATMENT
KreatinasPN Mean Std. Deviation
Std. ErrorMean
5 lentelė. Grupių statistika.
5 grupių statistikos lentelėje pateikiamos kiekvienos kreatino kiekio tyrimo
pradžioje moterų terapijos grupių charakteristikos: stebėjimų skaičius N (kontrolinės
terapijos atveju 108, o gydomosios terapijos 112), vidurkis Mean (kontrolinės terapijos
atveju 56,88923, o gydomosios terapijos atveju ≈ 59), standartinis nuokrypis Std.
Deviation (kontrolinės terapijos atveju ≈ 23,83, o gydomosios terapijos ≈ 24,08) bei
standartinė paklaida Std. Error Mean (kontrolinės terapijos atveju 2,29, o gydomosios
terapijos atveju yra ≈ 2,28).
Independent Samples Test
,503 ,479 -,690 218 ,491 -2,230821 3,230867 -8,598554 4,136912
-,691 217,852 ,491 -2,230821 3,230248 -8,597359 4,135717
Equal variancesassumed
Equal variancesnot assumed
KreatinasPF Sig.
Levene's Test forEquality of Variances
t df Sig. (2-tailed)Mean
DifferenceStd. ErrorDifference Lower Upper
95% ConfidenceInterval of the
Difference
t-test for Equality of Means
6 lentelė. Nepriklausomų imčių t kriterijus.
6 lentelės grafoje Levene‘s Test for Equality of Variances pateikta statistikos F
reikšmė (0,503) ir p-reikšmė (0,479). Kadangi p-reikšmė yra didesnė už reikšmingumo
lygmenį α = 0,05 (0,497 > 0,05), taigi dispersijos statistiškai reikšmingai nesiskiria ir
18
pasinaudosime t-test Equality of Means grafa, kuri skirta išvadoms apie pačių vidurkių
lygybę.
Šios grafos eilutėje Equal variances assumed p-reikšmė yra viršutinis stulpelio
Sig. (2-tailed) skaičius, kuris yra didesnis už reikšmingumo lygmenį α: 0,491 > 0,05.
Vadinasi moterų kreatino kiekis tyrimo pradžioje taikant kontrolinę terapiją
statistiškai reikšmingai nesiskiria nuo moterų kreatino kiekio tyrimo pradžioje taikant
gydomąją terapiją.
Išnagrinėsime vyrų kreatino kiekį tyrimo pradžioje pagal terapijas.
Group Statistics
192 63,17647 23,870910 1,722735
192 60,54367 25,772499 1,859970
Terapija1
2
KreatinasPN Mean Std. Deviation
Std. ErrorMean
7 lentelė. Grupių statistika.
7 grupių statistikos lentelėje pateikiamos kiekvienos kreatino kiekio tyrimo
pradžioje vyrų terapijos grupių charakteristikos: stebėjimų skaičius N (kontrolinės
terapijos atveju 192, o gydomosios terapijos 192), vidurkis Mean (kontrolinės terapijos
atveju ≈ 63,18, o gydomosios terapijos atveju ≈ 60,54), standartinis nuokrypis Std.
Deviation (kontrolinės terapijos atveju ≈ 23,87, o gydomosios terapijos ≈ 25,77) bei
standartinė paklaida Std. Error Mean (kontrolinės terapijos atveju ≈ 1,723, o gydomosios
terapijos atveju yra ≈ 1,86).
Independent Samples Test
2,566 ,110 1,038 382 ,300 2,632799 2,535212 -2,351920 7,617517
1,038 379,778 ,300 2,632799 2,535212 -2,352012 7,617610
Equal variancesassumed
Equal variancesnot assumed
KreatinasPF Sig.
Levene's Test forEquality of Variances
t df Sig. (2-tailed)Mean
DifferenceStd. ErrorDifference Lower Upper
95% ConfidenceInterval of the
Difference
t-test for Equality of Means
8 lentelė. Nepriklausomų imčių t kriterijus.
19
8 lentelės grafoje Levene‘s Test for Equality of Variances pateikta statistikos F
reikšmė (2,566) ir p-reikšmė (0,110). Kadangi p-reikšmė yra didesnė už reikšmingumo
lygmenį α = 0,05 (0,110 > 0,05), taigi dispersijos statistiškai reikšmingai nesiskiria ir
pasinaudosime t-test Equality of Means grafa, kuri skirta išvadoms apie pačių vidurkių
lygybę.
Šios grafos eilutėje Equal variances assumed p-reikšmė yra viršutinis stulpelio
Sig. (2-tailed) skaičius, kuris yra didesnis už reikšmingumo lygmenį α: 0,3 > 0,05.
Vadinasi, vyrų kreatino kiekis tyrimo pradžioje taikant kontrolinę terapiją
statistiškai reikšmingai nesiskiria nuo vyrų kreatino kiekio tyrimo pradžioje taikant
gydomąją terapiją.
Mano ir Vitnio U testas
Mano ir Vitnio U testo esmė yra ta, kad jungtiniai abiejų imčių duomenys, gauti
testuojant tuo pačiu testu, išdėstomi pagal rangus. Tada kiekvienos imties rangai, gauti
ranguojant jungtinius duomenis, sumuojami atskirai.
Duomenys:Tarkime dviejų nepriklausomų tolydžių kintamųjų X ir Y stebėjimai yra x1, x2, ...,
xn1 ir y1, y2, ..., yn2.
Statistinė hipotezė:
kintamųjų skirstiniai yra vienodi,
kintamųjų skirstiniai nėra vienodi.
Kriterijau statistika:
.
12
1,
2; 2121211
nnnnnn
čiaU
Z
Sprendimo priėmimo taisyklė.
Tarkime reikšmingumo lygmuo yra α. Jei |Z| > 2/z , tai hipotezę Ho atmetama
(skirstiniai skiriasi); čia 2/z — standartinio normaliojo skirstinio α/2 lygmens kritinė
reikšmė. Priešingu atveju Ho neatmetama.
:
:
1
0
H
H
20
Išnagrinėsime vyrų bei moterų kreatino kiekį tyrimo pabaigoje, taikydami Mano
ir Vitnio U testą.
Ranks
220 254,07 55895,00
384 330,25 126815,00
604
VarMFEMALE
MALE
Total
KreatinasGN Mean Rank Sum of Ranks
9 lentelė. Rangų lentelė.
9 lentelėje pateikiama kiekvienos grupės rangų suma (Sum of Ranks): vyrų rango
suma yra 126815, o moterų — 55895. Lentelės N stulpelyje nurodomas duomenų kiekis:
vyrų — 384, o moterų —220.
Vidutinis rangas nurodytas stulpelyje Mean Rank. Vyrų vidutinis rangas yra:
126815/384 = 330,25, o moterų vidutinis rangas yra: 55895/220 = 254,07. Iš jų matome,
kad didesnių kreatino kiekio tyrimo pabaigoje reikšmių buvo daugiau pas vyrus.
Test Statisticsa
31585,000
55895,000
-5,163
,000
Mann-Whitney U
Wilcoxon W
Z
Asymp. Sig. (2-tailed)
KreatinasG
Grouping Variable: VarMa.
10 lentelė. Mano-Vitnio lentelė.
10 lentelėje pateikta parametro U = min (U1, U2) = 31585 reikšmė, taip pat
mažesnioji rangų sumos reikšmė Vilkoksono W = min (R1, R2) = 55895, Z reikšmė yra
-5,163 bei parametro p-reikšmė lygi 0.
Tegu p-reikšmė yra p, o reikšmingumo lygmuo α, tuomet, kai p < α, skirstiniai
skiriasi, o kai p ≥ α, tai nesiskiria. Šiuo atveju: p = 0 yra mažesnis už α = 0,05, taigi
21
nulinė hipotezė yra atmetama, tad vyrų kreatino kiekis tyrimo pabaigoje statistiškai
skiriasi nuo moterų kreatino kiekio tyrimo pabaigoje.
22
DVIEJŲ PRIKLAUSOMŲ IMČIŲ PALYGINIMAS
Vilkoksono testas
Vilkoksono testas taikomas tolydiems duomenims. Jo esmė ta, kad yra randamas
skirtumas tarp abiejų testavimo reikšmių (iš pirmojo testavimo reikšmių atimamos tam
tikros antrojo testavimo reikšmės) ir absoliučiosios gautų skirtumų reikšmės yra
išdėstomos pagal rangus, paliekant rangams turėtus skirtumų ženklus. Kriterijaus
statistika Z gaunama įvertinant rangų su minuso ir pliuso ženklais sumos bei nulinių
skirtumų skaičių. Remiantis šia statistika priimamas sprendimas dėl statistinės hipotezės:
:
:
1
0
H
H
Stebima tolydžiųjų kintamųjų pora (X, Y). Duomenys nn yxyx ,,,, 11 gauti
matavimams naudojant rangų skalę.
Kriterijaus statistika:
,,
24
121,
4
1
TZ
nnnnn
—Tkur teigiamasis rangas, atitinkantis teigiamą niyxdreikšmęd iiii ,,1,, .
Tegu reikšmingumo lygmuo yra α, o p-reikšmė lygi p. Tuomet daroma išvada,
kad:
skirstiniai skiriasi, jei p < α;
skirstiniai nesiskiria, jeigu p ≥ α.
Išnagrinėsime kreatino kiekį tyrimo pradžioje bei pabaigoje abiems terapijoms bei
kiekvienai terapijai atskirai tiek vyrams, tiek moterims, naudodami Vilkoksono testą. Šis
testas taikomas todėl, kad kreatino kiekis pradžioje yra pasiskirstęs pagal normalųjį dėsnį,
o pabaigoje nėra pasiskirstę pagal normalųjį dėsnį.
kintamųjų skirstiniai yra vienodi,kintamųjų skirstiniai nėra vienodi.
23
Ranks
581a 312,93 181815,00
23b 38,91 895,00
0c
604
Negative Ranks
Positive Ranks
Ties
Total
KreatinasG - KreatinasPN Mean Rank Sum of Ranks
KreatinasG < KreatinasPa.
KreatinasG > KreatinasPb.
KreatinasG = KreatinasPc.
11 lentelė. Vilkoksono testas
Palyginome kreatino kiekį tyrimo pradžioje bei pabaigoje abiems terapijoms.
Vienuoliktos lentelės Negative Ranks eilutėje pažymėta, kiek buvo atveju, kai kreatino
kiekis pradžioje viršijo kreatino kiekį tyrimo pabaigoje: N = 581. Šiuos atvejus
atitinkančių rangų suma yra 181815, o vidutinis rangas: 312,93.
Vienuoliktos lentelės Positive Ranks eilutėje pažymėta, kiek buvo atveju, kai
kreatino kiekis pabaigoje viršijo kreatino kiekį tyrimo pradžioje: N = 23. Šiuos atvejus
atitinkančių rangų suma yra 895, o vidutinis rangas: 38,91.
Matome, kad atvejų, kai kreatino kiekis tyrimo pradžioje viršijo kreatino kiekį
tyrimo pabaigoje yra daugiau nei atvejų, kai kreatino kiekis pabaigoje viršijo kreatino
kiekį tyrimo pradžioje.
Test Statisticsb
-21,084a
,000
Z
Asymp. Sig. (2-tailed)
KreatinasG -KreatinasP
Based on positive ranks.a.
Wilcoxon Signed Ranks Testb.
12 lentelė. Vilkoksono testas
12 lentelėje pateikta statistikos Z reikšmė lygi -21,084 bei p-reikšmė lygi 0,000.
Kadangi 0 < 0,05, tai nulinė hipotezė H0 atmetama. Kreatino kiekis tyrimo pradžioje
statistiškai skiriasi nuo kreatino kiekio tyrimo gale.
24
Ranks
109a 57,92 6313,00
3b 5,00 15,00
0c
112
Negative Ranks
Positive Ranks
Ties
Total
KreatinasG - KreatinasPN Mean Rank Sum of Ranks
KreatinasG < KreatinasPa.
KreatinasG > KreatinasPb.
KreatinasG = KreatinasPc.
13 lentelė. Vilkoksono rangų testas.
Palyginome moterų kreatino kiekį tyrimo pradžioje bei pabaigoje, kai buvo
taikoma gydomoji terapija. 13 lentelės Negative Ranks eilutėje pažymėta, kiek buvo
atveju, kai moterų kreatino kiekis pradžioje viršijo moterų kreatino kiekį tyrimo
pabaigoje, kai buvo taikoma gydomoji terapija: N = 109. Šiuos atvejus atitinkančių rangų
suma yra 6313, o vidutinis rangas: 57,92.
Tryliktos lentelės Positive Ranks eilutėje pažymėta, kiek buvo atveju, kai moterų
kreatino kiekis pabaigoje viršijo kreatino kiekį tyrimo pradžioje: N = 3. Šiuos atvejus
atitinkančių rangų suma yra 15, o vidutinis rangas: 5.
Matome, kad atvejų, kai moterų kreatino kiekis tyrimo pradžioje viršijo kreatino
kiekį tyrimo pabaigoje, taikant gydomąją terapiją yra daugiau nei atvejų, kai moterų
kreatino kiekis pabaigoje viršijo kreatino kiekį tyrimo pradžioje, taikant tą pačią terapiją.
Test Statisticsb
-9,142a
,000
Z
Asymp. Sig. (2-tailed)
KreatinasG -KreatinasP
Based on positive ranks.a.
Wilcoxon Signed Ranks Testb.
14 lentelė. Vilkoksono testo statistika.
25
14 lentelėje pateikta statistikos Z reikšmė lygi -9,142 bei p-reikšmė lygi 0,000.
Kadangi 0 < 0,05, tai nulinė hipotezė H0 atmetama. Moterų kreatino kiekis tyrimo
pradžioje statistiškai skiriasi nuo kreatino kiekio tyrimo gale, taikant gydomąją terapiją.
Tokie pat rezultatai gaunami ir moterų kreatino kiekiui tyrimo pradžioje bei
pabaigoje, kai buvo taikoma kontrolinė terapija. Tai aiškiai matome 15 ir 16 lentelėse.
Ranks
109a 57,92 6313,00
3b 5,00 15,00
0c
112
Negative Ranks
Positive Ranks
Ties
Total
KreatinasG - KreatinasPN Mean Rank Sum of Ranks
KreatinasG < KreatinasPa.
KreatinasG > KreatinasPb.
KreatinasG = KreatinasPc.
15 lentelė. Vilkoksono rangų testas.
Test Statisticsb
-9,142a
,000
Z
Asymp. Sig. (2-tailed)
KreatinasG -KreatinasP
Based on positive ranks.a.
Wilcoxon Signed Ranks Testb.
16 lentelė. Vilkoksono testo statistika.
Taigi moterų kreatino kiekis tyrimo pradžioje statistiškai skiriasi nuo kreatino
kiekio tyrimo gale, taikant ir kontrolinę terapiją.
Palyginsime vyrų kreatino kiekį tyrimo pradžioje bei pabaigoje, kai buvo taikoma
gydomoji terapija.
26
Ranks
181a 101,31 18338,00
11b 17,27 190,00
0c
192
Negative Ranks
Positive Ranks
Ties
Total
KreatinasG - KreatinasPN Mean Rank Sum of Ranks
KreatinasG < KreatinasPa.
KreatinasG > KreatinasPb.
KreatinasG = KreatinasPc.
17 lentelė. Vilkoksono rangų testas.
17 lentelės Negative Ranks eilutėje nurodyti atvejai, kai vyrų kreatino kiekis
pradžioje viršijo vyrų kreatino kiekį tyrimo pabaigoje, kai buvo taikoma gydomoji
terapija: N = 181. Šiuos atvejus atitinkančių rangų suma yra 18338, o vidutinis rangas:
101,31.
Šios lentelės Positive Ranks eilutėje taip pat nurodyti atvejai, kai vyrų kreatino
kiekis pabaigoje viršijo kreatino kiekį tyrimo pradžioje: N = 11. Šiuos atvejus
atitinkančių rangų suma yra 190, o vidutinis rangas: 17,27.
Taigi atvejų, kai vyrų kreatino kiekis tyrimo pradžioje viršijo kreatino kiekį
tyrimo pabaigoje, taikant gydomąją terapiją yra daugiau nei atvejų, kai vyrų kreatino
kiekis pabaigoje viršijo kreatino kiekį tyrimo pradžioje, taikant tą pačią terapiją.
Test Statisticsb
-11,769a
,000
Z
Asymp. Sig. (2-tailed)
KreatinasG -KreatinasP
Based on positive ranks.a.
Wilcoxon Signed Ranks Testb.
18 lentelė. Vilkoksono testo statistika.
27
18 lentelėje pateikta statistikos Z reikšmė lygi -11,769 bei p-reikšmė lygi 0,000.
Kadangi 0 < 0,05, tai nulinė hipotezė H0 atmetama. Vyrų kreatino kiekis tyrimo pradžioje
statistiškai skiriasi nuo kreatino kiekio tyrimo gale, taikant gydomąją terapiją.
Tokie pat rezultatai gaunami ir vyrų kreatino kiekiui tyrimo pradžioje bei
pabaigoje, kai buvo taikoma kontrolinė terapija. Tai matome 19 ir 20 lentelėse.
Ranks
187a 98,81 18478,00
5b 10,00 50,00
0c
192
Negative Ranks
Positive Ranks
Ties
Total
KreatinasG - KreatinasPN Mean Rank Sum of Ranks
KreatinasG < KreatinasPa.
KreatinasG > KreatinasPb.
KreatinasG = KreatinasPc.
19 lentelė. Vilkoksono rangų testas.
Test Statisticsb
-11,951a
,000
Z
Asymp. Sig. (2-tailed)
KreatinasG -KreatinasP
Based on positive ranks.a.
Wilcoxon Signed Ranks Testb.
20 lentelė. Vilkoksono testo statistika.
Taigi vyrų kreatino kiekis tyrimo pradžioje statistiškai skiriasi nuo kreatino kiekio
tyrimo gale, taikant kontrolinę terapiją.
Matome, kad visais atvejai skirstiniai skiriasi, tai atitinkama terapija, t.y.
gydomoji arba kontrolinė, turėjo įtakos kreatino kiekiui gydymo metu.
28
Ženklų testas
Turime n dydžio kintamųjų pavyzdį nxxx ,...,, 21 . Nulinė hipotezė yra, kad
populiacijos mediana yra lygi tam tikrai reikšmei M. Kintamuosius, kurie yra didesni už
M vadinsime r , o reikšmes, kurios mažesnės už M vadinsimer (kai ženklų testas yra
naudojamas kintamųjų porai M reikšmė yra nulis). Reikšmės x kurios yra lygios M tiesiog
ignoruojamos. Suma rr gali būti mažiau už n, tai mes laikysime kaip n‘. Jei bendras
abiejų duomenų porų skaičius yra didesnis nei 20, tai sakysime, kad duomenų daug.
Vietoj binominio skirstinio dideliam duomenų kiekiui ženklų testui, mes naudosime
normaliojo tikėtinumo skirstinį. Abi np ir n(1-p) reikšmės turi būti didesnės už 5, kad
galėtume vykdyti testą.
Normaliojo skirstinio vidurkis:
n5,0 ;
Standartinis nuokrypis:
n5,0 ;
Testo statistika z:
)5,0(Xz ;
Jei pliusų ar minusų skaičius yra didesnis nei2
n, mes naudosime sekančią testo
statistikos skaičiavimo formą:
n
nXXz
5,0
5,0)5,0()5,0(
;
Jei pliusų ar minusų skaičius yra mažesnis už2
n, statistika yra:
n
nXXz
5,0
5,0)5,0()5,0(
;
Šiose formulėse X yra pliusų (arba minusų) skaičius.
Palyginsime vidutinį kreatino kiekį tyrimo pabaigoje bei pradžioje, taikydamiženklų testą.
29
Frequencies
581
23
0
604
Negative Differencesa
Positive Differencesb
Tiesc
Total
KreatinasG - KreatinasPN
KreatinasG < KreatinasPa.
KreatinasG > KreatinasPb.
KreatinasG = KreatinasPc.
21 lentelė. Ženklų testas
Test Statisticsa
-22,664
,000
Z
Asymp. Sig. (2-tailed)
KreatinasG -KreatinasP
Sign Testa.
22 lentelė. Ženklų testas
Atlikę testą, 21 lentelėje matome, kad didžioji duomenų dalis yra Negative
Diferences grupėje, tai reiškia, kad atvejų, kai vidutinis kreatino kiekis tyrimo pradžioje
viršija vidutinį kreatino kiekį tyrimo pabaigoje yra daugiau nei atvejų, kada vidutinis
kreatino kiekis pabaigoje viršija vidutinį kreatino kiekį tyrimo pradžioje.
22 lentelėje Test statistics, kriterijaus Asymp. Sig. (2-tailed) skiltyje matome, kad
p-reikšmė lygi 0, taigi p < 0,05, todėl matome, kad vidutinis kreatino kiekis pradžioje
skiriasi nuo vidutinio kreatino kiekio pabaigoje.
Darome išvadą, kad abiejuose terapijos naudojami vaistai daro įtaką kreatino
kiekiui organizme. Vaistai mažina kreatino kiekį organizme.
30
KAPLAN-MEIERIO IŠGYVENAMUMO ANALIZĖ
Cenzūravimas
Ne visada išgyvenamumo duomenys turi cenzūruotų stebėjimų, kaip ir
cenzūravimas pasitaiko ne vien išgyvenamumo analizėje. Nepaisant to, cenzūruoti
išgyvenamumo duomenys yra labai paplitę ir reikalauja specialaus apdorojimo, ir būtent
cenzūravimas daugiau nei bet kas kitas jungia daugelį metodų į išgyvenamumo analizę.
Cenzūravimas – tai situacija, kai individas stebimas iki įvykio įvykimo momento
ne visą laiką. Tarkim, kad i-jo individo iš n dydžio imties stebėjimo trukmė yra iT , čia iT
yra atsitiktinis dydis. Taip pat tarkime, kad individo stebėjimas nutraukiamas laiko
momentu ic . Tada stebimi dydžiai iii cTX ,min su indikatoriniu kintamuoju
ii
ii
icTjei
cTjei
,0
,1
Cenzūravimas būna įvairių formų ir atsiranda dėl skirtingų priežasčių. Esminis
skirtumas yra tarp cenzūravimo iš kairės ir cenzūravimo iš dešinės. Kintamojo T
stebėjimas yra cenzūruotas iš dešinės, kai apie jį žinoma tik tiek, kad jis didesnis už
reikšmę c. Kintamasis T yra cenzūruotas iš dešinės, kai stebėjimas nutraukiamas anksčiau
nei įvykis įvyksta. Aišku, ši cenzūravimo sąvoka neapsiriboja tik įvykio laiku.
Panašiai apibrėžiamas ir cenzūravimas iš kairės. Taip atsitinka, T < c.
Išgyvenamumo analizėje toks cenzūravimas iš kairės atsiranda, kai įvykis pasireškia iki
stebėjimo pabaigos.
Paprasčiausia ir dažniausia pasitaikančia situacija pavaizduota 6 paveiksle. Šiame
paveiksle pavaizduojama dalis duomenų, t.y. tiriamųjų, kurie buvo stebimi po inksto
persodinimo operacijos. Horizontalioje ašyje išsidėstęs tyrimo laikotarpis, o vertikalioje
pavaizduoti tiriamieji. Kiekviena raidė atitinka tam tikrą tiriamąjį. Simbolis X žymi
inksto atmetimo atvejus konkrečiu laiko momentu. Po 1 metų tiriamieji nebestebimi, taigi
įrašas pažymėtas raide D yra cenzūruotas iš dešinės, o A, B, C yra cenzūruotas iš kairės.
(subjektas cenzūruotas),
(subjektas necenzūruotas).
31
6 pav. Cenzūravimas
Standartiniai išgyvenamumo metodai palaiko tik cenzūravimą iš dešinės.
Paciento pašalinimas iš išgyvenamumo kreivės, stebėjimo laikotarpio pabaigoje,
vadinamas paciento „cenzūravimu“. Šios procedūros tikslas yra gauti kaip įmanoma
tikslesnę išgyvenimo kreivę, įtraukiant visą įmanomą informaciją. Kai pacientas yra
cenzūruojamas (inkstas nebuvo atmestas) kreivė nekrenta žemyn, ji krenta žemyn kai
persodintas inkstas pacientui yra atmetamas. Vienintelis būdas pamatyti, kur pacientas
buvo cenzūruotas, tai atžymos, esančios ant išgyvenimo kreivės. Dėl cenzūravimo mažėja
pacientų, įtraukiamų į kreivę. Kiekvienas inksto atmetimo atvejis po atžymos atvaizduoja
didesnį populiacijos sumažėjimą, taigi kiekvienas žingsnis žemyn bus truputi didesnis.
Šis efektas paprastai nėra matomas tiesiog pažiūrėjus į išgyvenimo kreivę.
Pacientų cenzūravimas mažina duomenų kiekį. Duomenų kiekio mažinimas
visada mažina patikimumą, taigi kuo daugiau ir kuo anksčiau pacientai yra cenzūruojami
tuo nepatikimesnė išgyvenimo kreivė. Kadangi kiekvienas cenzūruotas pacientas mažina
kreivės patikimumą nuo esamo taško į priekį, kreivės pabaiga yra labiausiai paveikta.
Kaplan-Meierio modelis yra paremtas sąlyginių tikimybių skaičiavimu kiekvienu
laiko momentu, kai įvyksta įvykis, ir išgyvenimo tikimybės apskaičiavimas kiekvienu
laiko momentu.
32
Išgyvenamumo analizė. Kaplan-Meierio metodas
Išgyvenamumo analizė – tai statistiniai metodai nagrinėjantys laiko intervalus nuo
tam tikro proceso pradžios iki jo pabaigos.
Išgyvenamumo analizėje naudojami duomenys gali būti retrospektyviniai
(praeities), kai apklausos metu užrašomi praeities įvykiai ir perspektyviniai (ateities), kai
individai stebimi numatytą laiko intervalą. Perspektyvinė duomenų analizė yra
neabejotinai patikimesnė. Išgyvenamumo duomenys turi kelis ypatumus, dėl kurių
įprastinius statistinius metodus taikyti būtų sudėtinga. Tai duomenų cenzūravimas bei
priklausomi nuo laiko aiškinamieji kintamieji.
Kaplan-Meierio metodas tinkamas nedideliems duomenų rinkiniams su
pakankamai tiksliai išmatuotu išgyvenamumo laiku. Šis metodas plačiai taikomas
biomedicinoje išgyvenamumo funkcijos įvertinimui. Taip pat buvo naudojamas daugeli
metų, kol 1958 metais Kaplanas ir Meieris parodė, kad faktiškai tai yra neparametrinis
maksimalaus tikėtinumo statistinis įvertis. Taip metodas tapo teoriškai pagristu.
Kai nėra cenzūruotų duomenų, Kaplan-Meierio įvertis yra gana aiškus ir
paprastas. Išgyvenamumo funkcija tS yra tikimybė, kad įvykio laikas T > t, kur t ≥ 0,
t.y. tTPtS .
Situacija lieka nesudėtinga ir esant vienkartiniam cenzūravimui iš dešinės, kai
tyrimas baigiamas nustatytu laiko momentu ir visi stebėto įvykio laiko momentai yra
mažesni už c. Tada, visiems ct , funkcija tS taip pat yra visų stebėjimų ir stebėjimų,
kurių įvykio laikas didesnis už t, santykis, o kai ct , tS yra neapibrėžta.
Kai vienas kitas cenzūruotas laikas tampa mažesnis už kai kuriuos įvykių laikus,
situacija tampa daug sudėtingesnė. Šiuo atveju, santykis, kur stebėjimų įvykio laikas
didesnis už t, gali sumažėti, kadangi tie stebėjimai, kurie buvo cenzūruoti anksčiau laiko
momento t, iš tikrųjų vėliau gali pradingti be mūsų žinios. Tarkim, yra k skirtingų laiko
momentų: kttt ...21 .
33
Kiekvienam laiko momentui priskiriama in tiriamųjų, kuriems persodintas inkstas
galėjo būti atmestas. Tai reiškia, kad tiriamiesiems persodintas inkstas nebuvo nei
atmestas, nei cezūruotas iki laiko momento it . Tegul, id yra tiriamųjų, kuriems atmetė
inkstą tam tikru laiko momentu it , skaičius. Tada Kaplan-Meierio įvertis apibrėžiamas
taip:
tti i
i
jn
dtS
:
1ˆ , kttt 1 .
Reikšmė, kuri apskaičiuojama skliaustuose, interpretuojama kaip sąlyginė
išgyvenamumo tikimybė laiko momentu 1it , atsižvelgiant į tai, kad kiekvienam iš šių
tiriamųjų inkstas nebuvo atmestas iki laiko momento it . Funkcija 1ˆ tS , kai 1tt .
Kai ktt , tS funkcijos apibrėžimas priklauso nuo cenzūruotų stebėjimų
konfigūracijos. Jei cenzūruotų stebėjimų didesnių už kt nėra, tai 0ˆ tS visiems ktt .
Jei yra cenzūruotų stebėjimų didesnių už kt , tai tS neapibrėžta visiems ktt .
Standartinė Kaplan-Meierio įverčio paklaida skaičiuojama pagal Grenwudo
formulę:
21
1
ˆˆ
t
i iii
i
dnn
dtStSse .
Kaplan-Meierio metodu galima įvertinti ir palyginti išgyvenamumo funkcijas
kiekvienoje iš ligonių grupių.
Tiriamas pooperacinis laikotarpis yra laikas praleistas po inksto persodinimo,
kurio trukmė priklauso nuo atskiro ligonio gydimo proceso. Daliai ligonių persodintas
inkstas atmetamas. Vertinant ir lyginant ligonių persodinto inksto išgyvenamumą
naudojami du kintamieji: kiekybinis laiko kintamasis Laikas ir kategorinis dvireikšmis
atmetimo atveju kintamasis atmetimas. Šiuo atveju cenzūruotais laikomi ligoniai,
kuriems inkstas nebuvo atmestas.
34
250200150100500
Laikas
1,0
0,8
0,6
0,4
0,2
0,0
Cu
mS
urv
ival
ACTIVETREATMENT-censored
ACTIVECONTROL-censored
ACTIVETREATMENT
ACTIVECONTROL
Terapija
Survival Functions
7 pav. Kaplan-Meierio išgyvenamumo grafikas.
7 paveikslo grafiko horizontalioje ašyje išsidėstęs pacientų stebėjimo laikas, o
vertikalioje ašyje yra pacientams persodintų inkstų išgyvenimo tikimybės. Kiekviena iš
išgyvenimo kreivių parodo išgyvenimo tikimybę kiekvienu laikotarpiu kiekvienai iš
terapijos grupių. Kadangi abi kreivės yra beveik vienodos, skirtumus tarp jų padės
pastebėti palyginimo lentelė.
Išgyvenimo kreivių lyginimas
Lentelėje pateikti keli išgyvenimo kreivių lyginimo metodai: Log Rank, Breslovo,
Tarono-Varo testai.
35
Log Rank testas skirtas palyginti išgyvenimo kreivių pasiskirstymo panašumą.
Šiame teste visi laiko taškai yra vienodo svorio.
Breslovo testas skirtas palyginti išgyvenimo kreivių pasiskirstymo panašumą.
Laiko svoris priklauso nuo pavojingų atvejų esančių tuo laiko momentu.
Tarono-Varo testas skirtas palyginti išgyvenimo kreivių pasiskirstymo panašumą.
Laiko svoris priklauso nuo kvadratinės šaknies iš pavojingų atvejų skaičiaus esančio tuo
laiko momentu.
Overall Comparisons
,289 1 ,591
,475 1 ,491
,375 1 ,540
Log Rank (Mantel-Cox)
Breslow (GeneralizedWilcoxon)
Tarone-Ware
Chi-Square df Sig.
The vector of trend weights is -1, 1. This is the default.
23 lentelė. Išgyvenamumo kreivių lentelė.
Ši lentelė parodo skirtumus tarp dviejų terapijų grupių išgyvenimo kreivių.
Kadangi kiekvieno atliekamo testo Sig. reikšmė didesnė už 0,1 todėl galime teigti, kad
skirtumo tarp išgyvenimo kreivių nėra.
Atlikę Kaplan-Meierio išgyvenimo analizės procedūrą, išanalizavome laiko iki
įvykio pasiskirstymą skirtingoms terapijų grupėms. Palyginimo testas parodė, kad nėra
statistiškai žymaus skirtumo tarp išgyvenimo kreivių.
Išgyvenamumo laiko pasiskirstymas
Visi standartiniai išgyvenamumo analizės metodai yra tikimybiniai arba
stochastiniai. Laiko momentai kuriais įvykiai įvyksta yra suprantami kaip tam tikro
atsitiktinio proceso realizacijos. Tai reiškia, kad įvykio įvykimo laikas T atskiram
individui yra atsitiktinis dydis turintis tikimybinį pasiskirstymą. Dažnai išgyvenamumo
duomenų metodai vieni nuo kitų skiriasi būtent dydžio T pasiskirstymu. Dydžio T
pasiskirstymo funkcija
36
)()( tTPtF .
Tada išgyvenamumo funkcija apibrėžiama taip:
tFtTPtS 1)( .
Kai kintamieji tolydūs, tai tikimybinis pasiskirstymas gali būti aprašytas
tikimybine tankio funkcija:
dt
tdS
dt
tdFtf .
Aišku, kad
duuftFt
0
,
duuftSt
.
Rizikos funkcija naudinga apibrėžiant išgyvenamumo laiko pasiskirstymą,
kuris naudojamas aprašant populiacijos senėjimo procesą.
Tiriamas pooperacinis laikotarpis yra laikas praleistas po inkstų persodinimo
operacijos, kurio trukmė priklauso nuo atskiro ligonio būklės. Daliai ligonių inkstas
atmetamas. Vertinant ir lyginant ligoniams persodinto inksto išgyvenamumą naudojami
du kintamieji: kiekybinis laiko kintamasis Laikas ir kategorinis dvireikšmis atmetimo
atvejų kintamasis atmetimas. Cenzūruoti ligoniai tie, kuriems inksto organizmas
neatmetė.
37
24 lentelė. Išgyvenimo laiko lentelė.
Įvertintos išgyvenamumo funkcijos reikšmės pateikiamos 24 lentelėje. Kiekviena
skaičių eilutė ( Survival Table) atitinka vieną iš turimų 604 įrašų, išdėstytų laiko didėjimo
tvarka (nuo 0 iki 365 parų).
Pirmame stulpelyje, nurodyta gydymo terapija, antrame (ID) ir ketvirtame
(Status) — ar inkstą atmetė, ar ne, trečiame stulpelyje (Time) pateiktas terapijos laikas,
per kurį ligoniai buvo stebimi.
38
Išgyvenimo lentelė tai pacientų išgyvenimo laiko bei tikimybės ir tikimybės
paklaidos atvaizdavimas. Visa tai nurodyta penktame (Estimate) ir šeštame (Std. Error)
stulpeliuose.
Kadangi ši lentelė yra labai didelė, čia pateikta tik vienos terapijos grupės dalies
išgyvenimo laikas ir tikimybės.
Galima teigti, kad ligoniui organizmas inksto neatmes per 5 paras su tikimybe
didesne nei 0,953. Panašiai didelės neatmetimo tikimybės yra gaunamos, kai taikoma ir
gydomoji terapija. Taigi inksto atmetimo laikas nepriklauso nuo terapijos tipo.
Išgyvenimo laiko vidurkiai
25 lentelė. Išgyvenimo laiko vidurkiai.
Iš šios lentelės matome, kad vidutinis išgyvenamumas atitinkamai keičiasi pagal
terapijos tipą. Kai taikoma ligoniui kontrolinė terapija, tai inksto neatmetimo vidutinis
laikas yra didesnis, o kai terapija taikoma gydomoji, tai inksto neatmetimo vidutinis
laikas mažesnis.
39
RIZIKOS FAKTORIŲ ĮVERTINIMAS. KOKSO REGRESIJOSMODELIS
Vienas iš svarbiausių uždavinių statistiniuose medicininiuose tyrimuose yra
nustatyti, ar tam tikri kintamieji priklauso nuo išgyvenimo laiko. Literatūroje, skirtoje
laiko trukmės modeliavimui vienas iš išskiriamų modelių yra proporcingųjų rizikų
modelis (Kokso regresijos modelis).
Kokso proporcingųjų rizikų modelis nereikalauja išgyvenamumo laiko
pasiskirstymo prielaidų. Šis modelis numato, kad rizikos funkcija yra nepriklausomų
kintamųjų funkcija ir nedaroma jokių prielaidų dėl funkcijos pavidalo. Todėl, Kokso
modelis tam tikra prasme nagrinėjamas kaip neparametrinis.
Kelios modelio savybės:
įtraukia priklausomus nuo laiko aiškinamuosius kintamuosius;
sluoksninės analizės galimybė, kuri labai efektyvi kontroliuojant netinkamus
kintamuosius;
galimybė naudoti ir diskrečius ir tolydžius išgyvenamumo laiko įverčius.
Šis regresijos metodas pirma karta buvo pasiūlytas 1972 metais britų statistiko
Davido Kokso jo garsiajame straipsnyje “Regression Models and Life Tables”.
Proporcingųjų rizikų modelis
Bendras modelis, į kurį nėra įtraukti priklausomi nuo laiko aiškinamieji kintamieji
arba neproporcingosios rizikos, užrašomas taip:
kk xxtt ...exp 110
Ši lygtis reiškia, kad rizika kiekvienam i laiko momentu t yra pradinės rizikos
funkcijos t0 , kuri neapibrėžta iš kairės ir neneigiama, bei eksponentės, kurios
rodiklyje yra tiesinė k fiksuotų aiškinamųjų kintamųjų funkcija, sandauga.
Kai 0j , jx didėjant, didėja rizikos funkcija, kai 0j , jx didėjant, rizikos
funkcija mažėja.
40
Variables in the Equation
-,013 ,004 12,575 1 ,000 ,987
-,022 ,007 9,583 1 ,002 ,978
-,015 ,004 16,902 1 ,000 ,985
-,029 ,008 14,632 1 ,000 ,971
,016 ,006 8,608 1 ,003 1,016
-,017 ,004 20,928 1 ,000 ,984
KreatinasPStep 1
Amzius
KreatinasP
Step 2
Amzius
Svoris
KreatinasP
Step 3
B SE Wald df Sig. Exp(B)
26 lentelė. Proporcingųjų modelių lentelė.
26 lentelėje pateikti duomenys nurodo, kad išgyvenamumui įtakos turi kreatino
kiekis tyrimo pradžioje (KreatinasP), ligonio amžius bei svoris.
Įvertintas regresijos modelis atrodo taip:
KreatinasPSvorisAmziustt 017,0016,0029,0exp0 .
Iš įvertinto modelio matyti, kad nuo kreatino kiekio tyrimo pradžioje ir ligonio
amžiaus bei svorio priklauso inksto atmetimo rizika. Nuo kreatino kiekio tyrimo
pradžioje ir amžiaus didėjimo rizika, kad inkstą atmes mažėja, o kuo didesnį svorį turi
tiriamasis, tuo rizika, kad inkstas jam bus atmestas padidėja.
41
LOGISTINĖ REGRESIJA
Dažniausiai persodinto inksto būklė priklauso nuo kelių kokių nors parametrų.
Ieškosime faktorių, nuo kurių priklauso, ar persodintas inkstas buvo atmestas, ar ne.
Radus tuos faktorius prognozuosime inksto atmetimo tikimybę.
Kalbama apie įvykius, kurie gali įvykti arba neįvykti. Šiuo atveju logistinė
regresija skaičiuoja tikimybę įvykti tam tikram įvykiui, priklausomai nuo nepriklausomų
kintamųjų reikšmių. Logistinė regresija taikoma, kai kategoriniai prognozuojami
kintamieji yra dvireikšmiai. Šio dvireikšmio kategorinio kintamojo reikšmių
prognozavimas tam tikra prasme yra klasifikavimo uždavinys. Nepriklausomi kintamieji
gali būti bet kokio skaitinio tipo.
Logistinės regresijos modelis
Binarinė logistinė regresija yra naudojama tyrinėti binarinių kintamųjų
priklausomybei nuo bet kurios skalės nepriklausomų kintamųjų.
Logistinės regresijos modelis yra:
(1),...)(,)}(exp{1
)}(exp{2211 kikiii
i
ii xbxbxbaxz
xz
xzp
kur jix – nepriklausomo kintamojo reikšmės, jb – koeficientai, kuriuos rasti yra
logistinės regresijos uždavinys, a – konstanta.
Nagrinėjamų kintamųjų reikšmes žymėsime kiiii xxxx ,...,, 21
. Laikysime, kad
ii yx , yra tam tikrų atsitiktinių vektorių ii YX , realizacijos. Be to, ii YX , laikysime
nepriklausomomis tam tikro atsitiktinio vektoriaus YX , kopijomis.
Logistinė regresija tinka galiojant gana bendroms prielaidoms: kintamieji
kXX ,...,1 nebūtinai turi būti normalieji; nereikalaujama normaliai pasiskirsčiusių
paklaidų, nekalbama apie priklausomo kintamojo homoskedastiškumą (dispersijų
vienodumą). Kita vertus modelis gali netikti dėl sudėtingesnės kintamųjų tarpusavio
42
priklausomybės arba dėl kintamųjų multikolinearumo (t.y.: glaudaus koreliacinio ryšio tarp
analizei atrinktų veiksnių, darančių bendrą įtaką rezultatui).
Tirsime nuo kokių veiksnių priklauso inksto atmetimas. Priklausomu kintamuoju
imsime inksto atmetimą. Nepriklausomus kintamuosius — amžių, ūgį, svorį, lytį, donoro
amžių, kreatino kiekį tyrimo pradžioje, cukraligę, hiperlipidemiją bei hipertenziją.
Modelio suderinamumo tikrinimas
Jeigu prognozuojama tikimybė nuo kintamojo xj nepriklauso, tai (1) modelio
parametras bj = 0. Prognozės priklausomybė nuo nepriklausomų kintamųjų ekvivalenti
klausimui apie parametrų b1, b2, ..., bj lygybę nuliui.
Modelio χ² suderinamumo kriterijus.
Jei visi koeficientai bj = 0, tai reiškia, jog (1) logistinės regresijos modelis netinka
prognozėms daryti.
Tarkime, kad didžiausio tikėtinumo metodu parinkome parametrus ,,,, 1 kbba
,
įstatėme juos į didžiausio tikėtinumo funkciją
0:1:
1ji yi
jyi
i ppL ir radome L
maksimumą, žymimą
baL , . Tada tarkime, kad pasirinkome logistinės regresijos
modelį, kur visi bj = 0, t. y. zi = a.
Didžiausio tikėtinumo funkcijos maksimumą žymėsime
0,
~
aL .
2 kriterijus remiasi tuo, kad
baL , mažai skiriasi nuo
0,
~
aL , jei visi
koeficientai bj = 0.
Statistinė hipotezė:
.0:
,0:
1
3210
j
n
bvienasbentH
bbbbH
Kriterijaus statistika:
43
baLaL ,ln20,ln2~
2 .
Sprendimo priėmimo taisyklė.
Tegul pasirinktas reikšmingumo lygmuo lygus α. Pagal p-reikšmę
sprendžiame taip:
jei p < α, tai H0 atmetama;
jei p ≥ α, tai H0 neatmetama.
Neatmesta hipotezė H0 rodo, kad logistinės regresijos modelis netinka.
Patikrinsime hipotezę, kad mūsų sudaryto modelio bent vienas koeficientas
nelygus nuliui.
SPSS paketu gauta p-reikšmė pateikta 15 lentelėje.
Omnibus Tests of Model Coefficients
6,695 1 ,010
6,695 1 ,010
6,695 1 ,010
7,338 1 ,007
14,033 2 ,001
14,033 2 ,001
7,603 1 ,006
21,636 3 ,000
21,636 3 ,000
Step
Block
Model
Step
Block
Model
Step
Block
Model
Step 1
Step 2
Step 3
Chi-square df Sig.
27 lentelė.
Kadangi p = 0,006 < 0,05, tai hipotezę apie visų modelio koeficientų lygybę
nuliui atmetame. Galime spręsti, kad bent vieno kintamojo modelyje reikia.
Voldo kriterijus.
Voldo kriterijus atsako į klausimą ar konkretus koeficientas b1 ≠ 0. Voldo
statistika yra2
/
jj SEbW ; čia SEj yra standartinio nuokrypio įvertis. Ši statistika
turi 2 skirstinį su 1 laisvės laipsniu.
44
Statistinė hipotezė:
.0:
,0:
1
0
bjH
bH j
Sprendimo priėmimo taisyklė:
Tegul reikšmingumo lygmuo lygus α. Hipotezė H0 atmetama 0jb , jei p-
reikšmė p < α. Hipotezė H0 neatmetama, jei p ≥ α.
Variables in the Equation
-,010 ,004 6,566 1 ,010 ,990
-,519 ,246 4,450 1 ,035 ,595
-,023 ,009 7,343 1 ,007 ,977
-,012 ,004 9,039 1 ,003 ,988
,613 ,482 1,614 1 ,204 1,846
-,031 ,009 11,567 1 ,001 ,969
,019 ,007 7,547 1 ,006 1,019
-,014 ,004 11,873 1 ,001 ,986
-,303 ,588 ,265 1 ,607 ,739
KreatinasP
Constant
Step1
a
Amzius
KreatinasP
Constant
Step2
b
Amzius
Svoris
KreatinasP
Constant
Step3
c
B S.E. Wald df Sig. Exp(B)
Variable(s) entered on step 1: KreatinasP.a.
Variable(s) entered on step 2: Amzius.b.
Variable(s) entered on step 3: Svoris.c.
28 lentelė.
28 lentelės stulpelyje Sig. pateiktos kiekvieno šio modelio kintamojo p-reikšmės.
Iš šios informacijos galime spręsti, kad inksto atmetimui turi įtakos ligonio amžius, svoris
bei leidžiamo kreatino kiekis tyrimo pradžioje.
Hosmerio Lemešou kriterijus
Hosmerio-Lemešou kriterijaus esmė ta, kad visų stebėjimų prognozuojamų tikimybių
ii xYPp |1 variacinė eilutė padalijama į keletą grupių. Kiekvienos grupės
tikimybės sudedamos. Gautos sumos parodo, kiek kartų kiekvienoje grupėje yi turėtų įgyti
reikšmę 1, jei duotas (1) modelis būtų suderintas su duomenimis. Šių dydžių skirtumą
aprašo skirstinys su (k - 2) laisvės laipsnių, kur k yra grupių skaičius.
45
Kai reikšmingumo lygmenyje α, Hosmerio-Lemešou statistikos p-reikšmė p ≥ α, tai
gauname patvirtinimą, kad logistinės regresijos modelis su duomenimis yra suderintas.
Hosmer and Lemeshow Test
9,567 8 ,297
3,976 8 ,859
6,876 8 ,550
Step1
2
3
Chi-square df Sig.
29 lentelėje pateikti Hosmerio-Lemešou testo rezultatai.
Contingency Table for Hosmer and Lemeshow Test
48 49,709 12 10,291 60
46 47,944 14 12,056 60
46 47,087 14 12,913 60
49 46,261 11 13,739 60
47 45,613 13 14,387 60
45 44,967 15 15,033 60
52 44,309 8 15,691 60
44 43,414 16 16,586 60
37 42,263 23 17,737 60
34 36,433 21 18,567 55
52 50,811 8 9,189 60
46 49,047 14 10,953 60
48 47,951 12 12,049 60
47 47,105 13 12,895 60
47 46,168 13 13,832 60
44 45,238 16 14,762 60
46 44,345 14 15,655 60
47 42,817 13 17,183 60
41 41,105 19 18,895 60
30 33,413 25 21,587 55
55 51,584 5 8,416 60
46 49,997 14 10,003 60
52 48,845 8 11,155 60
45 47,716 15 12,284 60
45 46,712 15 13,288 60
45 45,603 15 14,397 60
45 44,126 15 15,874 60
43 42,367 17 17,633 60
43 39,874 17 20,126 60
29 31,175 26 23,825 55
1
2
3
4
5
6
7
8
9
10
Step1
1
2
3
4
5
6
7
8
9
10
Step2
1
2
3
4
5
6
7
8
9
10
Step3
Observed Expected
Atmetimas = neatmetë
Observed Expected
Atmetimas = atmetë
Total
30 lentelėje pateikti Hosmerio-Lemešou testo rezultatai.
46
29 lentelėje Sig skilties trečiajame žingsnyje pateikta p-reikšmė. Akivaizdu, jog p-
reikšmė 0,550 > 0,05, taigi Hosmerio-Lemešou kriterijus patvirtina, kad duomenys su
logistinės regresijos modeliu yra suderinti.
30 lentelėje parodyta, kiek iš tikrųjų inksto atmetimų bei neatmetimų buvo kiekvienoje
iš 10 grupių ir kiek jų turėjo būti taikant logistinę regresiją. Pavyzdžiui, septintoje
grupėje buvo 60 ligonių, iš kurių 45 inksto neatmetė, o visų tikimybių 1-pt suma lygi
44,126, o 15 ligonių inkstą atmetė, ir visų tikimybių pt suma lygi 15,874.
Hosmerio-Lemešou kriterijų paprastai rekomenduojama taikyti, kai į kiekvieną grupę
pakliūna bent 5 stebėjimai. Kaip kad šiuo atveju.
Determinacijos koeficientai
Kai tiesinėje regresijoje norime skaitiškai įvertinti, ar nepriklausomų kintamųjų ir
priklausomo kintamojo priklausomybė yra stipri, skaičiuojamas determinacijos
koeficientas 12 r . Kuo koeficientas didesnis, tuo geriau logistinė regresija suderinta su
duomenimis.
Model Summary
658,611a ,011 ,017
651,274a ,023 ,035
643,670a ,036 ,053
Step1
2
3
-2 Loglikelihood
Cox & SnellR Square
NagelkerkeR Square
Estimation terminated at iteration number 4 becauseparameter estimates changed by less than ,001.
a.
31 lentelė. Determinacijos koeficientai
Yra daug determinacijos koeficiento atmainų. 31 lentelėje pateikti Koks‘o-Snell‘o
ir Nagelkerkės pseudodeterminacijos koeficientai.
Gauto logistinės regresijos modelio koeficientai pateikti 32 lentelės B skiltyje.
47
Variables in the Equation
-,010 ,004 6,566 1 ,010 ,990
-,519 ,246 4,450 1 ,035 ,595
-,023 ,009 7,343 1 ,007 ,977
-,012 ,004 9,039 1 ,003 ,988
,613 ,482 1,614 1 ,204 1,846
-,031 ,009 11,567 1 ,001 ,969
,019 ,007 7,547 1 ,006 1,019
-,014 ,004 11,873 1 ,001 ,986
-,303 ,588 ,265 1 ,607 ,739
KreatinasP
Constant
Step1
a
Amzius
KreatinasP
Constant
Step2
b
Amzius
Svoris
KreatinasP
Constant
Step3
c
B S.E. Wald df Sig. Exp(B)
Variable(s) entered on step 1: KreatinasP.a.
Variable(s) entered on step 2: Amzius.b.
Variable(s) entered on step 3: Svoris.c.
32 pav. Logistinės regresijos modelio koeficientai.
Užrašome z formulę:
KreatinasPz 014,0Svoris019,0Amžius310,0303,0 .
Lygties koeficientai rodo, kaip kinta z reikšmė kintant lygties kintamųjų reikšmėms.
Prognozavimas
Tarkime, kad duomenis sudaro stebėjimai nixxxy kiiii ,,2,1,,,,,, 21 , yi
yra vienetas arba nulis, o ii xx 21 , — intervalinių kintamųjų arba pseudokintamųjų
reikšmės. Parametrų kbbba ,,,, 21 įverčius kbba
,,, 1 reikia parinkti taip, kad (1)
modelis būtų kuo geriau suderintas su turimais duomenimis. Tam taikomas didžiausio
tikėtinumo metodas. Kiekvienam stebėjimui pagal (1) formulę skaičiuojama tikimybė pi.
Parametrų įverčiai kbbira
,,1 parenkami taip, kad tikėtinumo funkcija
0:1:
1ii yi
iyi
i ppL
būtų maksimali. Čia
48
.,
exp1
exp
2211 kikiii
i
i
i xbxbxbaxz
xz
xz
p
Parametrų įverčių skaičiavimas - iteracinis procesas, t.y. pasirenkamos pradinės jų
reikšmės ir, taikant tam tikrą skaičiavimo metodą, keičiamos tol, kol stabilizuojasi.
Gauti koeficientai kbbira
,,1 naudojami
ixz skaičiuoti. Be to, pagal (2) formulę
galima rasti tikimybės, kad Y = 1, įvertį.
Apibrėžimas. Tikimybės P(Y = 1) įvertis, kai nepriklausomų kintamųjų reikšmių x1,
x2,..., xk vektorius yra kxxxx ,,, 21
, skaičiuojamas pagal formulę
.;exp1/exp|1 2211 kk xbxbxbaxzčiaxzxzxYP
Svarbu, kad tikimybės įvertis būtų skaičiuojamas tik toms x reikšmėms, kurios
patenka į duomenų aibės intervalą, pavyzdžiui, x1 būtinai turi būti iš intervalo maxmin , xx .
Pagal
,...)(,)}(exp{1
)}(exp{2211 kikiii
i
ii xbxbxbaxz
xz
xzp
formulę galima prognozuoti z reikšmę.
Pasinaudoję 32 lentelėje pateiktais duomenimis, galime prognozuoti tokias inksto
atmetimo tikimybes, kaip ši:
kai ligonio amžius yra 18 metų, svoris 64, o kreatino kiekis pradžioje 14,65824, tai
z = -4,87221536, o P(Inkstas atmestas|(18; 64; 14,65824)) = exp(-4,87221536)/(1+
+ exp(-4,87221536)) = 0,0076.
(2)
49
IŠVADOS
Atlikus pateiktų duomenų apie ligonius, kuriems buvo persodintas inkstas statistinį
tyrimą, nustatyta:
1) Tiek vyrų, tiek moterų kreatino kiekis tyrimo pradžioje pasiskirstęs pagal
normalųjį dėsnį, o tuo tarpu kreatino kiekis tyrimo pabaigoje ne.
2) Moterų vidutinis kreatino kiekis tyrimo pradžioje statistiškai reikšmingai
nesiskiria nuo vyrų vidutinio kreatino kiekio, o tuo tarpu tyrimo pabaigoje vyrų ir
moterų kreatino kiekiai skiriasi.
3) Tiek gydymo, tiek kontrolinės terapijos grupėse naudojami vaistai daro įtaką
kreatino kiekiui organizme. Vaistai mažina kreatino kiekį organizme.
4) Laikas iki inksto atmetimo nepriklauso nuo gydymo.
5) Rizikos faktorių tyrimai parodė, kad kuo žmogus vyresnis bei kreatino kiekis
didesnis, tuo mažesnė riziką, kad inkstą atmes, o kuo didesnis ligonio svoris tuo ta
rizika didėja.
6) Veiksniai įtakojantys inksto atmetimą yra tiriamojo svoris, amžius, kreatino kiekis
tyrimo pradžioje.
50
LITERATŪRA
1) V. Čekanavičius, G. Murauskas, E. Tatarinavičiūtė. Statistika ir jos taikymai I,Vilnius, TEV, 2000.
2) V. Čekanavičius, G. Murauskas, E. Tatarinavičiūtė. Statistika ir jos taikymai II,Vilnius, TEV, 2002.
3) Allison, P. D. Survival Analysis Using the SAS System: A Practical Guide. Cary,NC: SAS Institute Inc., 1995. 292 p.
4) http://www.donoryste.eu/lt/Naujienos.html?article=30&
5) http://www.sveikas.lt/ligos_placiau2.asp?
6) www.medikai.mf.vu.lt/consp/Laboratorine_medicina.doc
7) http://www.ctstransplant.org/
8) http://www.livekidney.com/
9) http://sti.upmc.edu/default.htm
10) http://www.transweb.org/
11) http://www.transplantation.org/
12) K. Pukėnas. Sportinių tyrimų duomenų analizė SPSS programa, Kaunas, 2005.
13) T. Leonavičienė. SPSS programų paketo taikymas statistiniuose tyrimuose,Vilnius, 2006.
51
SANTRAUKA
Inkstų persodinimas yra aktuali priemonė gydant inkstų ligas. Nuo inkstų ligų
visame pasaulyje kenčia apie 10 % suaugusių žmonių. Vienas suaugęs žmogus iš
dešimties kenčia nuo chroniškų inkstų ligų. Apie 1,5 mln. žmonių gyvybė palaikoma
dializės būdu, vidutiniškai jie inkstų persodinimo laukia apie septynerius metus.
Šio darbo tikslas — nustatyti ligoniams persodinto inksto atmetimo riziką,
išgyvenamumo galimybes bei terapijos įtaką.
Darbe buvo tiriami duomenys pasitelkiant Kaplan-Meierio išgyvenamumo
analizę, Kokso regresiją, logistinę regresiją ir t.t.
Iš viso buvo ištirti 604 tiriamieji, kuriems buvo persodintas inkstas ir nustatyta,
kad veiksniai įtakojantys inksto atmetimą yra ligonio amžius, svoris bei kreatino kiekis
tyrimo pradžioje. Kaplan-Meierio išgyvenamumo analizė parodė, kad išgyvenamumo
kreivės iki inksto atmetimo nepriklauso nuo gydymo. Kokso regresijos modelis atskleidė,
kad inksto atmetimas susijęs su kreatino kiekiu pradžioje, svoriu bei amžiumi. Be to,
tyrimas rodo, kad kreatino kiekis pabaigoje sumažėja, taikant tiek kontrolinę, tiek
gydomąją terapiją.
Reikšminiai žodžiai: p-reikšmė, Šapiro–Vilko W kriterijus, Hosmerio–Lemešou
kriterijus, Voldo kriterijus.
52
SUMMERY
Kidney transplantation is the actual measure when treating kidney diseases.Approximately 10 percents of adults are suffering from kidney diseases. One adult personfrom ten suffers from chronic kidney diseases. Lifes of 1,5 millions persons are supportedby dialysis. They are waiting for kidney transplantation approximately seven years.
The goal of this work is to determine the risk of rejection of kidney transplantedto the patients, possibilities of survival and the influence of therapy.
The data were researched in the work, invoking Kaplan-Meyer survival analysis,Cox regression and the logistics regression, and so on.
In total 604 studies have been researched with the transplanted kidney and it hasbeen determined that the factors, influencing the kidney rejection are the age of thepatient, weight and quantity of creatine in the beginning of the research. Kaplan-Meyersurvival analysis has shown that the survival curves until kidney rejection do not dependupon the treatment. Cox regression model has revealed that the kidney rejection is relatedto the quantity of creatine in the beginning, weight and age. In addition, the researchshows that the quantity of creatine has decreased at the end, when either treatment orcontrol therapies were applied.
Keywords: P-meaning, Shapiro & Wilk W test, Hosmer & Lemeshow test, Voldtest.