Download - BİYOKİMYA VE HEMOGRAM LABORATUVAR TEST SONUÇLARININ LOJİSTİK REGRESYON YÖNTEMİYLE ANALİZİ
![Page 1: BİYOKİMYA VE HEMOGRAM LABORATUVAR TEST SONUÇLARININ LOJİSTİK REGRESYON YÖNTEMİYLE ANALİZİ](https://reader033.vdocuments.site/reader033/viewer/2022061502/5681477a550346895db4af9e/html5/thumbnails/1.jpg)
BİYOKİMYA VE HEMOGRAM LABORATUVAR TEST SONUÇLARININ LOJİSTİK REGRESYON YÖNTEMİYLE ANALİZİ
![Page 2: BİYOKİMYA VE HEMOGRAM LABORATUVAR TEST SONUÇLARININ LOJİSTİK REGRESYON YÖNTEMİYLE ANALİZİ](https://reader033.vdocuments.site/reader033/viewer/2022061502/5681477a550346895db4af9e/html5/thumbnails/2.jpg)
Kalp-Damar Sistemi Hastalıkları Hakkında Bilgi Veritabanında Bilgi Keşfi Süreci Veri Madenciliği Lojistik Regresyon Analizi Geliştirilen Uygulama Sonuç ve Öneriler
![Page 3: BİYOKİMYA VE HEMOGRAM LABORATUVAR TEST SONUÇLARININ LOJİSTİK REGRESYON YÖNTEMİYLE ANALİZİ](https://reader033.vdocuments.site/reader033/viewer/2022061502/5681477a550346895db4af9e/html5/thumbnails/3.jpg)
Kalp-damar sistemi hastalıkları tüm toplumlarda önemli bir toplumsal sağlık sorunudur. Bu hastalıklar hem çok sık görülür, hem de çok sayıda insanın ölümünden sorumludur. Örneğin ülkemizdeki bütün ölümlerin %40 kadarı kalp hastalıkları nedeniyle olmaktadır.
Kalbi besleyen damarlara koroner damar adı verilir. Kalp-damar hastalıkları konusunda en sık olan ve en çok ölüme yol açan tür koroner kalp hastalığıdır.
![Page 4: BİYOKİMYA VE HEMOGRAM LABORATUVAR TEST SONUÇLARININ LOJİSTİK REGRESYON YÖNTEMİYLE ANALİZİ](https://reader033.vdocuments.site/reader033/viewer/2022061502/5681477a550346895db4af9e/html5/thumbnails/4.jpg)
Türk Kardiyoloji Derneği’nin 2002’de yayınladığı Koroner Kalp Hastalığı Korunma ve Tedavi Klavuzu’ nda belirtilen ve araştırmamızda kullanılan koroner kalp hastalığı risk faktörleri şunlardır:
• Erkeklerde 45 ve daha üzeri, kadınlarda 55 ve daha üzeri yaşında olma,• Serum LDL kolesterol değerinin ≥130 mg/ dl olması,• Total kolesterolün >200 mg/ dl olması, • Serum trigliserid düzeyinin ≥150 mg/ dl olması,• Serum HDL kolesterol düzeyinin <40 mg/ dl olması.
Koroner Kalp Hastalığı
![Page 5: BİYOKİMYA VE HEMOGRAM LABORATUVAR TEST SONUÇLARININ LOJİSTİK REGRESYON YÖNTEMİYLE ANALİZİ](https://reader033.vdocuments.site/reader033/viewer/2022061502/5681477a550346895db4af9e/html5/thumbnails/5.jpg)
Günümüzde yapılan işlemler sonucunda saklanan veriler her an inanılmaz boyutlarda artmaktadır.
Veri tabanı sistemlerinin artan kullanımı ve hacimlerindeki bu olağanüstü artış, Veri Tabanlarında Bilgi Keşfi adı altında, sürekli ve yeni arayışlara neden olmaktadır.
Özellikle tıp alanındaki verinin büyüklüğü ve hayati önem taşıması bu alandaki uygulamaları daha da önemli kılmaktadır.
![Page 6: BİYOKİMYA VE HEMOGRAM LABORATUVAR TEST SONUÇLARININ LOJİSTİK REGRESYON YÖNTEMİYLE ANALİZİ](https://reader033.vdocuments.site/reader033/viewer/2022061502/5681477a550346895db4af9e/html5/thumbnails/6.jpg)
Veri Temizleme, Veri Bütünleştirme, Veri Seçme, Veri Dönüşümü, Veri Madenciliği, Örüntü
Değerlendirme, Bilgi Sunumu
Bilgi Keşif Süreci Adımları
![Page 7: BİYOKİMYA VE HEMOGRAM LABORATUVAR TEST SONUÇLARININ LOJİSTİK REGRESYON YÖNTEMİYLE ANALİZİ](https://reader033.vdocuments.site/reader033/viewer/2022061502/5681477a550346895db4af9e/html5/thumbnails/7.jpg)
Bir veya daha fazla makine öğrenme tekniği ile büyük miktarlardaki verilerden anlamlı bilgi çıkartılması ve verilerin analiz edilmesi işlemidir.
![Page 8: BİYOKİMYA VE HEMOGRAM LABORATUVAR TEST SONUÇLARININ LOJİSTİK REGRESYON YÖNTEMİYLE ANALİZİ](https://reader033.vdocuments.site/reader033/viewer/2022061502/5681477a550346895db4af9e/html5/thumbnails/8.jpg)
Lojistik Regresyon Modeli Değişkenler Odds Oranı
Modelin Uyum İyiliği Testi
![Page 9: BİYOKİMYA VE HEMOGRAM LABORATUVAR TEST SONUÇLARININ LOJİSTİK REGRESYON YÖNTEMİYLE ANALİZİ](https://reader033.vdocuments.site/reader033/viewer/2022061502/5681477a550346895db4af9e/html5/thumbnails/9.jpg)
Lojistik model, ortaya çıkacak riski 0 ile 1 arasında herhangi bir değer olarak tahmin etmeyi amaçlar.
Lojistik fonksiyonun 0 ile 1 arasında bir değişim aralığına sahip olması tercih edilmesindeki en önemli nedendir.
LRA – Lojistik Regresyon Modeli
![Page 10: BİYOKİMYA VE HEMOGRAM LABORATUVAR TEST SONUÇLARININ LOJİSTİK REGRESYON YÖNTEMİYLE ANALİZİ](https://reader033.vdocuments.site/reader033/viewer/2022061502/5681477a550346895db4af9e/html5/thumbnails/10.jpg)
Lojistik regresyon analizinin kullanım amacı, en az değişkeni kullanarak en iyi uyuma sahip olacak şekilde bağımlı ve bağımsız değişkenler arasındaki ilişkiyi tanımlayabilen ve biyolojik olarak kabul edilebilir bir model kurmaktır.
Lojistik regresyon denklemlerinde bağımsız değişkenlerin tümünün bağımlı değişkeni açıklamak için etkili olması her zaman mümkün olmamaktadır.
LRA – Lojistik Regresyon Modeli
![Page 11: BİYOKİMYA VE HEMOGRAM LABORATUVAR TEST SONUÇLARININ LOJİSTİK REGRESYON YÖNTEMİYLE ANALİZİ](https://reader033.vdocuments.site/reader033/viewer/2022061502/5681477a550346895db4af9e/html5/thumbnails/11.jpg)
Değişkenler birlikteliği ya da nedenselliği göstermek amacıyla kullanıldığında, bağımsız değişken ve bağımlı değişken olarak adlandırılır.
• Bağımsız Değişken Sigara --> Hastalık
• Bağımlı(Sonuç) Değişken
• Kategorik Değişken• Sürekli Değişken
LRA - Değişkenler
![Page 12: BİYOKİMYA VE HEMOGRAM LABORATUVAR TEST SONUÇLARININ LOJİSTİK REGRESYON YÖNTEMİYLE ANALİZİ](https://reader033.vdocuments.site/reader033/viewer/2022061502/5681477a550346895db4af9e/html5/thumbnails/12.jpg)
İncelenen bir olayın(hastalığın) olasılığının kendi dışında kalan diğer olayların olasılığına oranına Odds Değeri denir. Lojistik regresyon analizi, odds değerini temel alır.
Odds Değeri = p / (1-p)
Örneğin, p=0,25 ise Odds=0,25/(1-0,25) = 1/3 ‘tür.
LRA – Odds Oranı
![Page 13: BİYOKİMYA VE HEMOGRAM LABORATUVAR TEST SONUÇLARININ LOJİSTİK REGRESYON YÖNTEMİYLE ANALİZİ](https://reader033.vdocuments.site/reader033/viewer/2022061502/5681477a550346895db4af9e/html5/thumbnails/13.jpg)
Bağımsız değişkenin iki sonuçlu olduğu yani x’ in 0 ya da 1 şeklinde kodlandığı durumda x=1 iken sonucun bireyler arasında olma olasılığı, π(1)/[1 - π(1)], x=0 iken sonucun bireyler arasında olma olasılığı da π(0)/ [1 - π(0)]’ dır.
Odds oranı(OR), x=1’in odds değerinin x=0 odds değerine oranıdır ve eB1 ‘e eşittir.
LRA – Odds Oranı
![Page 14: BİYOKİMYA VE HEMOGRAM LABORATUVAR TEST SONUÇLARININ LOJİSTİK REGRESYON YÖNTEMİYLE ANALİZİ](https://reader033.vdocuments.site/reader033/viewer/2022061502/5681477a550346895db4af9e/html5/thumbnails/14.jpg)
Odds oranı, özellikle epidemiyolojide geniş kullanım alanları bulan bir bağlantı ölçümüdür.
Örneğin;• y, karaciğer kanseri olma durumunu,• x, alkol kullanma durumunu gösterdiğinde
OR=3, herhangi bir popülasyonda alkol kullananlar arasında karaciğer kanseri olma olasılığının, alkol kullanmayanlar arasında olma olasılığının 3 katı olduğunu ifade eder.
LRA – Odds Oranı
![Page 15: BİYOKİMYA VE HEMOGRAM LABORATUVAR TEST SONUÇLARININ LOJİSTİK REGRESYON YÖNTEMİYLE ANALİZİ](https://reader033.vdocuments.site/reader033/viewer/2022061502/5681477a550346895db4af9e/html5/thumbnails/15.jpg)
Uyum iyiliği, kurulan modelin yanıt değişkenini ne kadar iyi açıklayabildiğinin ifadesidir ve uydurulmuş y değerleri ile gerçek y değerleri arasındaki farkla ilgilidir.
π(x) değerinin ≥ 0,5 olması durumunda π(x)=1, π(x) < 0,5 olması durumunda ise π(x)=0
biçiminde sınıflanır.
LRA – Modelin Uyum İyiliği Testi
![Page 16: BİYOKİMYA VE HEMOGRAM LABORATUVAR TEST SONUÇLARININ LOJİSTİK REGRESYON YÖNTEMİYLE ANALİZİ](https://reader033.vdocuments.site/reader033/viewer/2022061502/5681477a550346895db4af9e/html5/thumbnails/16.jpg)
Bu çalışmada biyokimya ve hemogram laboratuvar test sonuçları analiz edilerek oluşturulan lojistik regresyon modeli ile hastalığın olma durumu incelenmektedir. Yeni
Veri Analizi
Web Formu
C#
Veritabanı
Sunucusu
JSP
Hastane
Verileri
Oluşturulan
Model
Modele Ait Web Uygulaması
Geliştirilen Uygulama
Sistem Mimarisi
![Page 17: BİYOKİMYA VE HEMOGRAM LABORATUVAR TEST SONUÇLARININ LOJİSTİK REGRESYON YÖNTEMİYLE ANALİZİ](https://reader033.vdocuments.site/reader033/viewer/2022061502/5681477a550346895db4af9e/html5/thumbnails/17.jpg)
Veri tabanı sunucusu Oracle XE
Uygulama Geliştirme Ortamı, Kullanılan Programlama Dili
Microsoft Visual Studio 2008, C#
Web Uygulama Geliştirme OrtamıWeb Programlama
EclipseJava Server Pages
Sistem Bileşenleri
Uygulama
![Page 18: BİYOKİMYA VE HEMOGRAM LABORATUVAR TEST SONUÇLARININ LOJİSTİK REGRESYON YÖNTEMİYLE ANALİZİ](https://reader033.vdocuments.site/reader033/viewer/2022061502/5681477a550346895db4af9e/html5/thumbnails/18.jpg)
Geriye dönük ve olgu-kontrol araştırması şeklinde gerçekleştirilen bu çalışmanın verileri, 01.05.2011-28.11.2011 tarihleri arasında Kardiyoloji ve diğer servislerden elde edilmiştir.
Olguların %50,30’u kadın, %49,70’i erkek iken ortalama yaş oranı 63,032±13,7 ve olgu sayısı 169’dur.
Hasta Verileri
KKH
(101) Kontrol
(68)
Uygulama – Veri Seti
![Page 19: BİYOKİMYA VE HEMOGRAM LABORATUVAR TEST SONUÇLARININ LOJİSTİK REGRESYON YÖNTEMİYLE ANALİZİ](https://reader033.vdocuments.site/reader033/viewer/2022061502/5681477a550346895db4af9e/html5/thumbnails/19.jpg)
Geliştirilen yazılım ile yapılan analize ait işlem basamakları şunlardır:
Uygulama
Ham Veri Seti
Belirleyici Faktörler
Kategorik ve
Referans Değerler
Hastalık Nedenleri
Model Oluşturm
a
Yeni Veri Analizi
![Page 20: BİYOKİMYA VE HEMOGRAM LABORATUVAR TEST SONUÇLARININ LOJİSTİK REGRESYON YÖNTEMİYLE ANALİZİ](https://reader033.vdocuments.site/reader033/viewer/2022061502/5681477a550346895db4af9e/html5/thumbnails/20.jpg)
Uygulama – Veri Seti İşlemleri
Ham Veri Seti
![Page 21: BİYOKİMYA VE HEMOGRAM LABORATUVAR TEST SONUÇLARININ LOJİSTİK REGRESYON YÖNTEMİYLE ANALİZİ](https://reader033.vdocuments.site/reader033/viewer/2022061502/5681477a550346895db4af9e/html5/thumbnails/21.jpg)
Uygulama – Veri Seti İşlemleri
Belirleyici Faktörler
![Page 22: BİYOKİMYA VE HEMOGRAM LABORATUVAR TEST SONUÇLARININ LOJİSTİK REGRESYON YÖNTEMİYLE ANALİZİ](https://reader033.vdocuments.site/reader033/viewer/2022061502/5681477a550346895db4af9e/html5/thumbnails/22.jpg)
Uygulama – Veri Seti İşlemleri
Kategorik Değerler
![Page 23: BİYOKİMYA VE HEMOGRAM LABORATUVAR TEST SONUÇLARININ LOJİSTİK REGRESYON YÖNTEMİYLE ANALİZİ](https://reader033.vdocuments.site/reader033/viewer/2022061502/5681477a550346895db4af9e/html5/thumbnails/23.jpg)
Uygulama – Veri Seti İşlemleri
Referans Değerler
![Page 24: BİYOKİMYA VE HEMOGRAM LABORATUVAR TEST SONUÇLARININ LOJİSTİK REGRESYON YÖNTEMİYLE ANALİZİ](https://reader033.vdocuments.site/reader033/viewer/2022061502/5681477a550346895db4af9e/html5/thumbnails/24.jpg)
Uygulama – Veri Seti İşlemleri
Hastalık Nedenleri
![Page 25: BİYOKİMYA VE HEMOGRAM LABORATUVAR TEST SONUÇLARININ LOJİSTİK REGRESYON YÖNTEMİYLE ANALİZİ](https://reader033.vdocuments.site/reader033/viewer/2022061502/5681477a550346895db4af9e/html5/thumbnails/25.jpg)
Uygulama – Veri Seti İşlemleri
Model Oluşturm
a
![Page 26: BİYOKİMYA VE HEMOGRAM LABORATUVAR TEST SONUÇLARININ LOJİSTİK REGRESYON YÖNTEMİYLE ANALİZİ](https://reader033.vdocuments.site/reader033/viewer/2022061502/5681477a550346895db4af9e/html5/thumbnails/26.jpg)
Oluşturulacak olan model için her bir test değişkenini modele dahil etmek, modelin önemliliğini yitirmesine neden olacaktır. Bu nedenle bağımlı değişken ile aralarında anlamlılık durumu bulunmayan test değişkenleri modele dahil edilmemelidir.
KOLESTEROL, TRIGLISERID, LDLKOLESTROL, HDLKOLESTROL ve YAS değişkenleri bağımlı değişken için anlamlı bulunmuş, diğer değişkenler bağımlı değişken için anlamlı bulunmamıştır.
Uygulama – Model Oluşturma İşlemleri
Değişkenlerin
Anlamlılığı Testi
![Page 27: BİYOKİMYA VE HEMOGRAM LABORATUVAR TEST SONUÇLARININ LOJİSTİK REGRESYON YÖNTEMİYLE ANALİZİ](https://reader033.vdocuments.site/reader033/viewer/2022061502/5681477a550346895db4af9e/html5/thumbnails/27.jpg)
Uygulama – Model Oluşturma İşlemleri
Değişkenlerin anlamlılığı testi sonucu bağımlı değişken için anlamlı bulunan her bir değişken ile bağımlı değişken değişkenlerin önemliliği testi ile test edilerek oluşturulacak modele dahil edilmesi muhtemel olan değişkenlerin tespiti yapılmıştır.
Değişkenlerin
Önemliliği Testi
![Page 28: BİYOKİMYA VE HEMOGRAM LABORATUVAR TEST SONUÇLARININ LOJİSTİK REGRESYON YÖNTEMİYLE ANALİZİ](https://reader033.vdocuments.site/reader033/viewer/2022061502/5681477a550346895db4af9e/html5/thumbnails/28.jpg)
Uygulama – Model Oluşturma İşlemleri
Lojistik Regresyon
Analizi
![Page 29: BİYOKİMYA VE HEMOGRAM LABORATUVAR TEST SONUÇLARININ LOJİSTİK REGRESYON YÖNTEMİYLE ANALİZİ](https://reader033.vdocuments.site/reader033/viewer/2022061502/5681477a550346895db4af9e/html5/thumbnails/29.jpg)
Uygulama – Model Oluşturma İşlemleri
Doğru Sınıflandırma
Oranı
Oluşturulan lojistik regresyon modelindeki bağımsız test değişkenleri ile bağımlı değişken için olasılık analizi yapılarak veri setindeki koroner kalp hastası olma durumu değerleri ile analiz sonucu elde edilen değerler karşılaştırılmış ve “Doğru Sınıflandırma Oranı” hesaplanmıştır.
![Page 30: BİYOKİMYA VE HEMOGRAM LABORATUVAR TEST SONUÇLARININ LOJİSTİK REGRESYON YÖNTEMİYLE ANALİZİ](https://reader033.vdocuments.site/reader033/viewer/2022061502/5681477a550346895db4af9e/html5/thumbnails/30.jpg)
Uygulama – Model Oluşturma İşlemleri
Başarı Oranı
![Page 31: BİYOKİMYA VE HEMOGRAM LABORATUVAR TEST SONUÇLARININ LOJİSTİK REGRESYON YÖNTEMİYLE ANALİZİ](https://reader033.vdocuments.site/reader033/viewer/2022061502/5681477a550346895db4af9e/html5/thumbnails/31.jpg)
Uygulama – Yeni Veri Analizi
Yeni Verilerin Analizi
![Page 32: BİYOKİMYA VE HEMOGRAM LABORATUVAR TEST SONUÇLARININ LOJİSTİK REGRESYON YÖNTEMİYLE ANALİZİ](https://reader033.vdocuments.site/reader033/viewer/2022061502/5681477a550346895db4af9e/html5/thumbnails/32.jpg)
Analizi sonucunda görülmektedir ki, Erkeklerde 45, kadınlarda 55 yaş ve üstü olma, HDL kolestrol değerinin 40 mg/ dl'den küçük olması, LDL kolestrol değerinin 129 mg/ dl'den büyük
olması, Kolesterol değerinin 200 mg/ dl‘ den büyük olması TRIGLISERID değerinin 149 mg/ dl‘ den büyük
olması
Koroner kalp hastalığı için birer risk faktörüdür ve hastalığın tahmin edilmesinde bu parametreler kullanılabilir.
Sonuçlar ve Öneriler
![Page 33: BİYOKİMYA VE HEMOGRAM LABORATUVAR TEST SONUÇLARININ LOJİSTİK REGRESYON YÖNTEMİYLE ANALİZİ](https://reader033.vdocuments.site/reader033/viewer/2022061502/5681477a550346895db4af9e/html5/thumbnails/33.jpg)
Koroner kalp hastalığı verileri kardiyoloji bölümündeki doktorlar tarafından koroner kalp hastalığı tanısı ile işleme alınmış verilerden oluşmakta, kontrol grubu hastalarına ait veriler ise kardiyoloji bölümü haricindeki diğer bölümlerdeki hasta verilerinden oluşmaktadır.
Olgu sayısı… Literatür taramalarında görülmüştür ki, Sigara kullanımı, Şeker hastalığı, Aile öyküsü, Hipertansiyon ve obezite değerlerinin veri setinde
belirleyici faktör olarak bulunması analizdeki başarıyı arttıracaktır.
Sonuçlar ve Öneriler
![Page 34: BİYOKİMYA VE HEMOGRAM LABORATUVAR TEST SONUÇLARININ LOJİSTİK REGRESYON YÖNTEMİYLE ANALİZİ](https://reader033.vdocuments.site/reader033/viewer/2022061502/5681477a550346895db4af9e/html5/thumbnails/34.jpg)
Tıbbi araştırmaların birincil amacı hastalıkların nedenlerini, gelişimini ve etkilerini anlamak ve koruyucu, tanı koyucu ve tedavi edici girişimleri geliştirmektir.
Elde edilen modelin doğruluğu, analiz edilen verilerin tutarlılığı ve olgu sayısı gibi etkenlere bağlıdır.
Bu çalışma ile herhangi bir hastalığın nedenlerine dair istatistiksel analiz yapılabilmekte ve analizin başarı oranları ile model ortaya konmaktadır.
![Page 35: BİYOKİMYA VE HEMOGRAM LABORATUVAR TEST SONUÇLARININ LOJİSTİK REGRESYON YÖNTEMİYLE ANALİZİ](https://reader033.vdocuments.site/reader033/viewer/2022061502/5681477a550346895db4af9e/html5/thumbnails/35.jpg)