Kan Basıncı Bozukluklarının Tahmini

Kan Basıncı Bozukluklarının Tahmini

Bu çalışmanın amacı, Framingham Veri Seti Kullanılarak Kan Basıncı Bozukluklarının Tahminini Makine Öğrenmesi ile tahmin ettik. Çalışmada, hipertansiyon bozukluklarının tahmininde dengesiz veri setleriyle karşılaşılan zorlukları aşarak daha doğru ve dengeli bir model geliştirdik. ROSE (Random Over-Sampling Examples) yöntemi kullanılarak sınıf dengesizliği giderdik. Ardından, karar ağacı algoritması uygulanarak tahmin doğruluğunu artırdık.

Kan Basıncı Bozukluklarının Tahmini Çalışmanın Adımları:

  1. Veri Hazırlama:
    • Framingham veri seti kullanılmıştır. Veri seti, yaş, cinsiyet, vücut kitle indeksi (BMI), glikoz düzeyi gibi bireysel sağlık bilgilerini içermektedir. Hedef değişken hipertansiyon bozukluğudur.
  2. Eksik Değer Yönetimi:
    • Klinik test sonuçlarındaki eksik verileri çıkardık, sonrasında sigara kullanımı gibi diğer eksik verilerle doldurduk.
  3. Kan Basıncı Sınıflandırması:
    • Hipertansiyon ve hipotansiyon sınıfları, Dünya Sağlık Örgütü’nün (WHO) kılavuzlarına göre tanımladık.
  4. Veri Normalizasyonu:
    • Sayısal özelliklerin normalizasyonu yapılmıştır.
  5. Eğitim ve Test Veri Seti Ayrımı:
    • Veri seti %80 eğitim, %20 test olarak ayırdık.
  6. Dengesiz Veri Setinin Dengelenmesi:
    • ROSE yöntemi kullanılarak azınlık sınıfının daha iyi temsil edilmesini sağladık.
  7. Model Geliştirme:
    • Random Forest, XGBoost ve Karar Ağacı algoritmaları kullanılarak modeller oluşturduk.
  8. Model Performansının Değerlendirilmesi:
    • Test veri seti üzerinde yapılan tahminler ve performans metrikleri ile model değerlendirdik.

Çalışmada Kullanılan Modeller:

  • Random Forest
  • XGBoost
  • Karar Ağacı

Sonuç

Çalışma sonucunda, Random Forest modeli en yüksek doğruluk oranı (%90.01) ve dengeyi sağlayarak sınıflandırma performansında başarılı oldu. XGBoost ve Karar Ağacı modelleri de başarılı sonuçlar sundu. Bununla birlikte, özgüllük ve hassasiyet açısından farklılıklar gözlemlenmiştir. Random Forest modelinin dengeli doğruluğu ve özgüllüğü ile en iyi sonuçları sunduğu belirlenmiştir. Bu çalışma, sağlık verilerindeki sınıf dengesizliğinin giderilmesinin, doğru tahmin modelleri geliştirmek için kritik önem taşıdığını göstermektedir.

DeepMineAi olarak, birlikte projelerinizi yürütmekten memnuniyet duyarız! Daha fazla bilgi almak için bize ulaşın. Birlikte, araştırma süreçlerinizi daha stabil hale getirelim.