Sağkalım analizi için derin öğrenme yaklaşımı

No Thumbnail Available

Date

2021

Journal Title

Journal ISSN

Volume Title

Publisher

Sağlık Bilimleri Enstitüsü

Abstract

Tıp alanında sıklıkla kullanılan sağkalım analizi, ilgilenilen sonuç değişkeninin; olayın gerçekleştiği ana kadar geçen süre olduğu veriler için kullanılan istatistiksel yöntemlerin bütünüdür. Sağlık alanında, veri kümelerinin boyutunun artması ve derin öğrenmenin yaygınlaşması ile birlikte, sağkalım analizinde makine öğreniminin kullanımına olan ilgi artmaktadır. Son zamanlarda, derin öğrenme yöntemleri, çeşitli uygulama alanlarında sağkalım analizi problemlerini çözme konusunda büyük ilgi görmüştür. Bu çalışmada sağkalım analizine derin öğrenme tabanlı bir yaklaşım olan DeepSurv uygulanmış ve sonuçlar makine öğrenmesi yöntemlerinden RSF ve klasik istatistiksel yöntemlerden Cox regresyon ile karşılaştırılmıştır. Bu amaçla, türetilmiş veri setleri kullanılarak bir benzetim çalışması gerçekleştirilmiştir. Bu kapsamda örneklem büyüklüğü, sağkalım süresi, bağımsız değişken sayısı, sansür oranının çeşitli düzeylerinin ele alındığı ve bağımsız değişkenlere ilişkin katsayıların tekdüze dağılımdan türetildiği toplam 60 senaryo oluşturulmuştur. Oluşturulan her senaryo ise 100 kez tekrarlanmıştır. Belirlenen senaryolara ek olarak, bağımsız değişken katsayılarına ilişkin ön belirlemenin yapılmadığı, R programlama dilindeki "coxed" paketindeki mevcut haliyle bırakıldığı 60 ayrı senaryo daha oluşturulmuştur. Ayrıca, bu çalışmada evre I akciğer adenokarsinomu veri seti kullanılarak da DeepSurv, RSF ve Cox regresyon yönteminin karşılaştırılması yapılmıştır. Yöntemlerin karşılaştırılmasında Harrell'in C-indeks değeri kullanılmıştır. Verilerin türetilmesi, RSF ve Cox regresyon yöntemlerinin uygulanması R programlama dili (ver. 3.6.3) ile gerçekleştirilmiştir. Derin öğrenmeye ilişkin analizler ise Python programlama dilinde gerçekleştirilmiştir. Yapılan benzetim çalışması sonucunda, bağımsız değişken katsayılarının tekdüze dağılımdan türetildiği senaryolarda tüm yöntemlerin tahminleme başarısı yüksek bulunmuştur. Örneklem büyüklüğü arttıkça yöntemlerin performansı artmıştır. Sansür oranının artması DeepSurv ve RSF yöntemlerinin tahminleme başarısını azaltmıştır. Bağımsız değişken katsayılarının paketteki mevcut haliyle kullanılıp normal dağılımdan türetildiği durumda ise üç yöntem sonucunda da 0,50-0,60 civarında bir C-indeks değeri elde edilmiştir. Gerçek veri setinde yapılan analizler sonucunda ise DeepSurv, RSF ve Cox regresyon yöntemleri benzer sonuçlar vermiştir.

Description

Keywords

Cox regresyon modeli, Derin öğrenme, Regresyon

Citation