Publication: Cox Regresyon Modelinde Kayıp Veri Analiz Yöntemleri
Abstract
Sağ kalım analizi zamanla ölçülen değişkenlerin analizinde kullanılan bir yöntemdir. Sağ kalım analizi araştırmalarında klasik istatistik çözümleme yöntemleri yetersiz kalmaktadır. Sağ kalım analizinde en çok kullanılan model Cox tarafından önerilen Cox regresyon modelidir. Cox regresyon modeli ölüm risklerinin ortaya konması açısından ve tıpta hastalıklara ilişkin verilerin incelenmesi ve bu hastalıkları etkileyen faktörlerin saptanması için güçlü bir istatistiksel yöntemdir. Araştırmalarda, örnekleme ilişkin birimlerden elde edilen bilgiler toplanır. Ancak nedenlerin çeşitliliğinden dolayı ya hiçbir bilgi ya da birden fazla değişken bilgisi elde edilemez. Bu durumda, genellikle eksik gözlemlerin bulunduğu değişkenler ihmal edilerek analiz yapılmaktadır. Bu gözlemlerin çalışmadan çıkartılmaları bilgi kaybına neden olur ve çalışma yetersiz kalır. Kayıp veri durumunda, istatistiksel olarak geçerli çıkarsamalar yapabilmek için uygun yöntemlerin kullanılması son derece önemlidir. Bu çalışmada; 137 akciğer hastasına ilişkin bilgilerin toplandığı veri üzerinde analizler yapılmıştır. Analizlerde bazı değişken değerlerine ilişkin verilerin bir kaçının kayıp olduğunu varsayıldı. Böylece bu çalışmada; kayıp veri problemini gideren yöntemlerin, Cox regresyon modelinin performansı üzerindeki etkisi incelendi. Kayıp olan değişkenleri tahmin etmek için; veri havuzu, ortalama, risk regresyon varsayımı, Crowley-Hu tipi Cox-Snell artıkları, orantılı risk regresyon tahmini ve Monte Carlo simülasyonu yöntemleri kullanıldı. Elde edilen bu tahmin değerleri yerine konularak Cox regresyon modeli yardımıyla analizler yapıldı.
Survival analyses is a method which are used in the analysise of variables that eveluated by the time. Classical statistical analysis methods are insufficient in survival analysis researchers. The most used model in survival analysis is the Cox regression model which is proposed by Cox. Cox regression is a powerful statistical method in respect to the estimation of hazard risk and in medical science in investigating of diseases and determinnig the factors which affects these diseases. In researches the information which is obtained, is collected from the sample related departments. However, due to the diversity of information it can be obtained neither a information nor more than one variables information. In these cases, the analysis is carried on by ignoring the variables which have missing observations but if these observations are important for the research; their extraction causes the loss of information. In the case of missing data, it is quite important to use appropriate methods in order to make statistically valid inferences. In this study information were obtained from 137 lung patients. In the analysises, it is assumed that some of the datas related to variable values are missed. So in this study, it is investigated the effects the methods, which resolve the missing data, on the Cox regression model. Data repository, mean, the risk of regression assumptions, Crowley-Hu type Cox-Snell residuals, proportional hazard regression estimation and Monte Carlo simulation methods were used in order to estimate the missing variables. The obtained estimation values were put in their places and the analysises were made with the help of Cox regression model.
Survival analyses is a method which are used in the analysise of variables that eveluated by the time. Classical statistical analysis methods are insufficient in survival analysis researchers. The most used model in survival analysis is the Cox regression model which is proposed by Cox. Cox regression is a powerful statistical method in respect to the estimation of hazard risk and in medical science in investigating of diseases and determinnig the factors which affects these diseases. In researches the information which is obtained, is collected from the sample related departments. However, due to the diversity of information it can be obtained neither a information nor more than one variables information. In these cases, the analysis is carried on by ignoring the variables which have missing observations but if these observations are important for the research; their extraction causes the loss of information. In the case of missing data, it is quite important to use appropriate methods in order to make statistically valid inferences. In this study information were obtained from 137 lung patients. In the analysises, it is assumed that some of the datas related to variable values are missed. So in this study, it is investigated the effects the methods, which resolve the missing data, on the Cox regression model. Data repository, mean, the risk of regression assumptions, Crowley-Hu type Cox-Snell residuals, proportional hazard regression estimation and Monte Carlo simulation methods were used in order to estimate the missing variables. The obtained estimation values were put in their places and the analysises were made with the help of Cox regression model.
Description
Citation
WoS Q
Scopus Q
Source
Volume
Issue
Start Page
End Page
77
