Publication: Veri Yapılarına Göre Uygulanacak Regresyon Analizlerinin İncelenmesi ve Uygulamalı Karşılaştırılması
Abstract
Regresyon analizi, ilgilenilen veri setinde yer alan bağımlı değişken ile ilişki içerisinde olabileceği düşünülen açıklayıcı değişken/değişkenler arasındaki bağıntıyı ortaya koyan matematiksel modeli oluşturmada kullanılan yöntemlerin başında gelmektedir. Modelin kurulumunda değişkenlerin özellikle de bağımlı değişkenin veri yapısı ve ölçek düzeyi önem arz etmektedir. Bağımlı değişkenin yapısına göre kullanılacak olan regresyon analizi yöntemi farklılık göstermekte ve ilişkiyi açıklamada kurulacak olan modelin yapısı ve yorumlanması değişiklik göstermektedir. Bu çalışmada sosyal bilimler alanında karşılaşılabilecek veri yapılarına göre farklı regresyon analiz yöntemleri incelenmiş ve günlük hayat verileri ile çalışma desteklenmiştir. Bu bağlamda analiz yöntemleri olarak çoklu doğrusal regresyon analizi, beta regresyon analizi, probit regresyon analizi, tobit regresyon analizi, temel bileşenler regresyon analizi, ridge regresyon analizi, poisson regresyon analizi ve negatif binom regresyon analizleri incelenmiş ve analizler sonunda kurulan modeller benzer veri yapıları için eşleştirilmiştir. Bu eşleştirmeler karşılaştırmalı olarak incelenerek hangi modelin veri setini daha iyi açıkladığı tespit edilmeye çalışılmıştır. Araştırmada kullanılan analizler için R Studio, Stata ve IBM SPSS paket programları kullanılmış olup analizlerin her bir program için uygulanış süreçleri görsel olarak anlatılmıştır.
Regression analysis is one of the methods used to create the mathematical model that reveals the relationship between the explanatory variable / variables that may be related to the dependent variable in the data set of interest. The data type and scale level of the variables, especially the dependent variable, are important in the construction of the model. The regression analysis method to be used according to the structure of the dependent variable differs and the structure and interpretation of the model to be established in explaining the relationship varies. In this study, different regression analysis methods according to the data structures that can be encountered in the field of social sciences were examined and the study with daily life data was supported. In this context, multiple linear regression analysis, beta regression analysis, probit regression analysis, tobit regression analysis, principal components regression analysis, ridge regression analysis, poisson regression analysis and negative binomial regression analysis were examined and the models established at the end of the analyzes were matched for similar data structures. These mappings were examined comparatively and it was tried to be determined which model explained the data set better. R Studio, Stata and IBM SPSS package programs were used for the analyzes used in the research, and the application processes of the analyzes for each program were visually explained.
Regression analysis is one of the methods used to create the mathematical model that reveals the relationship between the explanatory variable / variables that may be related to the dependent variable in the data set of interest. The data type and scale level of the variables, especially the dependent variable, are important in the construction of the model. The regression analysis method to be used according to the structure of the dependent variable differs and the structure and interpretation of the model to be established in explaining the relationship varies. In this study, different regression analysis methods according to the data structures that can be encountered in the field of social sciences were examined and the study with daily life data was supported. In this context, multiple linear regression analysis, beta regression analysis, probit regression analysis, tobit regression analysis, principal components regression analysis, ridge regression analysis, poisson regression analysis and negative binomial regression analysis were examined and the models established at the end of the analyzes were matched for similar data structures. These mappings were examined comparatively and it was tried to be determined which model explained the data set better. R Studio, Stata and IBM SPSS package programs were used for the analyzes used in the research, and the application processes of the analyzes for each program were visually explained.
Description
Citation
WoS Q
Scopus Q
Source
Volume
Issue
Start Page
End Page
134
