Robust regresyon tahmin edicilerine yönelik yeni bir yaklaşım
Künye
Toy, A. (2022). Robust regresyon tahmin edicilerine yönelik yeni bir yaklaşım. (Doktora tezi). Ondokuz Mayıs Üniversitesi, Samsun.Özet
Regresyon analizi yöntemleri içerisinde en çok kullanılan en küçük kareler
yöntemi, doğrusal regresyon modeli varsayımları sağlandığında en iyi parametre
tahminini gerçekleştirmektedir. Fakat model varsayımlarının bozulmasına neden olan
bazı etkenler vardır. Bu etkenlerden birisi veri setinin aykırı değer içermesidir. Veri
setindeki diğer gözlemlerden uzak bir şekilde konumlanan aykırı değerler, parametre
tahminini olumsuz anlamda etkilemektedir. Bu yüzden aykırı değerlere karşı dirençli
olan robust regresyon tahmin edicileri geliştirilmiştir. Robust regresyon tahmin
edicileri içerisinde en çok tercih edilen yöntemlerden birisi M-tahmin edicilerdir. Mtahmin ediciler veri setinde bulunan aykırı değerin etkisini azaltarak veya aykırı
değeri veri setinden çıkartarak parametre tahminini gerçekleştirir.
Bu çalışmada veri setinde bulunan gözlem değerlerinin genetik algoritmayla
ağırlıklandırıldığı, yeni bir robust yöntem önerilmiştir. Önerilen yöntem ile Mtahmin ediciler hem simülasyon çalışması yapılarak hem de gerçek veri seti
kullanılarak hata kareler ortalamasının karekökü (HKOK) performans kriterine göre
karşılaştırılmıştır. Karşılaştırma sonucunda önerilen yöntemin M-tahmin edicilerden
daha iyi performans sergilediği gözlenmiştir. The least-squares method, which is the commonly used one among the
regression analysis methods, performs the best parameter estimation when linear
regression model assumptions are made. However, some factors cause the
deterioration of model assumptions. One of these factors is inclusion of outliers by
the data set. Outliers located far from other observations in the data set negatively
affect the parameter estimation. Therefore, robust regression estimators that are
resistant to outliers have been developed. One of the most preferred methods among
robust regression estimators is M-estimators. M-estimators make parameter
estimation by reducing the effect of the outlier in the data set or by removing the
outlier from the data set.
In this study, a new robust method is recommended in which the observation
values in the data set are weighted by genetic algorithm. With the proposed method,
M-estimators are compared according to the root mean square error (RMSE)
performance criterion, both by performing a simulation study and using the real data
set. As a result of the comparison, it is observed that the proposed method
outperformed the M-estimators.