Sayı ile ifade edilen zaman serilerinde kayıp gözlem analizi: Trafik kazası örneği
Künye
Koçal, F. (2021). Sayı ile ifade edilen zaman serilerinde kayıp gözlem analizi: Trafik kazası örneği. (Yüksek lisans tezi). Ondokuz Mayıs Üniversitesi, Samsun.Özet
Sayım verisi bir olayın sayısını veya olayın meydana gelme sayısını ifade eder. Bu sayılar negatif olmayan tam sayı değerli değişkenlerlerden oluşur. Bu tarz değişkenleri incelerken sıklıkla kullanılan yöntemlerden birisi Poisson zaman serisidir. Bu çalışma Poisson zaman serisinde kayıp verinin yarattığı etkiyi farklı kayıp veri doldurma yöntemleri ile incelemektedir. Bu amaçla Poisson zaman serisine uygun gerçek bir veri seti üzerinde inceleme yapılmıştır. Çalışmada kayıp veri doldurma yöntemlerinden çoklu doldurma, çoklu doldurma zincir denklemi, interpolasyon, son gözlemi ileriye taşıma, Kalman ve hareketli ortalama yöntemleri ele alınmıştır. Bu yöntemlerin alt yöntemleri ile birlikte toplamda sekiz farklı kayıp veri doldurma yöntemi kullanılmıştır. Veri setinde kayıp veriler oluşturularak bu yöntemler ile doldurulmuş ve yeni veri setleri elde edilmiştir. Elde edilen sekiz farklı veri seti üzerinde Poisson zaman serisi modeli oluşturulmuş ve tam veri seti ile elde edilen katsayılar ile kıyaslama yapılmıştır. Sonuç olarak en başarılı çoklu kayıp veri doldurma yönteminin Kalman yöntemi olduğu, en kötü yöntemin ise MICE midastouch yöntemi olduğu görülmüştür. Census data refers to the number of events or the number of times an event occurred. These numbers consist of non-negative integer-valued variables. Poisson time series is one of the frequently used methods when examining such variables. This study examines the effect of missing data in Poisson time series with different missing data imputation methods. For this purpose, a real data set suitable for Poisson time series was examined. In the study, missing data imputation methods such as multiple imputation, multiple imputation chain equations, interpolation, last observation carried forward, Kalman and moving average methods are discussed. A total of eight different missing data imputation methods were used together with the sub-methods of these methods. Missing datasets are drawed from data set and new full datasets are obtained by imputing using selected imputation methods. The Poisson time series model was created on the eight different data sets obtained and the comparison was made with the coefficients obtained with the full data set. As a result, it was concluded that the most successful multiple loss data filling method was Kalman method, and the worst method was MICE midastouch method.