Çok değişkenli Behrens-Fisher problemi altında iki bağımsız grubun ortalama vektörlerini karşılaştırmak için robust bir yaklaşım
Künye
Karaosman, G. (2022). Çok değişkenli Behrens-Fisher problemi altında iki bağımsız grubun ortalama vektörlerini karşılaştırmak için robust bir yaklaşım. (Yüksek lisans tezi). Ondokuz Mayıs Üniversitesi, Samsun.Özet
Çok değişkenli istatistiksel çıkarımda, iki bağımsız grubun ortalama vektörlerinin eşitliğini test etmek için Hotelling T^2 istatistiği kullanılır. Bu istatistiğin kullanılabilmesi için, her iki gruba ait verilerin dağılımının çok değişkenli normal dağılımlı olması ve kovaryans matrislerinin homojenliği varsayımına ihtiyaç vardır. Ancak, homojen kovaryans matrislerinin homojenliği varsayımı gerçek verilerde sağlanamayabilir. Bu varsayımın sağlanamaması durumu literatürde Behrens-Fisher problemi olarak bilinir. Çok değişkenli Behrens-Fisher problemi altında bağımsız gruplar da iki ortalama vektörünün eşitliğini test etmek için birkaç çalışma vardır. Ancak önerilen bu testler veri setindeki aykırı değerlere karşı duyarlıdır. Bu çalışmada hem çok değişkenli Behrens-Fisher problemi altında çalışabilen hem de veri setindeki aykırı değerlerden etkilenmeyen bir test önerilmektedir. Önerilen yaklaşımın performansı hem temiz (aykırı değer eklenmemiş) hem de kirli (aykırı değer eklenmiş) veri setlerinde gerçekleştirilen simülasyon çalışmalarıyla incelenmiştir. Önerilen yaklaşımın temiz veri setlerinde diğer test istatistiklerine yakın sonuçlar verdiği, kirli veri setlerinde ise hem tip-1 hata hem de testin gücü bakımından çok daha başarılı olduğu görülmüştür. Böylece önerilen yaklaşımın çok değişkenli Behrens-Fisher problemi altında aykırı değerlerden etkilenmeden iki bağımsız grubun ortalama vektörlerinin karşılaştırılmasında kullanılabileceği gösterilmiştir. Ayrıca, gerçek veri uygulamalarında önerdiğimiz yaklaşımı kullanmak için MVTests paketinde bir R fonksiyonu oluşturulmuştur. In multivariate statistical inference, the Hotelling T^2statistic is used to test the equality of mean vectors for two independent groups. This statistic needs the multivariate normality and homogeneous covariance matrices assumptions. However, homogeneous covariance matrices assumption may not be provided in real applications. Failure of this assumption is known in the literature as the Behrens-Fisher problem. There are several studies to test the equality of two mean vectors for the independent groups under the multivariate Behrens-Fisher problem. But these studies do not interest in outliers at data sets. In this study, we propose solving problems caused by multivariate Behrens-Fisher and outliers in the dataset. We compare our proposed approach with other approaches regarding empirical size and power at simulated data that are both clean (no outlier added) and contaminated (outlier added). Thus we show that our proposed approach can be used to test the equality of mean vectors for two independent groups under multivariate Behrens-Fisher problem without being affected by outliers in the data. Moreover, we construct an R function in the MVTests package to use our proposed approach for real data applications.