Publication: Markov Zinciri Monte Carlo Yaklaşımları Kullanarak Kategorik ve Sürekli Tekrarlı Ölçümler İçin Bayesçi Hiyerarşik Modeller
Loading...
Files
Authors
Journal Title
Journal ISSN
Volume Title
Abstract
Both Frequentist and Bayesian statistics schools have improved statistical tools and model choices for the collected data or measurements. Model selection approaches have advanced due to the difficulty of comparing complicated hierarchical models in which linear predictors vary by grouping variables, and the number of model parameters is not distinct. Repeated measurement data can be a longitudinal data type in which repeated measurements (observations) of the same dependent variable are taken at two or more points depending on time, location, or multiple states. Repeated measures are inherently clustered and typically occur in clinical trials, education, cognitive psychology, and treatment follow-up. This thesis aims to apply Bayesian Markov Chain Monte Carlo (MCMC) approaches to different types of repeated measures data and model selection methods for parameter estimates in hierarchical models with various outcome variable types. In this thesis, Bayesian Hierarchical models are applied for three different cases: continuous outcome (case I), categorical outcome (Case II), and mixed outcome (Case III). We identified the best-fitted models under two application datasets using the three MCMC approaches. Comparisons of the fitted models were done using leave-one-out information criteria (LOO-IC), Deviance informaticon criteria (DIC), Information complexity (ICOMP), Watanabe applicable Bayesian information criterion (WAIC), and K-fold cross-validation methods. We used Metropolis-Hastings (MH), Gibbs sampler, and Hamiltonian Monte Carlo approach in all cases to estimate the Bayesian hierarchical models. For these three Bayesian approaches, we fitted the null model, random intercept model, and the full hierarchical random slope models. In all cases, the model with the best predictive performance for the verbal learning test dataset (ACTIVE study dataset) and Arterial Occlusive Diseases (AOD) dataset was the full hierarchical random slope model using the Hamiltonian Monte Carlo approach.
Hem frekansçı hem de Bayesci istatistik okulları, toplanan veriler veya ölçümler için gelişmiş istatistiksel araçlara ve model seçeneklerine sahiptir. Model seçim yaklaşımları, doğrusal tahmin edicilerin değişkenleri gruplayarak değiştiği ve model parametrelerinin sayısının farklı olmadığı karmaşık hiyerarşik modelleri karşılaştırmanın zorluğu nedeniyle ilerlemiştir. Tekrarlı ölçüm verileri, aynı bağımlı değişkenin tekrarlı ölçümlerinin (gözlemlerinin) zamana, mekâna veya çoklu durumlara bağlı olarak iki veya daha fazla noktada alındığı bir boylamsal veri tipi olabilir. Tekrarlı ölçümler, doğası gereği kümelenmiştir ve tipik olarak klinik deneylerde, eğitimde, bilişsel psikolojide ve tedavi takibinde ortaya çıkar. Bu tez çalışmasının amacı, çeşitli bağımlı değişken türleri ile tekrarlı ölçüm verilerine hiyerarşik modellerde parametre tahminleri için Bayesci Markov Zinciri Monte Carlo (MZMC) yaklaşımların farklı veri seti kullanarak uygulanması ve model seçme yöntemlerinin incelenmesidir. Bu tezde, Bayesci Hiyerarşik modeller, üç farklı durum için uygulanmaktadır: sürekli bağımlı değişken (durum I), kategorik bağımlı değişken (durum II) ve karışık bağımlı değişken (durum III). Üç farklı MZMC yaklaşımıyla iki uygulama veri seti için en uygun modeller belirlendi. Kurulan modellerin karşılaştırmaları, bir adet dışarıda bırakma kriteri (LOO-IC), Bayesci sapma kriteri (DIC), Bilgi karmaşıklığı (ICOMP), Watanabe uygulanabilir Bayesci bilgi kriteri (WAIC) ve K-kat çapraz doğrulama ölçütleri kullanılarak yapıldı. Bayesci hiyerarşik modellerini tahmin etmek için her durumda Metropolis-Hastings (MH), Gibbs örneklemesi ve Hamiltoncu Monte Carlo yaklaşımı kullanıldı. Bu üç Bayesci yaklaşımı için boş model, rastgele kesişim modeli ve tam hiyerarşik rastgele eğim modelleri yerleştirildi. Hem sözel öğrenme testi veri seti (ACTIVE çalışma veri seti) hem de Damar Tıkanıklığı Hastalıkları (DTH) veri seti için en iyi tahmin performansına sahip model, her durumda, Hamiltoncu-Markov Zinciri Monte Carlo yaklaşımını kullanan tam hiyerarşik rastgele eğim model oldu.
Hem frekansçı hem de Bayesci istatistik okulları, toplanan veriler veya ölçümler için gelişmiş istatistiksel araçlara ve model seçeneklerine sahiptir. Model seçim yaklaşımları, doğrusal tahmin edicilerin değişkenleri gruplayarak değiştiği ve model parametrelerinin sayısının farklı olmadığı karmaşık hiyerarşik modelleri karşılaştırmanın zorluğu nedeniyle ilerlemiştir. Tekrarlı ölçüm verileri, aynı bağımlı değişkenin tekrarlı ölçümlerinin (gözlemlerinin) zamana, mekâna veya çoklu durumlara bağlı olarak iki veya daha fazla noktada alındığı bir boylamsal veri tipi olabilir. Tekrarlı ölçümler, doğası gereği kümelenmiştir ve tipik olarak klinik deneylerde, eğitimde, bilişsel psikolojide ve tedavi takibinde ortaya çıkar. Bu tez çalışmasının amacı, çeşitli bağımlı değişken türleri ile tekrarlı ölçüm verilerine hiyerarşik modellerde parametre tahminleri için Bayesci Markov Zinciri Monte Carlo (MZMC) yaklaşımların farklı veri seti kullanarak uygulanması ve model seçme yöntemlerinin incelenmesidir. Bu tezde, Bayesci Hiyerarşik modeller, üç farklı durum için uygulanmaktadır: sürekli bağımlı değişken (durum I), kategorik bağımlı değişken (durum II) ve karışık bağımlı değişken (durum III). Üç farklı MZMC yaklaşımıyla iki uygulama veri seti için en uygun modeller belirlendi. Kurulan modellerin karşılaştırmaları, bir adet dışarıda bırakma kriteri (LOO-IC), Bayesci sapma kriteri (DIC), Bilgi karmaşıklığı (ICOMP), Watanabe uygulanabilir Bayesci bilgi kriteri (WAIC) ve K-kat çapraz doğrulama ölçütleri kullanılarak yapıldı. Bayesci hiyerarşik modellerini tahmin etmek için her durumda Metropolis-Hastings (MH), Gibbs örneklemesi ve Hamiltoncu Monte Carlo yaklaşımı kullanıldı. Bu üç Bayesci yaklaşımı için boş model, rastgele kesişim modeli ve tam hiyerarşik rastgele eğim modelleri yerleştirildi. Hem sözel öğrenme testi veri seti (ACTIVE çalışma veri seti) hem de Damar Tıkanıklığı Hastalıkları (DTH) veri seti için en iyi tahmin performansına sahip model, her durumda, Hamiltoncu-Markov Zinciri Monte Carlo yaklaşımını kullanan tam hiyerarşik rastgele eğim model oldu.
Description
Tam Metin / Tez
Citation
Ebrahim, E.A. (2022). Markoz zinciri Monte Carlo yaklaşımları kullanarak kategorik ve sürekli tekrarlı ölçümler için bayesçi hiyerarşik modeller. (Doktora tezi). Ondokuz Mayıs Üniversitesi, Samsun.
WoS Q
Scopus Q
Source
Volume
Issue
Start Page
End Page
99
