Publication: Rastgele Orman Yaklaşımı Kullanılarak Çok Değişkenli Uyumlu Regresyon Şeritlerinde Model Seçimi
| dc.contributor.advisor | Cengiz, Mehmet Ali | |
| dc.contributor.author | Sabancı, Dilek | |
| dc.date.accessioned | 2020-07-21T21:35:31Z | |
| dc.date.available | 2020-07-21T21:35:31Z | |
| dc.date.issued | 2019 | |
| dc.department | OMÜ, Fen Bilimleri Enstitüsü, İstatistik Anabilim Dalı | en_US |
| dc.department | Fen Bilimleri Enstitüsü / İstatistik Ana Bilim Dalı | |
| dc.description | Tez (doktora) -- Ondokuz Mayıs Üniversitesi, 2019 | en_US |
| dc.description | Libra Kayıt No: 25599 | en_US |
| dc.description.abstract | Çok değişkenli uyumlu regresyon şeritleri (MARS) makine öğreniminde bir denetimli öğrenme modeli olup, topluluk öğrenimi yöntemi ile elde edilmemektedir. Topluluk öğrenimi yöntemleri makine öğrenimi algoritmalarının istikrarını ve doğruluğunu iyileştirmek için ortak bir amaca hizmet eden yüzlerce ya da binlerce öğrenicinin oluşturduğu örneklemlerden bir araya getirilmektedir. Bu tezde MARS modeli, Rastgele Orman (RF) yönteminin algoritması kullanılarak topluluk öğrenimi yöntemi haline getirilmiştir. Torbalama (Bagging) yöntemi ile oluşturulan 200 adet eğitim ve test verisi Salford Predictive Modeler 8.3 programının MARS analiz motorunda analiz edilmiştir. Analiz sonucunda biri test verisine göre en küçük hata kareler ortalaması (Test MSE) değerini, diğeri en küçük genelleştirilmiş çapraz doğrulama (GCV) değerini veren iki farklı MARS modeller topluluğu oluşturulmuştur. Her bir modelin hata ölçüt kriterleri ve değişken önemleri ortalaması ile düğüm değerlerinin frekans sayıları incelenerek, en iyi modelin tahmini hem Test MSE hem GCV kriterleri için yapılmıştır. Sonuç olarak MARS modeli, en az orijinal veri setinden elde edilen MARS modeli kadar iyi sonuçlar veren yeni bir topluluk öğrenimi yöntemi ile elde edilmiştir. Büyük veri setlerinde daha iyi çalışan MARS modeli, önerilen yöntem sayesinde küçük veri setleri ile de güvenilir sonuçlar vermektedir. | |
| dc.description.abstract | Multivariate Adaptive Regression Splines (MARS) is a supervised learning model in machine learning, not obtained by an ensemble learning method. Ensemble learning methods are gathered from samples comprising of hundreds or thousands of learners that serve a common purpose of improving the stability and accuracy of machine learning algorithms. In this thesis, the MARS model was transformed into an ensemble learning method using the algorithm of the Random Forest (RF) method. 200 training and test sets generated via the bagging method were analyzed in the MARS analysis engine of the Salford Predictive Modeler 8.3 software. At the end of the analysis, two different MARS model sets were created, one yielding the smallest Mean Square Error for the test data (Test MSE), and the other yielding the smallest Generalized Cross Validation (GCV) value. The estimation of the best model was conducted for both the Test MSE and the GCV criteria by examining the error of measurement criteria, variable importance averages and frequencies of the node values for each model. Eventually, a MARS model was obtained via a new ensemble learning method that yields results as good as the MARS model obtained from the original data set. The MARS model, which works better in larger data sets, provides more reliable results with smaller data sets by means of the proposed method. | en_US |
| dc.format | VII, 65 yaprak. : resim, şekil ; 30 sm. | en_US |
| dc.identifier.endpage | 77 | |
| dc.identifier.uri | https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=vjszP7PzV0HebcjFEvDfwFS25MKChQTf9PJTYJCf0wbsMtCuA2ZdNWSQdYuSADB3 | |
| dc.identifier.uri | http://libra.omu.edu.tr/tezler/25599.pdf | |
| dc.identifier.yoktezid | 580234 | |
| dc.language.iso | tr | en_US |
| dc.language.iso | tr | |
| dc.publisher | Ondokuz Mayıs Üniversitesi, Fen Bilimleri Enstitüsü | en_US |
| dc.relation.publicationcategory | Tez | en_US] |
| dc.rights | info:eu-repo/semantics/openAccess | en_US |
| dc.subject | Statistics | en_US |
| dc.subject | İstatistik | |
| dc.subject.other | TEZ DOK S113r 2019 | en_US |
| dc.title | Rastgele Orman Yaklaşımı Kullanılarak Çok Değişkenli Uyumlu Regresyon Şeritlerinde Model Seçimi | |
| dc.title | Model Selection in Multivariate Adaptive Regression Splines Using Random Forest Approach | en_US |
| dc.type | Doctoral Thesis | en_US |
| dspace.entity.type | Publication |
