Publication:
Mallow'un Cp Kriterine Dayalı Değişken Seçiminin Genetik Algoritma ile Belirlenmesi

Loading...
Thumbnail Image

Date

Journal Title

Journal ISSN

Volume Title

Publisher

Research Projects

Organizational Units

Journal Issue

Abstract

Çoklu regresyon analizinin uygulama aşamasında araştırmacının aday bağımsız değişkenler için geniş bir havuzu vardır ve bunlardan yalnızca birkaçı gerçekten önemlidir. Model için uygun bağımsız değişken alt kümesinin bulunması değişken seçim problemi olarak adlandırılmaktadır. Çoklu regresyonda amaç, bağımlı değişkendeki toplam değişimi en iyi açıklayan açıklayıcı değişkenleri seçmektir. Değişken seçimi amacıyla kullanılan bir çok yöntem geliştirilmiştir. Bu yöntemlerden bazıları model doğruluk ölçütü olan Cp istatistiğini kullanmaktadır ki çoklu regresyonda farklı parametre sayılarına sahip aday modelleri karşılaştırırken en uygun modelin seçimi için geliştirilmiştir. Arama uzayının çok geniş olduğu durumlarda en iyi sonuca ulaşmak için geliştirilen algoritmalardan biri olan genetik algoritmadır. Bu çalışmada bağımlı değişkeni açıklamak için çok fazla sayıda aday açıklayıcı değişkeninin olması durumunda değişken seçimini Genetik Algoritma ile gerçekleştiren ve Cp kriterini amaç fonksiyonu olarak tanımlayan yeni bir yöntem tanıtılmaktadır. Bu yaklaşımın değişken seçiminde başarılı olduğu gerçek bir veri üzerinde karşılaştırmalı olarak gösterilmiştir.
During the implementation of multiple regression analysis, the researcher has a large pool of candidate independent variables, of which only a few are really important. The selecting the best subset of independents variables for explaining the dependent variable is called the variable selection problem. In multiple regression, the aim is to select the best explanatory variables describing the total change in the dependent variable and to keep the size of the model as small as possible during this selection. Different methods for variable selection have been developed in the literature. Some of these methods use Cp statistics, which is a model accuracy criterion, and are developed for the selection of the most suitable model when comparing candidate models with different parameter numbers in multiple regression. The genetic algorithm is one of the algorithms developed to reach the best result when the search space is very wide. The genetic algorithm is one of the algorithms developed to reach the best result when the search space is very wide. In this study, when the number of candidate explanatory variables is large a new method in which variable selection is made by Genetic Algorithm and Cp criteria is defined as objective function, have introduced. This approach has been applied to the real data set and the comparative results have present that it has been successful in selecting most suitable model.

Description

Citation

WoS Q

Scopus Q

Source

Volume

Issue

Start Page

End Page

63

Endorsement

Review

Supplemented By

Referenced By