Publication: Türkiye'deki İllerin Girişimcilik ve İnovasyon Potansiyellerinin Dayanıklı Kümeleme Analizi Yöntemleri ile İncelenmesi
Abstract
Ülke ekonomilerinin gelişmesi için girişimcilik ve inovasyon potansiyellerinin harekete geçirilmesi çok önemlidir. Bu nedenle bu çalışmada Türkiye'deki illerin girişimcilik ve inovasyon göstergelerine göre kümelenmesi amaçlanmaktadır. Kümeleme analizi, geniş veri kümelerini analiz etmek ve faydalı bilgileri çıkarmak için yaygın olarak kullanılan, bilgi keşfi ve veri madenciliği tekniklerinden biridir. Kümeleme analizinin öncelikli amacı gözlemleri aralarında heterojen fakat kendi içerisinde homojen bir şekilde gruplara (kümelere) ayırmaktır. Pek çok istatistiksel yöntemde olduğu gibi veri setindeki aykırı değerler klasik kümeleme algoritmalarını olumsuz etkilemektedir. Bu durumda dayanıklı kümeleme algoritmaları kullanılması gerekmektedir. Bu çalışmada kullanılan veri seti aykırı değerler içerdiği için klasik kümeleme algoritmalarının yanı sıra dayanıklı kümeleme algoritmaları kullanılmış ve sonuçlar karşılaştırılmıştır. Bu çalışmada klasik yaklaşım olarak hiyerarşik kümeleme algoritmaları, hiyerarşik olmayan k-ortalamalar algoritması ve robust alternatif olarak budanmış k-ortalamalar ve TCLUST algoritmaları kullanılarak Türkiye'deki iller girişimcilik ve inovasyon göstergelerine göre kümelenmişlerdir. Anahtar Kelimeler: Kümeleme Analizi, K-ortalamalar Algoritması, Budanmış k-ortalamalar Algoritması, TCLUST Algoritması, Girişimcilik, İnovasyon
It is of great significance to mobilise entrepreneurship and innovation potentials for the advancement of national economies. Therefore, the objective of this study is to cluster the provinces in Turkey according to their entrepreneurship and innovation indicators. Cluster analysis is one of the widely used knowledge discovery and data mining techniques to analyse large data sets and extract useful information. The primary objective of cluster analysis is to classify observations into groups or clusters that are heterogeneous among themselves but homogeneous within themselves. As in many statistical methods, the presence of outliers in the data set negatively affects classical clustering algorithms. In this case, it is recommended that robust clustering algorithms be used. Since the data set used in this study comprises outliers, robust clustering algorithms as well as classical clustering algorithms were utilised and the results were compared. In this study, hierarchical clustering algorithms as a classical approach, non-hierarchical k-means algorithms, trimmed k-means algorithms, and TCLUST algorithms as robust alternatives were used to cluster provinces in Türkiye according to entrepreneurship and innovation indicators. Keywords: Clustering Analysis, K-means Algorithm, Trimmed K-means Algorithm, TCLUST Algorithm, Entrepreneurship, Innovation
It is of great significance to mobilise entrepreneurship and innovation potentials for the advancement of national economies. Therefore, the objective of this study is to cluster the provinces in Turkey according to their entrepreneurship and innovation indicators. Cluster analysis is one of the widely used knowledge discovery and data mining techniques to analyse large data sets and extract useful information. The primary objective of cluster analysis is to classify observations into groups or clusters that are heterogeneous among themselves but homogeneous within themselves. As in many statistical methods, the presence of outliers in the data set negatively affects classical clustering algorithms. In this case, it is recommended that robust clustering algorithms be used. Since the data set used in this study comprises outliers, robust clustering algorithms as well as classical clustering algorithms were utilised and the results were compared. In this study, hierarchical clustering algorithms as a classical approach, non-hierarchical k-means algorithms, trimmed k-means algorithms, and TCLUST algorithms as robust alternatives were used to cluster provinces in Türkiye according to entrepreneurship and innovation indicators. Keywords: Clustering Analysis, K-means Algorithm, Trimmed K-means Algorithm, TCLUST Algorithm, Entrepreneurship, Innovation
Description
Keywords
Citation
WoS Q
Scopus Q
Source
Volume
Issue
Start Page
End Page
50
