Publication: Unesco Tarafından Türkiye'de Dünya Miras Listesine Alınan Yerlerin Metin Madenciliği Yöntemleri ile Ziyaretçi Yorumlarının Analizi
Abstract
Bu çalışma, Türkiye'de UNESCO tarafından dünya miras listesine alınan yerlerdeki TripAdvisor Inc. sitesindeki ziyaretçi yorumlarının incelenmesi üzerine yoğunlaşmıştır. Kullanılan verilerin gerçek kişilere ait olduğu ve kişisel veri içermediği belirtilmiştir. Çalışma, herhangi bir kurum ya da kuruluşa ait değildir ve toplamda 23,445 metin verisi üzerinde gerçekleştirilmiştir. Python programlama dili kullanılarak yapılan çalışmada, konu modelleme algoritmaları olan Gizli Dirichlet Ayrımı ve Gizli Anlamsal Analiz uygulanmıştır. Bu algoritmaların kelime ağırlıkları üzerinden karşılaştırmalar yapılmıştır. Ayrıca, metin madenciliğinin bir yöntemi olan duygu analizi, metin verisinin duygu yoğunluğunu incelemek için uygulanmıştır. Çalışmanın odaklandığı nokta, Türkiye'nin yedi bölgesinde bulunan ve dünya miras listesinde yer alan yirmi bir doğal ve kültürel miras hakkında elde edilen sonuçlardır. Uygulanan konu modelleme algoritmaları sonucunda, farklı kelime ağırlıklarında değişiklikler tespit edilmiştir. Karşılaştırmalı analizde, Gizli Dirichlet Ayrımı' nın geniş konu yelpazesini keşfetmek için daha uygun olduğu, Gizli Anlamsal Analiz' in ise belirli anahtar terimleri ve temaları daha net bir şekilde ortaya çıkardığı görülmüştür. Duygu analizi, pozitif, negatif ve nötr olmak üzere üç sınıf ile gerçekleştirilmiş ve çalışmanın sonuçlarına göre metin verisinin büyük ölçüde olumlu yorumlara sahip olduğu tespit edilmiştir. Ayrıca, yüksek sübjektivite değerleri, ziyaretçilerin kişisel deneyim ve görüşlerini paylaştığını ve yorumların bireysel algılar üzerine odaklandığını göstermiştir. Bu çalışma, metin madenciliği yöntemleri kullanılarak büyük veri kümelerinde gizli temaların ve bilgilerin ortaya çıkarılmasına katkı sağlamaktadır.
This study examines visitor comments on the TripAdvisor Inc. website regarding UNESCO World Heritage sites in Turkey. It is important to note that the data used belongs to real individuals and does not contain personal information. The study is independent of any institution or organization and analyzed a total of 23,445 text data. The study utilized the Python programming language and applied topic modeling algorithms such as Latent Dirichlet Allocation and Latent Semantic Analysis. Comparisons were made based on the word weights of these algorithms. Additionally, sentiment analysis, a text mining method, was used to assess the emotional intensity of the comments. The focus of the study is the results obtained for twenty-one natural and cultural heritage sites located in seven regions of Turkey and listed on the World Heritage list. The topic modeling algorithms revealed variations in word weights, with Latent Dirichlet Allocation being more suitable for exploring a wide range of topics, and Latent Semantic Analysis revealing specific key terms and themes more clearly. The sentiment analysis was conducted with three classes: positive, negative, and neutral, and the results indicate that the majority of the comments were positive. Furthermore, the high subjectivity values suggest that visitors shared their personal experiences and opinions, with the comments being focused on individual perceptions. This study contributes to the extraction of hidden themes and information in large data sets through the use of text mining methods.
This study examines visitor comments on the TripAdvisor Inc. website regarding UNESCO World Heritage sites in Turkey. It is important to note that the data used belongs to real individuals and does not contain personal information. The study is independent of any institution or organization and analyzed a total of 23,445 text data. The study utilized the Python programming language and applied topic modeling algorithms such as Latent Dirichlet Allocation and Latent Semantic Analysis. Comparisons were made based on the word weights of these algorithms. Additionally, sentiment analysis, a text mining method, was used to assess the emotional intensity of the comments. The focus of the study is the results obtained for twenty-one natural and cultural heritage sites located in seven regions of Turkey and listed on the World Heritage list. The topic modeling algorithms revealed variations in word weights, with Latent Dirichlet Allocation being more suitable for exploring a wide range of topics, and Latent Semantic Analysis revealing specific key terms and themes more clearly. The sentiment analysis was conducted with three classes: positive, negative, and neutral, and the results indicate that the majority of the comments were positive. Furthermore, the high subjectivity values suggest that visitors shared their personal experiences and opinions, with the comments being focused on individual perceptions. This study contributes to the extraction of hidden themes and information in large data sets through the use of text mining methods.
Description
Citation
WoS Q
Scopus Q
Source
Volume
Issue
Start Page
End Page
104
