Publication:
Veri Madenciliğinde Sınıflandırma ve Kümeleme Algoritmaları ile COVID-19 Şüphesi Taşıyan Hastaların Değerlendirilmesi

Loading...
Thumbnail Image

Date

Journal Title

Journal ISSN

Volume Title

Publisher

Research Projects

Organizational Units

Journal Issue

Abstract

Veri madenciliği büyük hacimdeki karmaşık verilerin işlenebilmesine olanak sağlayarak, anlamlı bilgi ve örüntüleri ortaya çıkararır. Böylece karar vericilerin karar süreçlerine destek olur. Günümüzde karar verme sürecine ihtiyaç duyulan birçok sektörde olduğu gibi sağlık sektöründe de veri madenciliği teknikleri yaygın bir şekilde kullanılmaktadır. Koronavirüs pandemisi ilk günden itibaren tüm dünyayı fiziksel, mental ve ekonomik olarak tehdit etmiştir. Türkiye'de etkileri ağırlıklı olarak 2020-2022 yıllarında hissedilmiş olsa da, Koronavirüs hastalığı yok olmamış olup etkilerini sürdürmektedir. Koronavirüs hastalığı ve pandemi dönemi hala anlaşılmaya çalışılmakta, konuyla ilgili güncel çalışma ve yayımlar devam etmektedir. Bu bağlamda hastalığı anlamak; teşhis konulması, bireylere ve ülkelere olan etkilerin azaltılması ve alınacak önlemler açısından son derece kritik bir rol oynamaktadır. Bu çalışmada, COVID-19 şüphesi ile hastaneye başvurarak test yaptırmış olan hastaların sınıflandırma algoritmaları kullanılarak test sonuçlarının tahmin edilmesi ve kümeleme analizi ile test sonucu pozitif ve negatif olan hastalara ilişkin değerlendirmelerin yapılması amaçlanmaktadır. Sınıflandırma için oluşturulan veri seti karar ağacı, K-en yakın komşu, Naive Bayes, lojistik regresyon, rastgele orman ve destek vektör makineleri algoritmalarıyla KNIME 5.2.2 kullanılarak modellenmiştir. En yüksek doğruluk oranı 0,796 ve en yüksek tanısal üstünlük oranı 15,340 ile rastgele orman modelinde elde edilmiştir. En düşük doğruluk 0,690 ve en düşük tanısal üstünlük oranı 5,729 değeri ile K-en yakın komşu modelinde elde edilmiştir. Kümeleme aşamasında veri seti, COVID-19 test sonucu negatif ve pozitif olan hastalar için ayrılmış, iki ayrı iki aşamalı kümeleme analizi gerçekleştirilmiştir. Uygulama için SPSS Clementine 12.0 programı kullanılmıştır. Her iki durumda da iki küme elde edilmiştir.
Data mining enables the processing of large volumes of complex data and reveals meaningful information and patterns. Thus, it supports the decision processes of decision makers. Today, data mining techniques are widely used in the health sector, as in many sectors where decision-making is needed. The coronavirus pandemic has threatened the whole world physically, mentally and economically since day one. Although its effects were felt mainly in 2020-2022 in Turkey, the coronavirus disease has not disappeared and continues its effects. The coronavirus disease and the pandemic period are still being understood, and current studies and publications on the subject continue. In this context, understanding the disease plays a critical role in terms of diagnosis, reducing the effects on individuals and countries, and the measures to be taken. This study aims to predict the test results of patients who have been tested by applying to the hospital with suspicion of COVID-19 by using classification algorithms and to make evaluations of patients with positive and negative test results using cluster analysis. For classification, the created data set was modeled using KNIME 5.2.2 with decision tree, K-nearest neighbor, Naive Bayes, logistic regression, random forest and support vector machines algorithms. The highest accuracy rate of 0.796 and the highest diagnostic superiority rate of 15.340 were obtained in the random forest model. The lowest accuracy was obtained in the K-nearest neighbor model with a value of 0.690 and the lowest diagnostic superiority rate with a value of 5.729. For clustering, the data set was separated for patients with negative and positive COVID-19 test results and two different two-stage clustering analyzes were performed. SPSS Clementine 12.0 program was used for the application. In both cases, two clusters were obtained.

Description

Citation

WoS Q

Scopus Q

Source

Volume

Issue

Start Page

End Page

127

Endorsement

Review

Supplemented By

Referenced By