Bayes ve bazı ikili kümeleme algoritmalarının zootekni verilerinde kullanımı
Künye
Bayyurt, L. (2022). Bayes ve bazı ikili kümeleme algoritmalarının zootekni verilerinde kullanımı. (Doktora Tezi). Ondokuz Mayıs Üniversitesi, Samsun.Özet
Bu çalışmada, iki farklı veri seti kullanılarak farklı ikili kümeleme algoritmalarının kümeleme performanslarının karşılaştırılması amaçlanmıştır. Çalışmada ilk olarak Sheepnet (Ağ oluşturma yoluyla Avrupa Birliği (AB) ve Türk koyun verimliliğini artırmaya yönelik uzmanlık ve deneyim paylaşımı) platformuna ait koyun yetiştiriciliğinde gebelik sorunları ve kuzu ölümlerini azaltmak amacıyla geliştirilen çözümler ve faydalarını içeren veri seti kullanılmıştır. Sheepnet veri seti kullanılarak yapılan ikili kümeleme analizi için Bimax, Xmotif ve Bayes algoritmaları kullanılmıştır. Algoritmaların ikili kümeleme performansları CKSB skoru, ortalama küme boyutları kullanılarak karşılaştırılmıştır. Karşılaştırma sonucunda en iyi ikili kümele performansını Bayes algoritması vermiştir. Çalışmada ikinci olarak, 2018 yılında yapılan arıcılık faaliyetlerindeki öneminden dolayı seçilen beş ilden (Artvin, Düzce, Hatay, Kırklareli ve Muğla) dört yaygın bal arısı ırklarının genetik açıdan durumları, filogenetik ilişkileri ve popülasyonlarının genetik yapılarının belirlenmesi amacıyla 150 koloni ve 30 lokus içeren veri seti kullanılmıştır. Bal arısı veri seti kullanılarak yapılan ikili kümeleme analizi için Bimax, Xmotif, Bayes, CC ve Plaid algoritmaları kullanılmıştır. Algoritmaların ikili kümeleme performansları HKO, VAR, CKSB skoru ve ortalama küme boyutları kullanılarak kullanılarak karşılaştırılmıştır. Algoritmaların ikili kümeleme performansları CKSB skoru, ortalama küme boyutu, HKO ve VAR değerleri kullanılarak karşılaştırılmıştır. Karşılaştırma sonucunda en iyi ikili kümele performansını Bimax algoritması vermiştir. In this study, it was aimed to compare the clustering performances of different binary clustering algorithms using two different data sets. In the study, firstly, the data set of the Sheepnet (Expertise and experience sharing to increase European Union (EU) and Turkish sheep productivity through networking) platform was used, which includes the solutions and benefits developed to reduce gestation problems and lamb deaths in sheep breeding. Bimax, Xmotif and Bayes algorithms were used for biclustering analysis using Sheepnet dataset. The biclustering performances of the algorithms were compared using the CKSB score and average cluster sizes. As a result of the comparison, Bayes algorithm gave the best bicluster performance. Secondly, in the study, a data set containing 150 colonies and 30 loci was used to determine the genetic status, phylogenetic relationships and genetic structures of the populations of four common honey bee breeds from five provinces (Artvin, Düzce, Hatay, Kırklareli and Muğla) selected due to their importance in beekeeping activities carried out in 2018. Bimax, Xmotif, Bayes, CC and Plaid algorithms were used for biclustering analysis using honey bee dataset. The biclustering performances of the algorithms were compared using MSR, VAR, CKSB score and average cluster sizes. The biclustering performances of the algorithms were compared using the CKSB score, average cluster size, MSR and VAR values. As a result of the comparison, Bimax algorithm gave the best binary cluster performance.