Grup Üyelerini Belirlemede İstatistiksel Sınıflandırma Yöntemleri: Karşılaştırmalı Bir Çalışma
Özet
Amaç: Bu çalışmada, önceden tanımlı iki veya daha fazla grubun üyelerini tahmin etmek ve sınıflandırma fonksiyonlarını geliştirmek için diskriminant analizi (DA), çok terimli lojistik regresyon (MLR) ve regresyon ağacı (CART) olarak adlandırılan üç farklı yöntem ele alınmıştır. Bu çalışmanın temel amacı, DA, MLR ve CART analizi kullanılarak sınıflandırma yapmaktır. Gereç ve Yöntemler: Bu üç yöntem arasında en temel farklardan biri, CART parametrik olmayan bir teknik olmasına karşın, diğer ikisi bazı temel varsayımlara dayanan parametrik yöntemlerdir. Bir diğer önemli fark, DA ve MLR bireysel türler için grup üyeliğinin olasılıklarını üretirken, CART sadece farklı türler için ortalama olasılıkları üretir. Bulgular: Bu yöntemlerin uygulaması, Kuzey-Batı Anadolu, Bozcaada, Gökçeada, Edirne ve Istranca olmak üzere toplam beş farklı bölgeden elde edilen, yedi farklı Apodemus türlerine ait iki ayrı veri seti için sınıflandırma yapılmış ve sonuçlar tablolar halinde sunulmuştur. Sonuç: Çalışmada parametrik olmayan bir yöntem olan karar ağacı algoritmalarıyla parametrik yöntemler olarak bilinen diskriminant ve lojistik regresyonun sınıflama özellikleri karşılaştırılmaktadır. Her iki uygulama sonucunda, en yüksek sınıflandırma oranı çok terimli lojistik regresyon analizi ile elde edilmiştir. Objective: In this paper, three different methods are considered such as discriminate analysis (DA), multinomial logistic regression (MLR) and regression and classification tree (CART) in order to develop classification functions and predict the membership of objects into two or more predefined groups. The main purpose of the study is to make classification using DA, MLR and CART analysis. Material and Methods: . One of the main differences among these three methods is that CART is a nonparametric technique, whereas the other two are the parametric method based on some basic assumptions. Another important difference is that DA and MLR produce the probability of group membership for individual species, whereas CART produces only average probability for different species. In the classification using DA, MLR and CART analysis was conducted and the results are presented in tables. Results: The application of the three techniques is illustrated by comparing seven different Apodemus species obtained from five different regions including Northwest Anatolia, Bozcaada, Gökçeada, Edirne and Istranca. Conclusion: In this study, a non-parametric methods, which decision tree algorithms and known as parametric methods, discriminant and logistic regression classification features are compared. In a result of both applications, the highest classification rate are obtained using logistic regression analysis.
Kaynak
Türkiye Klinikleri Biyoistatistik DergisiCilt
9Sayı
1Bağlantı
https://doi.org/10.5336/biostatic.2016-52498https://app.trdizin.gov.tr//makale/TWprek16ZzNOdz09
https://hdl.handle.net/20.500.12809/7145