Abstract:
ABSTRACT
The traditional gold mining sector employs over two million people and spans the majority of Sudan. This study employed data mining methodology to aid decision-making by employing five models: Logistic Regression (LR), Decision Tree (DT), naive bayes (NB), Support Vector Machine (SVM) and K-Nearest Neighbors (K-NN), A fair comparison of their performance was made. These models divide firms into two categories: active, highly productive firms and inactive, low-productivity firms. The learning process was divided into four stages: raw data processing, training, testing, and validation. The results demonstrated that the proposed models successfully classified the state of the company's work. The models achieved high accuracy for DT, LR, and NB classifiers of 1.00, 0.91, and 0.81, respectively. When compared to the other models, the SVM and K-NN models decreased by 0.57 and 0.53, respectively.
ÖZET
Geleneksel altın madenciliği sektörü, iki milyondan fazla kişiyi istihdam etmekte ve Sudan'ın büyük bölümünü kapsamaktadır. Bu çalışma, beş model kullanarak karar vermeye yardımcı olmak için veri madenciliği metodolojisi kullanmıştır: Destek Vektör Makinesi (SVM), lojistik regresyon (LR), naive bayes (NB), karar ağacı (DT) ve en yakın Komşular (K-NN), Performanslarının adil bir karşılaştırması yapıldı. Bu modeller firmaları iki kategoriye ayırır: aktif, yüksek verimli firmalar ve aktif olmayan, düşük verimli firmalar. Öğrenme süreci dört aşamaya ayrıldı: ham veri işleme, eğitim, test etme ve doğrulama. Sonuçlar, önerilen modellerin şirketin çalışma durumunu başarıyla sınıflandırdığını gösterdi. Modeller sırasıyla 1.00, 0.91 ve 0.81'lik DT, LR ve NB sınıflandırıcıları için yüksek doğruluk elde etti. Diğer modellerle karşılaştırıldığında, SVM ve K-NN modelleri sırasıyla 0,57 ve 0,53 azalmıştır.