Abstract:
ABSTRACT
Phishing attacks have become a critical threat to the security of online users. Traditional phishing detection methods often face challenges in accurately identifying malicious websites and emails. In this research, we propose a novel model for phishing detection using a bagging ensemble with random forest, decision tree, gradient boosting, and k-nearest neighbors' algorithms. Those classifiers combine with ensemble learning to improve the overall detection performance, where the dataset is trained and tested by this model. The results showed that this model can handle noisy data and variations in phishing techniques, and also reduce the impact of outliers leading to higher accuracy and overall performance.
ÖZET
Kimlik avı saldırıları, çevrimiçi kullanıcıların güvenliği için kritik bir tehdit haline gelmiştir. Geleneksel kimlik avı tespit yöntemleri, kötü niyetli web sitelerini ve e-postaları tanımlamada genellikle zorluklarla karşılaşmaktadır. Bu araştırmada, rastgele orman, karar ağacı, gradyan artırma, k-en yakın komşu algoritmaları ile bir torbalama topluluğu kullanarak kimlik avı tespiti için yeni bir model öneriyoruz. Bu sınıflandırıcılar, veri kümesinin bu model tarafından eğitildiği ve test edildiği genel algılama performansını iyileştirmek için topluluk öğrenimi ile birleştirilmektedir. Sonuçlar, bu modelin gürültülü verilerle ve kimlik avı tekniğindeki varyasyonlarla başa çıkabildiğini, ayrıca aykırı değerlerin etkisini azaltarak daha yüksek doğruluk ve genel performans sağladığını göstermiştir.