HIZLANDIRILMIŞ MAKİNE ÖĞRENMESİ ALGORİTMALARI İLE TÜRKÇE SAHTE HABER TESPİTİ
Yükleniyor...
Dosyalar
Tarih
2022-08
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Erişim Hakkı
info:eu-repo/semantics/openAccess
Özet
İnternetin hızla yayılmasıyla insanların haber alma kaynakları da değişmektedir. Televizyon ve gazete gibi geleneksel medya platformlarının yerine twitter ve instagram gibi sosyal medya platformlarının kullanımı artmaktadır. Bu artış ile haberlerin doğruluğunun araştırılmadan paylaşılmasına sahte haberlerin yayılmasına neden olmaktadır. Bilinçsiz sosyal medya kullanımından dolayı sahte haberler kısa sürede yayılmaktadır. Sahte haberler, insanları aldatmaya yönelik yapılan gerçek dışı haberlerdir. Sosyal medya platformlarının çoğunda sahte haber tespiti uzmanlar tarafından yapılmaktadır. Yoğun trafiğe sahip platformlarda uzmanların haberleri inceleme süresi uzadığından, sahte haberler yayılmaktadır. Böylece sahte haberlerin kısa sürede tespit edilmesi önemlidir. Yapılan bu çalışmanın amacı, literatürde eksik olan Türkçe sahte haberleri tespit etmek ve uzmanlara kolaylık sağlamaktır. Literatürde bulunan Sahte Haber Tespiti çalışmalarının çoğu İngiliz diline aittir. Türkçe gibi sondan eklemeli diller için Sahte Haber Tespiti konusunda az sayıda çalışma bulunmaktadır. Bu tez çalışması kapsamında makine öğrenmesi alanında topluluk yaklaşımı kullanılarak sahte haber tespiti için çözüm geliştirilmiştir. Önerilen modelde Boosting yöntemlerinin türleri olan Catboost, Adaboost, Gradient Boosting, Light GBM ve XGBoost algoritmaları kullanılmıştır. Bu algoritmalar, hiper parametre ayarları sayesinde yüksek performans göstermesi ve modele kolayca uyum sağlamaları nedeniyle tercih edilmiştir. Sonuç olarak, yaygın bir şekilde kullanılan performans değerlendirme metrikleri ile önerilen modelin performansı doğrulamıştır. Önerilen modellerden Boosting Algoritmalarının literatürde kullanılan diğer algoritmalara göre daha iyi sonuçlar verdiği gözlemlenmiştir.
With the rapid spread of the Internet, people's sources of information are also changing. The use of social media platforms is increasing instead of traditional media platforms. With this increase, the sharing of the news without investigating the accuracy of the news causes the spread of fake news. Due to the unconscious use of social media, fake news spreads in a short time. Fake news is fake news made to deceive people. In most of the social media platforms, fake news detection is done by experts. Fake news spreads as it takes longer for experts to review news on high-traffic platforms. The aim of this study is to identify the missing Turkish fake news in the literature and to provide convenience to the experts. Most of the Fake News Detection studies found in the literature belong to the English language. There are few studies on Fake News Detection for agglutinative languages such as Turkish. Within the scope of this thesis, a solution has been developed for fake news detection by using the community approach in the field of machine learning. In the proposed model, Catboost, Adaboost, Gradient Boosting, Light GBM and XGBoost algorithms, which are the types of Boosting methods, are used. These algorithms have been preferred due to their high performance. As a result, the performance of the proposed model was validated with widely used performance evaluation metrics. It has been observed that Boosting Algorithms from the proposed models give better results than other algorithms used in the literature."
With the rapid spread of the Internet, people's sources of information are also changing. The use of social media platforms is increasing instead of traditional media platforms. With this increase, the sharing of the news without investigating the accuracy of the news causes the spread of fake news. Due to the unconscious use of social media, fake news spreads in a short time. Fake news is fake news made to deceive people. In most of the social media platforms, fake news detection is done by experts. Fake news spreads as it takes longer for experts to review news on high-traffic platforms. The aim of this study is to identify the missing Turkish fake news in the literature and to provide convenience to the experts. Most of the Fake News Detection studies found in the literature belong to the English language. There are few studies on Fake News Detection for agglutinative languages such as Turkish. Within the scope of this thesis, a solution has been developed for fake news detection by using the community approach in the field of machine learning. In the proposed model, Catboost, Adaboost, Gradient Boosting, Light GBM and XGBoost algorithms, which are the types of Boosting methods, are used. These algorithms have been preferred due to their high performance. As a result, the performance of the proposed model was validated with widely used performance evaluation metrics. It has been observed that Boosting Algorithms from the proposed models give better results than other algorithms used in the literature."
Açıklama
Anahtar Kelimeler
Sahte haber tespiti, Boosting algoritmaları, Makine öğrenmesi, Veri analizi, Yapay zekâ., Fake news detection, Boosting algorithms, Machine learning, Data analysis, Artificial intelligence.