Karabuk University

DIABETIC RETINOPATHY DETECTION USING ENSEMBLE TRANSFER DEEP LEARNING

Show simple item record

dc.contributor.author AL-DUJAILI, SHUHAD IMAD HADI
dc.date.accessioned 2023-06-23T14:40:28Z
dc.date.available 2023-06-23T14:40:28Z
dc.date.issued 2023-05
dc.identifier.uri http://acikerisim.karabuk.edu.tr:8080/xmlui/handle/123456789/2736
dc.description.abstract ABSTRACT Diabetic retinopathy is one of the eye diseases that is a complication of diabetics and can affect vision and even lead to blindness. This disease affects the blood vessels in the retina, which is one of the main marks that help to detect this disease. Diabetic retinopathy detection is a challenging process requiring specialists and too much time to process each image. However, computer science algorithms, including machine learning and deep learning, can help physicians and specialists detect diabetic retinopathy effectively. In this study, a novel diabetic retinopathy approach is introduced. The approach is based on a well-known Kaggle image dataset containing images of four stages (mild, severe, moderate, and proliferate) besides the normal condition.The images are preprocessed (resizing, normalization) and over-sampled (balanced) to get all categories with similar percentages. The balancing is essential so the trained model will treat all categories with similar weights. After that, the data augmentation process is applied to increase the number of training images and supply the training process with different conditions of the same images. The dataset is split into training and testing subsets. The training process includes two different scenarios; the first is based on the unbalanced version of the dataset, while the second is done using the balanced dataset. In the first and second scenarios, many deep learning models are used as base models for the entire deep model. The classification part of the entire deep models consists of flatten, dropout, and dense layers. The outputs layer uses the softmax function, and the training process is applied using the categorical cross-entropy loss function. All scenarios use the Adam optimizer and 50 epochs with an early stop condition. The DL models used include VGG-16, VGG-19, Inception, Xception, EfficientNet, and NasNetLarge. The main contribution of the current study is using the ensemble learning. The study suggests building an ensemble of the trained models in order to minimize the categories classification errors and improves the performance. Besides those scenarios and for comparative aims, another training scenario is proposed. The stages of diabetic retinopathy are grouped into one category named DR, so the categories became DR and NO_DR. As a result, an ensemble of the VGG, EfficientNet, and Xception is built. All models are evaluated using the performance evaluation metrics (accuracy, precision, recall, and F1-score). Results indicate that the ensemble model achieves the best performance against all individual models with 92% accuracy for the balanced multi-class scenario. The accuracy is enhanced to 99.46% in the case of using the binary class classification scenario (DR and NO_DR). A detailed comparison between the current study and related ones is performed. The comparison proved that the current study either outperformed the previous studies' performance or used more challenging options. ÖZET Diyabetik retinopati, şeker hastalarının komplikasyonu olan ve görmeyi etkileyip körlüğe yol açabilen bir göz hastalığıdır. Bu hastalık, bu hastalığın tespit edilmesine yardımcı olan ana işaretlerden biri olan retinadaki kan damarlarını etkiler. Diyabetik retinopati tespiti, her bir görüntü üzerinde çalışmak için bu işin uzmanlarına, çok fazla zaman ve uzman gerektiren zorlu bir süreçtir. Ancak, makine öğrenimi ve derin öğrenme gibi bilgisayar bilimi algoritmaları, doktorların ve uzmanların diyabetik retinopatiyi etkili bir şekilde tespit etmelerine yardımcı olabilir. Bu çalışmada, yeni bir diyabetik retinopati yaklaşımı tanıtılmaktadır. Bu yaklaşım, normal durumun yanı sıra dört evreyi (hafif, şiddetli, orta ve proliferatif) görüntüleri içeren bilinen bir Kaggle görüntü veri kümesine dayanmaktadır. Görüntüler, ön işleme (yeniden boyutlandırma, normalleştirme) ve örnekleme (dengeleme) ile tüm kategorilerin benzer yüzdeleri ele alınır. Dengeleme, eğitimli modelin tüm kategorilerini benzer ağırlıklarla ele alması için önemlidir. Daha sonra eğitim görüntülerinin sayısını artırmak ve aynı görüntülerin farklı durumlarıyla eğitim sürecini sağlamak için veri artırma işlemi uygulanır. Veri kümesi eğitim ve test alt kümelerine ayrılmıştır.Eğitim süreci iki farklı senaryoyu içermektedir; ilki veri setinin dengesiz versiyonuna dayanırken, ikincisi dengeli veri seti kullanılarak gerçekleştirilir. İlk ve ikinci senaryolarda, birçok derin öğrenme modeli tüm derin model için temel modeller olarak kullanılır. Tüm derin modellerin sınıflandırma kısmı, düzleştirme, bırakma ve yoğun katmanlardan oluşur. Çıktı katmanı, softmax işlevini kullanmaktadır ve eğitim süreci, kategorik çapraz entropi kayıp işlevini kullanarak uygulanır. Tüm senaryolar, Adam optimizasyon algoritmasını ve erken durdurma koşulu ile 50 dönem kullanır. Kullanılan DL modelleri arasında VGG-16, VGG-19, Inception, Xception, EfficientNet ve NasNetLarge bulunmaktadır. Mevcut çalışmanın ana katkısı, topluluk öğrenmenin kullanılmasıdır. Bu Çalışma, kategorilerin sınıflandırma hatalarını en aza indirgemek ve performansı korumak için eğitilmiş modellerin topluluğunu oluşturmayı önermektedir. Bu senaryoların yanı sıra ve karşılaştırmalı amaçlar için, başka bir eğitim senaryosu önerilmiştir. Diyabetik retinopatinin aşamaları, DR olarak adlandırılan tek bir kategoriye gruplandırılmıştır. böylece kategoriler DR ve NO_DR olarak değişmiştir. Sonuç olarak, VGG, EfficientNet ve Xception'ın bir topluluğu oluşturulmuştur. Tüm modeller, performans değerlendirme metrikleri (doğruluk, hassasiyet, hatırlama ve F1 skoru) kullanılarak değerlendirilmiştir. Sonuçlar, toplu modelin, dengelenmiş çok sınıflı senaryo için %92 doğruluk ile tüm bireysel modellere karşı en iyi performansı gösterdiğini göstermektedir. Doğruluk, ikili sınıf sınıflandırma senaryosu (DR ve NO_DR) kullanıldığında %99.46'ya yükselmiştir. Mevcut çalışma ile ilgili karşılaştırmalar arasında ayrıntılı bir karşılaştırma yapılmıştır. Karşılaştırma, mevcut çalışmanın ya bir önceki çalışmaların performansını aştığını ya da daha zorlu seçenekler kullandığını kanıtlamıştır. en_EN
dc.language.iso en en_EN
dc.subject Diabetic Retinopathy, Blood Vessels, Machine Learning, Deep Learning, Transfer Learning and Image Classification. en_EN
dc.subject Anahtar Kelimeler: Diyabetik Retinopati, Kan Damarları, Makine Öğrenmesi, Derin Öğrenme, Transfer Öğrenme ve Görüntü Sınıflandırma. en_EN
dc.title DIABETIC RETINOPATHY DETECTION USING ENSEMBLE TRANSFER DEEP LEARNING en_EN
dc.title.alternative TOPLULUK TRANSFERİ DERİN ÖĞRENME YÖNTEMİ KULLANARAK DİYABETİK RETİNOPATİ TESPİTİ en_EN
dc.type Thesis en_EN


Files in this item

This item appears in the following Collection(s)

Show simple item record

Search DSpace


Advanced Search

Browse

My Account