Karabuk University

APACHE SPARK'TA ZAMANLA İLGİLİ ÖZELLİKLER KULLANILAN VPN AĞI TRAFİK AKIŞININ SINIFLANDIRILMASI

Show simple item record

dc.contributor.author ASWAD, Salma Abdullah
dc.date.accessioned 2021-02-12T10:50:44Z
dc.date.available 2021-02-12T10:50:44Z
dc.date.issued 2021-02-05
dc.identifier.uri http://acikerisim.karabuk.edu.tr:8080/xmlui/handle/123456789/1082
dc.description.abstract ABSTRACT The aim of this research thesis is to classify the VPN network traffic flow using the time-related features on the Apache Spark and machine learning model Artificial Neural Network (ANN). This research work presented the detection and classification of network traffic flow and time related features in Virtual Private Network (VPN) with the help of ANN and Apache Spark. The proposed solution, the ANN and Apache Spark engine trained on feature of VPN with multiple nodes. Any node receives a bundle when no processing is needed, as all the routing processing has been completed already. The only task that the node is required to do is to forward the bundle to the right next-hop when the time comes, and it appears in the sight of contact. Applying the proposed ANN prevents unnecessary processing and flooding found in common VPN network traffic classification. The proposed system uses 80% of the dataset for training while 20% is used for the testing and validating with 10-cross fold validation and 50 epochs of training. This is the first study that introduces and utilizes ANN and Apache Spark engine to implement VPN network traffic flow classification to the best of our knowledge. The categorical features classification of VPN and Non-VPN features concerning overall classification precision where VPN classification precision stands at 96.76%; however, the Non-VPN stands at 92.56%. The ANN + Spark Engine technique outperforms the convolutional neural network compared to the stacked auto-encoder network on CIC-Darknet2020 and ISCXVPN2016, respectively. ÖZET Bu tezin amacı, Apache Spark üzerindeki zamanla ilgili özellikleri ve makine öğrenimi modeli yapay sinir ağını kullanarak VPN ağ trafik akışını sınıflandırmaktır. Halihazırda bugünün internet trafiğinin yarısı VPN / VPN olmayan gibi protokoller kullanılarak şifrelenmiştir. Bu, klasik derin paket inceleme yaklaşımlarının paket yüklerini analiz etmesini engeller. Son zamanlarda araştırmacılar, eğitilmiş modellerinin şifrelenmiş ağ trafiği yüklerinde kalıpları bulabildiğini ve uygulamaları bu kalıplara göre sınıflandırabildiğini iddia eden bir derin öğrenme yaklaşımı yayınladılar. Bu çalışma, bu iddianın doğru olma ihtimalinin düşük olduğunu göstermektedir, çünkü kullanılan veri kümesi, herhangi bir yük verisi eklemeden son derece doğru sınıflandırmaya izin veren özellikleri ortaya çıkarmaktadır. Bu araştırmanın uygulanması için, MATLAB 2019b, VPN ağlarının artan talebi evrimsel teknolojiyi harekete geçirdiğinden kullanılmıştır. Önerilen yapay sinir ağının uygulanması, gereksiz işlemlerin yanı sıra yaygın VPN ağ trafiği sınıflandırmasında bulunan taşmaları önleyecektir. Önerilen sistem veri setinin %80'i üzerinde eğitilirken, % 20'si 10 katlık doğrulama ve 50 eğitim dönemi ile test ve doğrulama için tutulur. Bildiğimiz kadarıyla, bu, VPN ağ trafiği akışının sınıflandırmasını uygulamak için yapay sinir ağlarını ve apache spark motorunu kullanan ilk çalışmadır. % 96,76 doğrulukla YSA ve Apache Spark Engine kullanan VPN sınıflandırması yapılmış, % 92,56 doğrulukla YSA ve Apache Spark Engine kullanan VPN olmayan sınıflandırması gerçekleştirilmiştir. Bu çalışma, paket düzeyinde şifrelenmiş trafik sınıflandırması için CIC-Darknet2020 adlı veri setini kullanan bir yaklaşımın, bir paketi belirli bir uygulamaya yüksek doğrulukla doğrudan eşlemesine izin verdiği için, paket başlık bilgilerini dahil edemeyeceğini göstermiştir. Yalnızca VPN dışı trafik dikkate alındığında, veri kümesindeki tüm paketlerin %96,76'sı bir uygulama ile ilişkilendirilebilir. Kalan paketler yine de bu akışı kullanan uygulamalara göre tahmin edilerek yüksek olasılıkla sınıflandırılabilir. en_EN
dc.language.iso tr en_EN
dc.subject Network, Classification, Traffic-Flow, VPN, Apache Spark, ANN, Deep Learning. en_EN
dc.subject Ağ, sınıflandırma, trafik akışı, VPN, apache spark, YSA, derin öğrenme. en_EN
dc.title APACHE SPARK'TA ZAMANLA İLGİLİ ÖZELLİKLER KULLANILAN VPN AĞI TRAFİK AKIŞININ SINIFLANDIRILMASI en_EN
dc.title.alternative CLASSIFICATION OF VPN NETWORK TRAFFIC FLOW USING TIME RELATED FEATURES ON APACHE SPARK en_EN
dc.type Thesis en_EN


Files in this item

This item appears in the following Collection(s)

Show simple item record

Search DSpace


Advanced Search

Browse

My Account