COMPLEX NETWORK-BASED LINK PREDICTION IN COMPUTER SCIENCE, SOCIAL SCIENCE, AND MEDICAL SCIENCE PUBLICATIONS IN IRAQ
Yükleniyor...
Dosyalar
Tarih
2023-09
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Erişim Hakkı
info:eu-repo/semantics/openAccess
Özet
Scientific collaboration networks are used to display the relationships between researchers who work on joint research, projects or papers. The analysis of scientific cooperation networks plays an important role in the dissemination of knowledge, the creation of new associations and the emergence of new innovations. Especially in the establishment of national or international scientific cooperation, data obtained from scientific cooperation networks are widely used. In addition, scientific cooperation networks are used in the dissemination of joint studies in similar disciplines or interdisciplinary. Link prediction is widely used in the analysis of new associations based on scientific collaboration. Link prediction is the process of predicting new connections that may arise in the future by looking at the status of existing connections in the network. Link prediction in scientific collaboration networks is important for understanding and strengthening scientific collaborations and increasing efficiency in scientific collaboration. In addition, link prediction plays an important role in increasing interdisciplinary collaboration. Many methods based on data mining, machine learning, and complex network analysis have been proposed and used today for link prediction in networks. Neighborhood-based methods are the most common among the proposed methods. The most important reason why neighborhood-based methods are preferred is the high estimation success with little information in the network. These methods, which work based on the analysis of common neighbors between nodes, reveal similarities between nodes. In this thesis, scientific cooperation networks were created from the publications of Iraqi researchers in the fields of computer science, health sciences and social sciences by looking at the link prediction studies in scientific cooperation networks, and neighborhood-based link prediction processes were carried out in these networks. In the study, data belonging to the joint publications of Iraqi researchers were collected from many sources such as Web of Science, Google Scholar and Microsoft Academic. In link prediction processes, along with neighborhood-based link prediction methods, machine learning methods such as Support Vector Machine (SVM), Random Forest (RF) and Logistic Regression (LR) are also used. Results from experimental studies show that link prediction methods are successful in predicting new links in established scientific collaboration networks. Among the machine learning methods used, the RF classifier was the most successful with 96% accuracy. The study demonstrates the usability of neighborhood-based link prediction methods and machine learning methods in recommendation systems to be created for the dissemination of scientific collaborations
Bilimsel işbirliği ağları, ortak araştırma, proje veya makale çalışmaları yapan araştırmacılar arasındaki ilişkilerin gösteriminde kullanılmaktadır. Bilimsel işbirliği ağlarının analizi, bilginin yayılmasında, yeni birlikteliklerin oluşturulmasında ve yeni inovasyonların ortaya çıkmasında önemli rol oynamaktadır. Özellikle ulusal ya da uluslararası bilimsel işbirliklerinin oluşturulmasında bilimsel işbirliği ağlarından elde edilen veriler yaygın olarak kullanılmaktadır. Ayrıca benzer disiplinlerde ya da disiplinler arası ortak çalışmaların yaygınlaştırılmasında da bilimsel işbirliği ağları kullanılmaktadır. Bilimsel işbirliğine dayalı yeni birlikteliklerin analizinde bağlantı tahmini yaygın olarak kullanılmaktadır. Bağlantı tahmini, ağdaki mevcut bağlantıların durumuna bakarak gelecekte ortaya çıkabilecek yeni bağlantıları tahmin etme işlemidir. Bilimsel işbirliği ağlarında bağlantı tahmini, bilimsel işbirliklerin anlaşılması, güçlendirilmesi ve bilimsel işbirliğindeki verimliliğin artırılması için önemlidir. Ayrıca, disiplinler arası işbirliğinin arttırılmasında da bağlantı tahmini önemli bir rol oynamaktadır. Ağlarda bağlantı tahmini için veri madenciliği, makine öğrenmesi, karmaşık ağ analizi tabanlı pek çok yöntem önerilmiş ve günümüzde kullanılmaktadır. Önerilen yöntemler içerisinde en yaygın olanı ise komşuluk tabanlı yöntemlerdir. Komşuluk tabanlı yöntemlerin tercih edilmesinin en önemli sebebi ise ağdaki az bilgiyle yüksek tahmin başarısıdır. Düğümler arası ortak komşuların analizine dayalı çalışan bu yöntemler düğümler arasındaki benzerlikleri ortaya çıkarmaktadır. Bu tez çalışmasında bilimsel işbirliği ağlarında bağlantı tahmini çalışmalarına bakılarak bilgisayar bilimi, sağlık bilimleri ve sosyal bilimler alanlarında Iraklı araştırmacıların yapmış oldukları yayınlardan bilimsel işbirliği ağları oluşturulmuş ve oluşturulan bu ağlarda komşuluk tabanlı bağlantı tahmini işlemleri gerçekleştirilmiştir. Çalışmada, Web of Science, Google Scholar ve Microsoft Academic gibi bir çok kaynaktan Iraklı araştırmacıların ortak yayınlarına ait veriler toplanmıştır. Bağlantı tahmini işlemlerinde komşuluk tabanlı bağlantı tahmini yöntemleri ile birlikte Destek Vektör Makinesi (SVM), Rastgele Orman (RF) ve Lojistik Regresyon (LR) gibi makine öğrenmesi yöntemleri de kullanılmıştır. Deneysel çalışmalardan elde edilen sonuçlar bağlantı tahmini yöntemlerinin oluşturulan bilimsel iş birliği ağlarında yeni bağlantıları tahmin etmede başarılı olduğunu göstermektedir. Kullanılan makine öğrenimi yöntemleri içerisinden RF sınıflandırıcısı %96 doğruluk oranıyla en başarılı sınıflandırıcı olmuştur. Çalışma, bilimsel işbirliklerinin yaygınlaştırılması için oluşturulacak öneri sistemlerinde komşuluk tabanlı tahmini yöntemleri ve makine öğrenimi yöntemlerinin kullanılabilirliğini göstermektedir."
Bilimsel işbirliği ağları, ortak araştırma, proje veya makale çalışmaları yapan araştırmacılar arasındaki ilişkilerin gösteriminde kullanılmaktadır. Bilimsel işbirliği ağlarının analizi, bilginin yayılmasında, yeni birlikteliklerin oluşturulmasında ve yeni inovasyonların ortaya çıkmasında önemli rol oynamaktadır. Özellikle ulusal ya da uluslararası bilimsel işbirliklerinin oluşturulmasında bilimsel işbirliği ağlarından elde edilen veriler yaygın olarak kullanılmaktadır. Ayrıca benzer disiplinlerde ya da disiplinler arası ortak çalışmaların yaygınlaştırılmasında da bilimsel işbirliği ağları kullanılmaktadır. Bilimsel işbirliğine dayalı yeni birlikteliklerin analizinde bağlantı tahmini yaygın olarak kullanılmaktadır. Bağlantı tahmini, ağdaki mevcut bağlantıların durumuna bakarak gelecekte ortaya çıkabilecek yeni bağlantıları tahmin etme işlemidir. Bilimsel işbirliği ağlarında bağlantı tahmini, bilimsel işbirliklerin anlaşılması, güçlendirilmesi ve bilimsel işbirliğindeki verimliliğin artırılması için önemlidir. Ayrıca, disiplinler arası işbirliğinin arttırılmasında da bağlantı tahmini önemli bir rol oynamaktadır. Ağlarda bağlantı tahmini için veri madenciliği, makine öğrenmesi, karmaşık ağ analizi tabanlı pek çok yöntem önerilmiş ve günümüzde kullanılmaktadır. Önerilen yöntemler içerisinde en yaygın olanı ise komşuluk tabanlı yöntemlerdir. Komşuluk tabanlı yöntemlerin tercih edilmesinin en önemli sebebi ise ağdaki az bilgiyle yüksek tahmin başarısıdır. Düğümler arası ortak komşuların analizine dayalı çalışan bu yöntemler düğümler arasındaki benzerlikleri ortaya çıkarmaktadır. Bu tez çalışmasında bilimsel işbirliği ağlarında bağlantı tahmini çalışmalarına bakılarak bilgisayar bilimi, sağlık bilimleri ve sosyal bilimler alanlarında Iraklı araştırmacıların yapmış oldukları yayınlardan bilimsel işbirliği ağları oluşturulmuş ve oluşturulan bu ağlarda komşuluk tabanlı bağlantı tahmini işlemleri gerçekleştirilmiştir. Çalışmada, Web of Science, Google Scholar ve Microsoft Academic gibi bir çok kaynaktan Iraklı araştırmacıların ortak yayınlarına ait veriler toplanmıştır. Bağlantı tahmini işlemlerinde komşuluk tabanlı bağlantı tahmini yöntemleri ile birlikte Destek Vektör Makinesi (SVM), Rastgele Orman (RF) ve Lojistik Regresyon (LR) gibi makine öğrenmesi yöntemleri de kullanılmıştır. Deneysel çalışmalardan elde edilen sonuçlar bağlantı tahmini yöntemlerinin oluşturulan bilimsel iş birliği ağlarında yeni bağlantıları tahmin etmede başarılı olduğunu göstermektedir. Kullanılan makine öğrenimi yöntemleri içerisinden RF sınıflandırıcısı %96 doğruluk oranıyla en başarılı sınıflandırıcı olmuştur. Çalışma, bilimsel işbirliklerinin yaygınlaştırılması için oluşturulacak öneri sistemlerinde komşuluk tabanlı tahmini yöntemleri ve makine öğrenimi yöntemlerinin kullanılabilirliğini göstermektedir."
Açıklama
Anahtar Kelimeler
Complex networks, link prediction, machine learning, data mining., Karmaşık ağlar, bağlantı tahmini, makine öğrenmesi, veri madenciliği.