Yazar "Karaca, Mehmet Fatih" seçeneğine göre listele
Listeleniyor 1 - 5 / 5
Sayfa Başına Sonuç
Sıralama seçenekleri
Öğe Examining the Impact of Feature Selection Methods on Text Classification(Science & Information Sai Organization Ltd, 2017) Karaca, Mehmet Fatih; Bayir, SafakFeature selection that aims to determine and select the distinctive terms representing a best document is one of the most important steps of classification. With the feature selection, dimension of document vectors are reduced and consequently duration of the process is shortened. In this study, feature selection methods were studied in terms of dimension reduction rates, classification success rates, and dimension reduction-classification success relation. As classifiers, kNN (k-Nearest Neighbors) and SVM (Support Vector Machines) were used. 5 standard (Odds Ratio-OR, Mutual Information-MI, Information Gain-IG, Chi-Square-CHI and Document Frequency-DF), 2 combined (Union of Feature Selections-UFS and Correlation of Union of Feature Selections-CUFS) and 1 new (Sum of Term Frequency-STF) feature selection methods were tested. The application was performed by selecting 100 to 1000 terms (with an increment of 100 terms) from each class. It was seen that kNN produces much better results than SVM. STF was found out to be the most successful feature selection considering the average values in both datasets. It was also found out that CUFS, a combined model, is the one that reduces the dimension the most, accordingly, it was seen that CUFS classify the documents more successfully with less terms and in short period compared to many of the standard methods.Öğe Metin madenciliği yöntemi ile haber sitelerindeki köşe yazılarının sınıflandırılması(Karabük Üniversitesi, 2012) Karaca, Mehmet Fatih; Görgünoğlu, Salihİnternetin günümüzde hayatımızın her alanına girmiş olmasıyla birlikte verilerin yaşantımızdaki boyutu ve değeri artmıştır. Büyük miktarlardaki verilerden anlamlı bilgi çıkarmak günümüzde kişi ve firmaları bilgi temelli ekonomi çağında diğerlerinden bir adım öne geçirmektedir. İnternette bulunan bütün veriler bir çok kişi için gerekli veya faydalı değildir. Verilerden katkı sağlayacak bilgilerin elde edilmesi için çeşitli madencilik teknikleri uygulanmalıdır. Veri madenciliği yapısal veriler üzerinde işlemleri gerçekleştirir. Metinler yapısal veriler değildir. Metinlerin, veri madenciliği tekniklerinin uygulanabileceği yapısal veri haline dönüştürülmesi işlemi metin madenciliği ile gerçekleştirilir. Veri madenciliği teknikleri uygulanmadan önce verilerin hazırlanması, ön işlemden geçirilmesi gerekmektedir. Metinlerden bilgi çıkarmak, metni sınıflandırmak, aranan bilgiye kısa sürede ulaşmak metin madenciliğinin popülaritesini arttırmış, bu konuda çalışmalar yapılmasını gerekli hale getirmiştir.Metin sınıflandırma, sistemin önceden tanımlanmış kategorilere eğitim dokümanlarını kullanarak verilen metnin sınıfına karar vermesi işlemidir.Bu çalışmada haber sitelerindeki köşe yazılarının otomatik olarak alınması ve ekonomi, spor, sağlık, eğitim, yaşam olarak sınıflandırılması gerçekleştirilmiştir.Öğe Türk ve dünya edebiyatından eserlerin doğal dil işlemeyle incelenmesi(2020) Karaca, Mehmet Fatih; Bayır, ŞafakYayınevleri tarafından ilkokul, ortaokul ve lise seviyesindeki öğrenciler için okumakitapları hazırlanmaktadır. Bu çalışmada ortaokul öğrencilerine yönelik olan eserlerkullanılmıştır. 5 yayınevinden aynı isimli 5 Türk ve 5 dünya edebiyatından eser, doğal dilişleme teknikleriyle Türkçe dil bilgisi kuralları çerçevesinde analiz edilmiştir. Bu çalışmaylaeserlerin yazımında ve eserlerdeki Türkçe kullanımında yayınevleri arasındaki farklılık vebenzerlikleri tespit etmek, aynı zamanda Türkçenin kullanım özelliklerini ortaya koymakamaçlanmıştır. İşlemlerin gerçekleştirilmesinde geliştirilen yazılım ve Türkçe doğal dilişleme kütüphanesi Zemberek kullanılmıştır. Eserlerin analiziyle elde edilen sonuçlar 5yayınevinde oransal olarak benzeşmektedir ve yayınevleri arasındaki farklılıklar genelanlamda düşük seviyededir. Yalnızca çözümlenemeyen kelime sayısı, eserlerin ortalamacümle sayısı, eserlerdeki ortalama kelime sayısı, cümledeki ortalama kelime sayısı venoktalama işaretlerinin (nokta ve virgül) kullanım oranında yayınevleri arasında ayrışmagörülmektedir. Tüm eserler birlikte değerlendirildiğinde cümledeki ortalama kelime sayısı6.45, kelimedeki ortalama harf sayısı 5.97 ve kelimenin ortalama hece sayısı 2.55’tir.Eserlerde en fazla kullanılan harfler A, E ve İ; en az kullanılanlar J, F ve P’dir. Kelimeler ençok B, K ve D; en az J, I ve L harfleriyle başlamakta ve en çok N, E ve A; en az C, B ve Jharfleriyle bitmektedir. En çok kullanılan hece tipi sessiz-sesli, en az kullanılan hece tipisesli-sessiz-sessizdir. Kelimelerin çoğunluğu ünlü ve ünsüz uyumuna uymaktadır. Ayrıcakelimelerin yaklaşık yarısı isim türünde ve ek almadan kullanılmıştır. Çekim eklerinintoplam kullanım sayısı yapım eklerinin toplam kullanım sayısından fazladır. 17 noktalamaişaretinden 12 tanesi eserlerde yer almaktadır. Bununla birlikte farklı yayınevleri tarafındanhazırlanıp yayımlanan aynı isimli eser içeriklerinin kısmen veya bütünüyle farklılaşabildiğigörülmektedir.Öğe Türkçe doğal dil işleme: ses bilgisi ve morfolojik analiz(2024) Karaca, Mehmet Fatih; Bayir, ŞafakBu çalışmada Türkçe Doğal Dil İşleme teknikleriyle 230 cümlenin ses bilgisi ve morfolojik analizi gerçekleştirilmiştir. İşlemlerde Zemberek’le entegre şekilde çalışan Visual Studio ortamında ve C# dilinde geliştirilen yazılım kullanılmıştır. Zemberek’te bulunan 130 ekten 120’sinin Türkçe dil bilgisindeki ek karşılıkları belirlenmiştir. Zemberek eklerinden 13’ü kök adı, 46’sı çekim eki, 39’u yapım eki ve 22 tanesi diğer eklerdir (birleşik fiil, fiilden sıfat fiil ve fiilden zarf fiil türeten). Veri kümesindeki 230 cümlenin 744 kelimeden oluştuğu, kelimelerin ortalama 5.30 harf ve 2.26 heceli olduğu, hecelerin yaklaşık yarısının ünsüz-ünlü birleşiminden oluşan CV hece türünde bulunduğu ve kelimelerin yarısından fazlası için Zemberek tarafından 1 çözümleme üretildiği belirlenmiştir. Ayrıca, kelimelerin yarısının ek almadığı, çekim eklerinin diğer ek türlerinden daha çok kullanıldığı, yapım eklerinden sonra yapım veya çekim eklerinin, diğer eklerden (birleşik fiil ve fiilden sıfat fiil türeten) veya çekim eklerinden sonra ise yalnızca çekim eklerinin geldiği tespit edilmiştir. İsim türündeki kelime sayısının diğer türlerdeki kelime sayısından, ünlü ve ünsüz uyum kurallarına uyan kelime sayısının uymayan kelime sayısından daha yüksek olduğu görülmüştür.Öğe Üç boyutlu sanal model ile Türk işaret dili simülasyonu(Karabük Üniversitesi, 2018) Karaca, Mehmet Fatih; Bayır, ŞafakGönderici ve alıcı durumundaki insanlar arasında duygu, düşünce, inanç, tutum ve davranışların sözlü, sözsüz, yazılı veya elektronik olarak aktarılmasına iletişim denir. İnsanlar arasında en yaygın kullanılan iletişim türü, temeli duyma ve konuşmaya dayanan sözlü iletişimdir. Fakat işitme kaybından kaynaklı olarak işitme engellilerin bu iletişim yöntemini ya kullanamadıkları ya da sınırlı olarak kullanabildikleri görülmektedir. İşitme engelli bireyler iletişim ihtiyacını karşılamak üzere temeli görmeye dayanan işaret dillerini kullanırlar. İşaret dilleri, işitme engellilerin kendi aralarında ve işiten bireylerle iletişimde kullandıkları en temel yöntemdir. İşaret dillerinin dil bilgisi kuralları ve işaretleri ülkeden ülkeye farklılık göstermektedir. Dünyadaki herkesin kullanabileceği doğal olmayan uluslararası bir işaret dili var olmasına karşın her ülke kendi işaret dilini kullanmaktadır. Bu dil daha çok uluslararası seviyedeki kongre ve konferanslarda tercih edilmektedir. Doğal bir dil olan Türk İşaret Dili (TİD) Türkiye'deki işitme engellilerin ana dilidir. TİD, kendine has dil bilgisi, parmak alfabesi ve işaretleri bulunan, el, yüz ve mimiklerden oluşan görsel bir dildir. Dünyadaki en eski işaret dillerinden biri olarak kabul edilen TİD'in 1953 yılında sağır dilsiz okullarında kullanımının yasaklanmasıyla bu dilin kurulması ve yaygınlaşması engellenmiştir. Bu yasağın bir sonucu olarak okullarda işaret dili öğretilememiş, tek ve ortak işaretler üretilmemiş, TİD bölgeden bölgeye farklılık gösteren bir dil halini almıştır. Bu tez çalışması için Türkçe içeriklerin 3 Boyutlu Sanal Model tarafından TİD'de simüle edildiği bir uygulama geliştirilmiştir. İşaretler, modelin eklem noktalarında konumsal ve/veya açısal değişiklik yapılmasıyla meydana gelmektedir. İşitme Engelliler İlkokulu öğretim programları incelenmiş ve çalışmada kullanılmak üzere 3 derlem oluşturulmuştur. 1. derlemde TİD dersi 1. sınıfında yer alan 21 temaya ait 400 kelime, 2. derlemde aynı dersin 2. sınıfında yer alan 9 temaya ait 130 cümle, 3. derlemde ise Türkçe dersinde yer alan 4 temaya ait 100 cümle yer almaktadır. Geliştirilen uygulamada derlemlerde yer alan içerikler dışında el şekilleri ve el dışı işaretler gibi TİD'e ait unsurlar ve etkileşimli çeviri modülleri yer almaktadır. TİD öğretiminde birliktelik sağlanmasına katkı sunacağı düşünülen bu uygulama, TİD dersinde veya TİD öğretiminin yapıldığı ortamlarda bireysel ve toplu kullanıma uygun şekilde tasarlanmıştır. Uygulamada doğal dil işleme ve TİD simülasyonu olmak üzere iki işlem süreci yer almaktadır. Doğal dil işleme analizlerine göre birtakım kurallar belirlenmiş ve bu kurallar çerçevesinde simülasyon öncesi cümlenin ara metni elde edilmiştir. Ara metin, uygulama ekranında TİD metnine dönüştürülmüş ve simülasyon gerçekleştirilmiştir. Derlemlerin doğal dil işleme teknikleriyle analizi neticesinde elde edilen sonuçların yanı sıra TİD'e, işaretlere, işaret gösteriminde kullanılan model eklem noktalarına ve el şekillerine ait veriler detaylandırılarak sunulmuştur.