Skip to content

Türkçe metinlerde kelime sıklıklarından metinler arası benzerlik bulma aracı - Similatrity detection tool by word frequency in Turkish texts (Documentation only available in Turkish)

Notifications You must be signed in to change notification settings

ileri/tirtikLama

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

33 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

tırtıkLama

Türkçe metinlerde kelime tekrar sayılarından yola çıkarak ve makine öğrenimi yöntemlerini kullanarak metinler arası benzerlik oranını bulan ve olası kopya ve intihalleri tespit etmeyi amaçlayan bir araçtır.

Neden tırtıkLama?

Tırtıklamak, bir nesnede bulunan çentik veya aşınmadan meydana gelen ve genellikle dokunarak da hissedilebilen tırtık kelimesinden türeyen ve kelime kökenine bağlı anlam olarak bir nesnede tırtık oluşturmak anlamına gelmekte olup, günlük kullanımda ise belli etmeden çalmak, aşırmak anlamında kullanılmaktadır.

Türk Dil Kurumunda ise argo olarak anlamı verilen tırtıklamak, "Aşırmak, çalmak" olarak tarif edilmektedir.

Bu araç da Ondokuz Mayıs Üniversitesi Bilgisayar Mühendisliği Lisans programı 7. Dönem seçmeli dersi olan Makine Öğrenimine Giriş dersi final projesinde, Türkçe metinlerde kelime frekansına bağlı olarak benzerlik ve kopya tespiti konusunda geliştirilmeye başlanıldığı için "kopya çekmek, aşırmak" anlamlarına gelen tırtıklamak fiilinin olumsuz emir kipinde kullanılan hali olan tırtıklama sözcüğünün, sevdiğimiz bir hayvan olan Lama ya da ithafta bulunması için L harfi büyütülerek tırtıkLama olarak belirlenmiştir.

Kodlar Hakkında

Bu proje, Makine Öğrenimi dersi final projesi kapsamında geliştirilmiştir. Bu nedenle kısıtlı süre içerisinde yazılan ve iyileştirilme yapılmasına fırsat kalmadan teslim edilen proje, teslim edildiği hali ile yayınlanmaktadır.

Kodlarda tespit edilebilecek olası bir hata/yanlış/eksiklik/standart dışılık gayet normal olup, kodun teslim edilmiş halinin orijinalliğini bozmamak için en azından bir dalda (branch) aynen korunmaya devam edilecektir.

About

Türkçe metinlerde kelime sıklıklarından metinler arası benzerlik bulma aracı - Similatrity detection tool by word frequency in Turkish texts (Documentation only available in Turkish)

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages