Türkçe e-postaların Doc2Vec ile sınıflandırılması
Citation
Deniz, E., Erbay, H., Coşar, M. (2019). Türkçe e-postaların Doc2Vec ile sınıflandırılması. In 2019 1st International Informatics and Software Engineering Conference (UBMYK) (pp. 1-4). IEEE.Abstract
Bu çalışmada Türkçe e-postalar için makine öğrenmesi teknikleri ile sınıflandırma uygulaması geliştirilerek spam olan Türkçe e-postaların tespit edilmesi hedeflenmiştir. TurkishEmail veri setinden alınan e-postalar eğitim ve test verisi olarak kullanılmıştır. Doc2Vec kütüphanesine ait algoritmalar kullanılarak e-postalar sayısallaştırılmış, sonrasında özellik çıkarımı yapılmıştır. Bu özellikler üzerinden test verileri çeşitli sınıflandırma algoritmaları ile sınıflandırılarak analiz edilmiş ve sonuçlar tartışılmıştır In this study, it was aimed to determine the Turkish e-mails which are spam by developing the application with machine learning techniques for Turkish e-mails. E-mails received from the TurkishEmail data set were used as training and test data. Numerical representation of the e-mails was obtained by using the algorithms of Doc2Vec library and then the feature was extracted. Test data were analyzed by various classification algorithms and the results were discussed.