Program akan melakukan klasifikasi terhadap tweet berbahasa Indonesia yang dianggap ujaran kebencian (Hate Speech) atau tidak (Non Hate Speech).
Dataset yang digunakan berasal dari repositori berikut id-hatespeech-detection.
Program pertama menggunakan SVM Classifier, XGBoost, dan Neural Network. Dalam prosesnya menggunakan oversampling SMOTE.
Program kedua menggunakan SVM Classifier, XGBoost. Tidak seperti program pertama tidak menggunakan Neural Network, serta ditambah dengan penerapan Stratified KFold CV pada SCM Classifier. Tanpa menggunakan oversampling SMOTE.