-
Notifications
You must be signed in to change notification settings - Fork 1
2. resources & database
Ghazy edited this page Sep 26, 2022
·
1 revision
- read_stop_words()
membaca semua kata yang akan dibuang dalam proses normalisasi
output: set
- read_all_training()
membaca semua dataset training
output: dict
- read_log_likelihood()
membaca semua likelihood sentimen kata (dari training)
output: dict
- read_log_prior()
membaca nilai prior (nilai default) sentimen kata (dari training)
output: float
- pred_total()
nilai total prediksi, seperti predict_nbc namun terformat dengan 4 nilai desimal.
input: string
output: float
- per_kalimat()
menghitung nilai prediksi per-kalimat (setiap string sebelum tanda titik)
input: string
output:
{
"kalimat": "kalimat ke-x",
"skor": nilai sentimen kalimat ke-x,
"label": label sentimen( 1 = positif, 0 = negatif),
"perkata": lihat per_kata()
}
- per_kata()
menghitung nilai sentimen setiap kata dalam suatu kalimat
input: string
output:
[
{
"kata": kata yang sudah di-normalkan (lihat sensi.resources.processing),
"skor": nilai sentimen (float),
"label": label sentimen,
"freq": jumlah kata dalam kalimat
}
]
- rem_stop()
membuang kata sambung
input: string
output: list of strings
- normalisasi()
me-normalkan string
input: string
output: list of strings
- freqs()
menghitung frekwensi string
input: string
output: list of tuples