Skip to content

2. resources & database

Ghazy edited this page Sep 26, 2022 · 1 revision

sensi.database.query

  1. read_stop_words()

membaca semua kata yang akan dibuang dalam proses normalisasi

output: set
  1. read_all_training()

membaca semua dataset training

output: dict
  1. read_log_likelihood()

membaca semua likelihood sentimen kata (dari training)

output: dict
  1. read_log_prior()

membaca nilai prior (nilai default) sentimen kata (dari training)

output: float

sensi.resources.predictor

  1. pred_total()

nilai total prediksi, seperti predict_nbc namun terformat dengan 4 nilai desimal.

input: string
output: float
  1. per_kalimat()

menghitung nilai prediksi per-kalimat (setiap string sebelum tanda titik)

input: string
output:
{
  "kalimat": "kalimat ke-x",
  "skor": nilai sentimen kalimat ke-x,
  "label": label sentimen( 1 = positif, 0 = negatif),
  "perkata": lihat per_kata()
}
  1. per_kata()

menghitung nilai sentimen setiap kata dalam suatu kalimat

input: string
output:
[
  {
    "kata": kata yang sudah di-normalkan (lihat sensi.resources.processing),
    "skor": nilai sentimen (float),
    "label": label sentimen,
    "freq": jumlah kata dalam kalimat
  }
]

sensi.resources.processing

  1. rem_stop()

membuang kata sambung

input: string
output: list of strings
  1. normalisasi()

me-normalkan string

input: string
output: list of strings
  1. freqs()

menghitung frekwensi string

input: string
output: list of tuples
Clone this wiki locally