Silahkan gunakan Sensi
Notebook ini dibuat menggunakan virtual environment dengan versi Python 3.8.
Jika, mengalami kesulitan dalam mengatur interpretasi dalam vscode:
- buka pengaturan dalam file
.vscode/settings.json
- ubah nilai dari
python.pythonPath
menjadi lokasi binari python yang digunakan
Hapus .vscode
dan bangun lingkungan secara manual
Instalasi dapat dilakukan dengan perintah berikut:
pip install -r requirements.txt
Jika terjadi kegagalan instalasi dengan menggunakan requirements.txt. Instal dependensi esensial, secara manual:
pip install nltk sastrawi pandas numpy
Setelah instalasi, jangan lupa untuk mengunduh data nltk "punkt" dan "stopwords"
nltk.download('punkt')
nltk.download('stopwords')
gunakan help(nama_fungsi)
dalam python untuk informasi mengenai masing-masing fungsi
fungsi-fungsi normalisasi kalimat. daftar fungsi:
- rem_url(string)
- rem_num(string)
- tokenize(string)
- rem_punc(string)
- rem_stop(string)
- stemm(string)
- freqs(string)
- normalisasi(string)
fungsi-fungsi kalkulasi naive-bayes. daftar fungsi
- kamus_freq(teks, label)
- train_nbc(kamus_freq, train_x, train_y)
- predict_nbc(string, logprior, loglikelihood)
- test_nbc(test_x, test_y, logprior, loglikelihood)
script yang digunakan untuk mengumpulkan dan mamnipulasi data. docstring tidak tersedia.
- googlenews.py
news scrapper, dependecies: newspaper3k, googlenews, pandas, re - twitter.py
twitter scraper, dependency: twint - twittranlate.py
translasi hasiltwitter.py
, dependencies: pandas, translatepy - prepcsv.py
jangan digunakan lingkungan interaktif untuk memanipulasi hasil web scrapping