Criar preditor que avalie a probabilidade de uma notícia ser fake
Coletar 200 artigos por site através de webscrapping, aplicar técnicas de NLP(podendo utilizar naive bayes em conjunto) e etiqueta-los como fake ou fato. Ao final, aplicar SVM para predição/score.
- Principais sites de noticias do Brasil(para etiquetar como FATO e não FAKE)
- Principais sites fake do brasil(para etiquetar como FAKE e não fato)
Incluir dados no dataset!