Skip to content

RodrigoMBarros/Projeto-1_Cdados

Repository files navigation

Esse código trata de um Projeto para a matéria de "ciencia dos dados" do segundo semestre de engenharia mecatronica do Insper.

O objetivo do trabalho era criar um "classificador automático de sentimento" a partir do metodo de "Naive Bayes", que coletasse 
tweets sobre um determnado produto e depois,alimentado por uma planilha de relevância determinada manualmente, classificasse 
uma segunda planilha automaticamente, separando os tweets que se provassem relevantes dos irrelevantes, de acordo com o 
aprendizado da primeira planlha.
Além disso, o código também dispoe de outras menores funções, como limpar caracteres especiais do texto, separar palavras de 
emojis, retirar 'stopwords' do texto, além de comentários sobre o próprio Naive Bayes.

Apesar de o trabalho ter sido orginalmente planejado para ser feito em dupla, por questões de má organização da turma por causa 
do formato online de aula e a falta de contato entre alunos, acabei ficando sem dupla e decidindo seguir assim mesmo. Por ter 
sido feito trabalho individual, o repositório possui poucos commits, o que só seria necessario para o trabalho em dupla a 
distância.

Autor : Rodrigo Carvalho Monteiro de Barros

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published