Skip to content

Projetos de aprendizado de máquina, análise, exploração, manuseio, visualização e previsão de dados, assim como a retirada de insights a partir destes.

Notifications You must be signed in to change notification settings

barbosarafael/Projetos

Repository files navigation

Projetos de Data Science

drawing

Créditos: https://medium.com/@hacware/memetic-memory-what-memes-can-teach-us-about-machine-learning-a1d487cf066f

Árvore de Decisão (CART)

  • Notebook com um resumo da CART;
  • Regressão e classificação;
  • Resumo;
  • Aplicação;
  • Grid e Random Search.

Qual a probabilidade de ter um pedido atrasado ? (Back order prediction)

  • Hackaton iNeuron

  • Objetivo: Prever se um determinado pedido/produto irá atrasar;

  • Notebook Python (Parte 1):

    • Entendendo o contexto dos dados;
    • Lidando com dados desbalanceados;
    • Identificando que métricas utilizar;
    • Criando uma baseline com a Regressão Logística;
    • Criando uma Análise Exploratória de Dados completa; e
    • Retirando hipóteses e relação entre as variáveis que posteriormente serão features para o modelo principal.
  • Notebook Python (Parte 2):

    • Tratamento de valores nulos;
    • Criação de novas features a partir da Análise Exploratória de Dados;
    • Aplicação da técnica de One Hot Encoding (OHE);
    • Utilização do modelo de Random Forest e verificação de suas métricas;
    • Aplicação de penalidade nos erros para dados desbalanceados;
    • Validação cruzada.

Prevendo o preço das casas a serem vendidas (Kaggle)

  • Python (Pandas, Numpy, Matplotlib, Seaborn, Statsmodels, Sklearn);
  • Análise Exploratória de Dados;
  • Limpeza e transformação de dados;
  • Previsão através do modelo de regressão linear múltipla;
  • Notebook disponível (baseline)
  • Segundo notebook (otimizado) com a melhora da métrica em comparação com a baseline.

Prevendo quem irá sobreviver ou não no Titanic (Kaggle)

  • Python (Pandas, Numpy, Matplotlib, Seaborn, Statsmodels, Sklearn);
  • Análise exploratória de dados;
  • Limpeza e transformação de dados;
  • Previsão através do modelo de regressão logística.
  • Notebook disponível (baseline) (Acc validação = 0.8072, Acc Kaggle = 0.5359)
  • Segundo notebook (otimizado) (Acc validação = 0.8161, Acc Kaggle = 0.5885)

Análise da #BelemAlagada no Twitter

  • Script disponível;
  • R (tidyverse, rtweet, lubridate, tidytext, abjutils, wordcloud2, tm);
  • Limpeza de dados;
  • Análise Exploratória de Dados;
  • WordCloud.

Análise do dataset do COVID-19

  • Script disponível
  • R (tidyverse, reshape2, gganimate, gifski);
  • Análise Exploratória de Dados;
  • GIF.

Retirando dados do Telegram da R-Brasil

  • Script disponível
  • R (tidyverse, httr, rvest, ggthemr);
  • Limpeza e transformação de dados;
  • Análise exploratória de dados.

About

Projetos de aprendizado de máquina, análise, exploração, manuseio, visualização e previsão de dados, assim como a retirada de insights a partir destes.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published