- Notebook com um resumo da CART;
- Regressão e classificação;
- Resumo;
- Aplicação;
- Grid e Random Search.
-
Hackaton iNeuron
-
Objetivo: Prever se um determinado pedido/produto irá atrasar;
-
- Entendendo o contexto dos dados;
- Lidando com dados desbalanceados;
- Identificando que métricas utilizar;
- Criando uma baseline com a Regressão Logística;
- Criando uma Análise Exploratória de Dados completa; e
- Retirando hipóteses e relação entre as variáveis que posteriormente serão features para o modelo principal.
-
- Tratamento de valores nulos;
- Criação de novas features a partir da Análise Exploratória de Dados;
- Aplicação da técnica de One Hot Encoding (OHE);
- Utilização do modelo de Random Forest e verificação de suas métricas;
- Aplicação de penalidade nos erros para dados desbalanceados;
- Validação cruzada.
- Python (Pandas, Numpy, Matplotlib, Seaborn, Statsmodels, Sklearn);
- Análise Exploratória de Dados;
- Limpeza e transformação de dados;
- Previsão através do modelo de regressão linear múltipla;
- Notebook disponível (baseline)
- Segundo notebook (otimizado) com a melhora da métrica em comparação com a baseline.
- Python (Pandas, Numpy, Matplotlib, Seaborn, Statsmodels, Sklearn);
- Análise exploratória de dados;
- Limpeza e transformação de dados;
- Previsão através do modelo de regressão logística.
- Notebook disponível (baseline) (Acc validação = 0.8072, Acc Kaggle = 0.5359)
- Segundo notebook (otimizado) (Acc validação = 0.8161, Acc Kaggle = 0.5885)
- Script disponível;
- R (tidyverse, rtweet, lubridate, tidytext, abjutils, wordcloud2, tm);
- Limpeza de dados;
- Análise Exploratória de Dados;
- WordCloud.
- Script disponível
- R (tidyverse, reshape2, gganimate, gifski);
- Análise Exploratória de Dados;
- GIF.
- Script disponível
- R (tidyverse, httr, rvest, ggthemr);
- Limpeza e transformação de dados;
- Análise exploratória de dados.