Projeto Rossmann Predict utilizando dados do Kaggle e ferramentas Python, Heroku, Telegram(bot)
Sobre • Objetivo • Premissas • Tecnologias • Solução • Lições Aprendidas • Próximos Passos • Referências • Autor • Contribuidores • Licença •
O Projeto House Rocket foi um estudo realizado para identificar insights através da análise de dados. Foi utilizado um dataset, do setor imobiliário, disponibilizado na plataforma Kaggle que contém as datas da compra, preço, qtd de quartos, qtd de banheiros, tamanho do imóvel, latidute/longitude, código postal, entre outros dados.
A House Rocket é uma empresa fictícia do setor imobiliário com o objetivo de comprar imóveis com potencial de valorização, revendê-los para obter lucro nas transações.
O Objetivo na exploração dos dados é analisar e identificar:
- Imóveis que estejam abaixo da mediana da região de localização
- Imóveis com boas condições e vista para a água
- Identificar a sazonalidade da data da compra (summer or winter)
- Analisar e confirmar as hipóteses:
- H1: Imóveis que possuem vista para água, são 30% mais caros, na média.
- H2: Imóveis com data de construção menor que 1955, são 50% mais baratos, na média.
- H3: Imóveis sem porão possuem área total 50% maiores do que com porão.
- H4: O crescimento do preço dos imóveis YoY (Year over Year) é de 10%
- H5: Imóveis com 3 banheiros tem um crescimento MoM (Month over Month) de 15%
- Na limpeza dos dados:
- Retirados os ID´s duplicados
- Retirado o ID com número de quartos igual a 33 (possível erro de digitação)
- Imóveis em bom estado foram considerados como condition igual 3 ou 4
- O crescimento anual foi calculado com o valor médio dos imóveis por ano, pois a base de dados só possuia o período de 13 meses.
As seguintes ferramentas foram usadas na construção do projeto:
- Cadastro de usuário
- Cadastro de cliente
- Cadastro de produtos
Antes de começar, você vai precisar ter instalado em sua máquina as seguintes ferramentas: Git, Node.js. Além disto é bom ter um editor para trabalhar com o código como VSCode
# Clone este repositório
$ git clone <https://github.com/tgmarinho/nlw1>
# Acesse a pasta do projeto no terminal/cmd
$ cd nlw1
# Vá para a pasta server
$ cd server
# Instale as dependências
$ npm install
# Execute a aplicação em modo de desenvolvimento
$ npm run dev:server
# O servidor inciará na porta:3333 - acesse <http://localhost:3333>
- A base de dados tem que estar limpa
- As afirmações devem ser bem claras para que a solução da análise confirme ou não as hipóteses
- Nem toda afimação/hipótese tem solução ou será respondida
- Identificar claramente as premissas para alinhamento das expectativas
- Importante saber exatamente o que o cliente precisa.
- Identificar as necessidades mesmo que não esteja no pedido do cliente.
O projeto não teve contribuidores oficiais. A Comunidade Data Science foi consultada em determinados momentos.
GNU General Public License v3.0