Skip to content

Projeto de Ciência de Dados utilizando Python no formato notebook. Objetivo: prever o preço de um imóvel, ou preço de uma diária, do Airbnb baseado nas características dele. Base de dados retiradas do Kaggle: Rio de janeiro Airbnb open data

Notifications You must be signed in to change notification settings

Giodzz/Data-Science-Project

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

29 Commits
 
 
 
 
 
 

Repository files navigation

Projeto de Ciência de Dados

Projeto de Ciência de Dados utilizando Python no formato notebook.
Objetivo: prever o preço de um imóvel, ou preço de uma diária, do Airbnb baseado nas características dele.
Base de dados retiradas do Kaggle: Rio de janeiro Airbnb open data

Contexto do Problema

No Airbnb, qualquer indivíduo que possua um quarto ou propriedade de qualquer tipo (apartamento, casa, chalé, pousada, etc.) pode oferecê-lo para aluguel por diária.

Nesse sentido, a pessoa cria um perfil de host (quem disponibiliza a propriedade para aluguel) e elabora o anúncio do imóvel. Nele, o host descreve as características do local de maneira abrangente, auxiliando os locatários/viajantes na escolha do lugar ideal e tornando a propriedade mais atrativa.

O anúncio oferece diversas opções de personalização, que engloba desde a quantidade mínima de diárias, preço e número de quartos, até regras de cancelamento, taxa adicional para hóspedes extras, a necessidade de verificação de identidade do locatário, entre outras possibilidades.

Objetivo do Projeto

Construir um modelo de previsão de preço que permita que um host possa saber quanto deve cobrar pela diária do seu imóvel ou que um locador possa saber se os preços estão atrativos (abaixo da média para imóveis com as mesma características) ou não para alugar.

Ciência de Dados

O que é?

  • É usar os dados/ informações da empresa para extrair informações valiosas e ajudar na tomada de decisão
  • De forma simples e o que é usado em muitas empresas: é resolver um desafio da empresa usando os dados diponíveis
  • Outra definição: Ciência de Dados está preocupada em resolver os desafios do negócio e saber o que fazer no futuro, fazer alguma previsão que ajudará a tomar o rumo da empresa.
  • Business Intelligence está em descrever como as coisas funcionam / funcionaram até aqui

Diferença de Ciência de Dados e Machine Learning

  • Machine Learning faz parte da Ciência de Dados, é um modelo disponível para ajudar a prever alguma coisa.
  • Machine Learning é o famoso Aprendizado de Máquina.

Onde podemos aplicar ciência de Dados

  • Basicamente, em qualquer empresa, afinal, todas as empresas tem dados disponíveis
  • Na prática, podemos aplicar em todo lugar, uma vez que o objetivo é resolver um desafio do negócio usando dados.

Como funciona um Projeto de Ciência de Dados na prática

São várias etapas importantes:

  1. Entendimento do Desafio que deseja-se resolver
  2. Entendimento da Área / Empresa
  3. Extração / Obtenção de Dados
  4. Ajustes de Dados (Limpeza de Dados)
  5. Análise Exploratória
  6. Modelagem + Algoritmo
  7. Interpretação dos Resultados
  8. Deploy / produção

About

Projeto de Ciência de Dados utilizando Python no formato notebook. Objetivo: prever o preço de um imóvel, ou preço de uma diária, do Airbnb baseado nas características dele. Base de dados retiradas do Kaggle: Rio de janeiro Airbnb open data

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published