Baseado no projeto feito no livro de Aurélien Géron: Hands on Machine Learning - Capítulo 2 - End to End Machine Learning Project , tenho como objetivo demonstrar minhas habilidades com Data Storytelling, bem como os conhecimentos de Machine Learning e o funcionamento de um sistema de ML adquiridos ao longo da minha leitura.
Os códigos do projeto foram criados pelo autor do livro, no entanto as documentações, roteiros e comentários foram feitas por mim baseado em minhas experiências anteriores como Analista de Dados.
A Housing Corp é uma empresa(fícticia) que vende casas no estado da California, Estados Unidos. Para estimar os preços de casas à venda, a empresa utiliza dados do Censo Americano que contém o preço mediano de cada "block group" que é um nome usado pelo próprio Censo, mas aqui poderemos chamar de "bairros".
O problema que a equipe de vendas precisa fazer muitos cálculos manualmente em mais de 1000 casas à venda, tornando o processo e a tarefa mais lenta e exaustiva, tornando também a estimativa menos precisa e mais subjetiva.
Por isso, a Housing Corp me designou como cientista de dados para criar um modelo de machine learning que automatize e otimize esse processo. O meu objetivo será estimar os preços médios das casas em novos “bairros” da Califórnia utilizando dados históricos do mesmo Censo, e com isso a equipe de vendas poderá definir os preços das novas casas de forma mais rápida e precisa.