Skip to content

Script do meu projeto de conclusão de curso no MBA em Data Science e Analytics pela USP/Esalq.

Notifications You must be signed in to change notification settings

jlgrego/Web-Scraping-vivareal.com.br

Repository files navigation

Análises espaciais sobre o mercado imobiliário de São Paulo - SP

mapa geral

Sobre o projeto

Repositório do meu projeto de conclusão de curso no MBA em Data Science e Analytics pela USP/Esalq. O trabalho tem por objetivo mostrar como a ciência de dados, fazendo uso da linguagem de programação R, pode contribuir com os profissionais avaliadores de imóveis que atuam na cidade de São Paulo, evidenciando o poder que a ferramenta possui quando comparada aos softwares mais comuns voltados para o mercado imobiliário.

O projeto completo contém:

a) Web Scraping no site vivareal.com

O código permite coletar milhares de anúncios imobiliários, armazenando dezenas de variáveis de maneira estruturada e preparadas para analisá-las. Ao final, contempla ainda, a geocodificação dos endereços em latitude e longitude, através de uma API do Google.

b) Impacto da distância para o metrô sobre os valores dos imóveis.

distancia_versus_unitario

Foi possivel perceber, por exemplo, que a queda dos valores é mais acentuada para aqueles que estão numa distância para o metrô entre de 0 a 2.500 metros. A partir daí a nuvem de pontos comoeça a ficar homogêgena e sem um padrão percepitível. Uma hipótese seria que outros modais de transporte passem a influenciar essas regiões mais distantes, como por exemplo trens ou linhas de ônibus, fazendo com que os preços pouco sejam alterados em decorrência da proximidade ao metrô.

O script possui também as análises por linha do metrô.

c) Qual a estação de metrô mais próxima de cada imóvel

base de dados

Essa análise pode ser muito útil, por exemplo, para verificar a média de preços praticados num raio de distância para determinada estação ou grupo delas.

d) Quais as médias de valores das ofertas de apartamentos por bairro e zonas

medias_bairros

Nesse caso foi possível analisar os bairros que registram as maiores e menores médias de valores. As zonas sul e oeste detém juntas, 4 dos 5 bairros com os valores mais altos, enquanto que a zona leste, sozinha, detém a mesma proporção,só que dos menores valores.

e) Relação dos valores dos imóveis e os índices econômicos de cada bairro

indices economicos

Os mapas deixem evidente a correlação que existe entre os preços praticados e os índices socioeconômicos da cidade de São Paulo - SP.

A matriz de correlações corrobora a percepção

matriz_correlacoes

f) Cálculo da estatística I de Moran para detecção de autocorrelação espacial

estatistica_moran

Foi calculado, também, a estatística I de Moran. No caso em questão, esta foi positiva e estatisticamente significante ao nível de 5%, concluindo que os dados sofrem de um efeito de transbordo, o chamado "spillover", que ocorre quando os dados são cercados de vizinhos similares.

moran_diagrama

A partir dela, foi possível a construção do diagrama de Moran. Nele, os dados são distribuídos em quatro quadrantes: Alto-Alto ou “High-High”, que são dados com altos valores próximos a dados com altos valores; Baixo-Baixo ou “Low-Low”, que são dados com baixos valores próximos a dados com baixos valores; Baixo-Alto ou “Low-High”, que são dados com baixos valores próximos a dados com altos valores e Alto-Baixo ou “High-Low”, que são dados com altos valores próximos a dados com baixos valores.

O diagrama pode ser útil, por exemplo, para auxiliar políticas públicas de investimento em infraestrutura e equipamentos urbanos.

Pode também auxiliar investidores, uma vez que detecta regiões, atualmente, com valores baixos e cercados de altos valores, ou seja, estão no quadrante "Low-High". Considerando um potencial efeito de transbordo futuro, essas regiões podem vir a serem impactadas positivamente pelos bairros vizinhos e, consequentemente, uma valorização dos imóveis ali situados.

Cabe ressaltar que esta é uma análise preliminar, devendo ser agregada com uma maior quantidade de variáveis, uma vez que o mercado imobiliário de São Paulo é complexo em muitas regiões.

Sobre os arquivos

analise_sp.R

Script geral.

dados_sp.xlsx

Base de dados analisada.

idh_sp

Base obtida no site https://geosampa.prefeitura.sp.gov.br/PaginasPublicas/_SBC.aspx, utilizada para coleta de índices socioeconômicos do município de São Paulo - SP.

shapefile_municipio

Arquivo shapefile do município de São Paulo - SP, também obtido no site https://geosampa.prefeitura.sp.gov.br/PaginasPublicas/_SBC.aspx, sendo essencial para as análises espaciais.

metro

Arquivo spatial point das estações de metrô da cidade de São Paulo - SP, também obtido no site https://geosampa.prefeitura.sp.gov.br/PaginasPublicas/_SBC.aspx.

O arquivo possui, dentre outras, as coordenadas de cada estação e, assim, possibilita a medição das distâncias de cada uma delas para os imóveis da base.

About

Script do meu projeto de conclusão de curso no MBA em Data Science e Analytics pela USP/Esalq.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages