crawlers-real-estate

A webcrawler project for real estate websites without an API

This project designed to build multiple spiders with different settings to crawl and gather real estate data through different very basic websites and some which do not make data available through an API nor allow scraping.

-Database So far, a MySQL database has been created to programmaticaly manage and index URLs. Further on, all real estate data shall be added to this or to a different database.

-Spiders Only one spider has been added, to crawl through one specific domain. Multiple spiders will be created, especially for multiple domains

There is a lot to be defined yet

Name		Name	Last commit message	Last commit date
Latest commit History 106 Commits
rec_scrapy		rec_scrapy
.gitignore		.gitignore
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

crawlers-real-estate

About

Releases

Packages

Languages

gbassisp/crawlers-real-estate

Folders and files

Latest commit

History

Repository files navigation

crawlers-real-estate

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages