GitHub - proyectosdeley/proyectos_de_ley_scraper: Scraper principal.

Scraper for Congress data. Uses Scrapy.

Cronjobs:

scrapy crawl pdfurl >> scraping_pdf_url_log.txt 2>&1
scrapy crawl proyecto >> scraping_proyecto.log.txt 2>&1
scrapy crawl seguimientos >> scraping_seguimientos.log.txt 2>&1
scrapy crawl iniciativa >> scraping_iniciativas.log.txt 2>&1
scrapy crawl updater >> scraping_updater.log.txt 2>&1
scrapy crawl expediente >> scraping_expediente.log.txt 2>&1
python proyectos_de_ley/manage.py update_index --age=24 --settings=proyectos_de_ley.settings.production   >> updating_index.log.txt 2>&1

Configure

You need a config.json file with credentials for the PostgreSQL so PDL can save the scraped data.

{                                                                                
    "drivername": "postgresql",                                                  
    "username": "username for postgresql database",                                                
    "password": "my password",                                                  
    "host": "localhost",                                                         
    "port": "5432",                                                              
    "database": "pdl",                                                           
    "crawlera_user": "optional",                                                    
    "crawlera_pass": "optional",
    "crawlera_enabled": "false",
    "legislature": "2016"
}

Name		Name	Last commit message	Last commit date
Latest commit History 127 Commits
pdl_scraper		pdl_scraper
.gitignore		.gitignore
.travis.yml		.travis.yml
Makefile		Makefile
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Cronjobs:

Configure

About

Releases

Packages

Contributors 3

Languages

proyectosdeley/proyectos_de_ley_scraper

Folders and files

Latest commit

History

Repository files navigation

Cronjobs:

Configure

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Languages

Packages