Skip to content

OscarTienda/imdb-web-scraping

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

33 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

imdb-web-scraping

IMDB web scraping done utilizing Scrapy

Autores

  • César Fernández García
  • Oscar Tienda Beteta

Descripción del repositorio

/source: Proyecto scrapy generano con comando scrapy startproject IMDB.

La estructura del proyecto generado es la siguiente:

source/
    scrapy.cfg              # deploy configuration file
    IMDB/                   # project's Python module, you'll import your code from here
        __init__.py
        items.py            # project items definition file
        middlewares.py      # project middlewares file
        pipelines.py        # project pipelines file
        settings.py         # project settings file
        spiders/            # a directory where you'll later put your spiders
            __init__.py

Generamos el spider ejecutando el comando scrapy genspider IMDBspider

        spiders/            # a directory where you'll later put your spiders
            __init__.py
            IMDBspider.py   # spider IMDB

DOI: 10.5281/zenodo.7838158 Zenodo URL: https://zenodo.org/record/7838158#.ZD123XbP1D8

Ejecución del proyecto

Desde una terminal ejecutamos desde directorio source/IMDB/ el comando scrapy crawl imdb_spider

Salida Ejecución: dataset

dataset/
    imdb.csv              # dataset “Películas de IMDB”

About

IMDB web scraping done utilizing Scrapy

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published