Skip to content

NewDreamstyle192/Scrapy_Multilevel-link

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Scrapy_Multilevel-link

scrapy框架爬取网页多级链接数据 第一次上传文件,传多了 只需看 ganji_plus 即可 问题: run后没有任何爬取到数据,但确实进入了二级链接

三天过后***************************** 这几天忙着腾讯广告算法大赛数据的清理,没看网易后面的课程,原来只需要用到crawl 中 linkextractors 正则化即可 但crawl适合于链接格式规律的网站,不规律的目前不知道什么解决办法

About

scrapy框架爬取网页多级链接数据

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages