Skip to content

Hicoder18/Web-crawler-exercises

Repository files navigation

Python 网络爬虫练习

Python网络爬虫练习,主要技术路线:Requests + bs4 。练习包含两个库(Requests + bs4)常用用法,re语法,4个定向爬虫实例,Scrapy简单入门。

环境

  • Windows 10
  • Python 3.7.5
  • Requests
  • Beautiful Soup

练习顺序

  1. common_requests.py
  2. save_files.py
  3. parser_html.py
  4. search_engine.py
  5. Crawl_Univ_Ranking.py
  6. Crawl_Douban_Book.py
  7. Crawl_BiliBili_Video_Info.py
  8. Crawl_Taobao_Price.py

笔记

学习笔记位于Notes文件夹。

Python+Vue.js+七牛云打造图书推荐网页

  • Requests + bs4 爬取豆瓣图书top250信息保存到 json

  • 将 json上传到七牛云对象存储空间

  • Vue.js + Vue-resource 开发前端页面

/Douban_Reading_List

About

Python Web crawler exercises

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published