-
Notifications
You must be signed in to change notification settings - Fork 44
mylove1/doubanbook30000
Folders and files
Name | Name | Last commit message | Last commit date | |
---|---|---|---|---|
Repository files navigation
爬虫程序运行请参考PDF 抓取豆瓣的大部分图书。 A project for catch the book of 豆瓣website in china. please see the code source using python3.4 # How to use? 1.Install python3.4 or another python3 version 2.Just install some python library if run was wrong 3.run step1.py 4.run step2.py 5.and so on author:hunterhug 本爬虫程序目录如下: ----book 抓取的图书详情页 ----文学 大分类 ----1000121昆虫记.html 标号+标题 ----文化 ----生活 ----流行 ----经管 ----books 提取的图书列表页 ----文学 大分类 ----茨威格.xlsx 标签 ----文化 ----生活 ----流行 ----经管 ----data 提取的数据库文件 ----doubanbook.book.sql 图书基本信息 ----doubanbook_booktag.sql 图书标签信息 ----image 抓取的图片 ----web 抓取的图书列表页 ----文学 大分类 ----茨威格 标签 ----0.html 列表页 ----1.html ----文化 ----生活 ----流行 ----经管 ----book.html 测试的图书详情页 ----books.html 测试的图书列表页 ----booktag.html 测试图书标签页 ----booktag.xlsx 提取的图书标签页 ----tool 抓取工具
About
爬虫程序运行请参考PDF 抓取豆瓣的大部分图书。 A project for catch the book of 豆瓣website in china. please see the code source using python3.4
Resources
Stars
Watchers
Forks
Releases
No releases published
Packages 0
No packages published