spider 一个简单的豆瓣爬虫,简单得不能再简单的 说明 html_downloader 网页下载类,采用requets进行网页下载 html_parser 网页解析类,采用lxml进行网页解析 html_outputer 内容输出类 url_manager url管理类 apider_main 总的调度程序