Skip to content

HuangYaJun-J/Spiders

 
 

Repository files navigation

Python3爬虫集合

  • 12306--12306爬虫
    实现了模拟登录12306和查询余票的功能.
  • Avengers--复仇者联盟4评论爬虫
    实现了模拟登录豆瓣,爬取复仇者联盟4的短评内容,并进行情感分析和生成词云.
  • AutoWeather--自动天气爬虫
    根据本机IP获取物理位置,然后查询天气并用语音播报.
  • BaiJiaHao--百家号爬虫
    获取百度热搜事件的搜索结果中百家号所占的比例.
  • Blogs--博客园爬虫
    爬取博客园首页上的博客信息并进行分析.
  • BookingSystem--新的12306爬虫
    在之前的12306爬虫基础上,更新了模拟登录的代码,实现了订购车票的功能.
  • DianPing--大众点评爬虫
    主要破解了大众点评的SVG矢量图反爬.
  • DouYu--斗鱼弹幕爬虫
    利用斗鱼的第三方接口爬取斗鱼直播间的弹幕信息和礼物情况.
  • Expression--表情包爬虫
    使用生产者/消费者模式+队列大量爬取表情包图片.
  • JingMi--静觅博客爬虫
    使用异步协程爬取静觅博客里的博客数据并进行分析.
  • KuGou--酷狗音乐爬虫
    按歌曲名称进行搜索和下载,经测试可以下载付费歌曲.
  • MaoYan--猫眼电影爬虫
    主要破解了猫眼电影的字符集反爬.
  • ProxyPool--IP代理池
    爬取网上的免费IP代理,然后使用Redis数据库搭建代理池,使用异步协程检测代理可用性.
  • WangYiYun--网易云音乐爬虫
    破解网易云音乐的JS加密,然后反爬歌曲的评论并生成词云.
  • Weather--天气爬虫
    爬取指定城市的天气预报情况并发送邮件到指定邮箱.
  • WeiBoUsers--微博用户爬虫
    模拟登录新浪微博.
    爬取微博用户的关注和粉丝数据并进行绘图分析.
  • TianYa--天涯图片爬虫
    破解了天涯社区的Cookie防盗链和时间戳防盗链,下载图片分社区的图片.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%