Skip to content

gsy44355/Crawler

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Java 微博相册爬虫

  • 使用MySQL数据库,Java版本11
  • 支持随时停止,断点重传
  • 支持自行扩展

使用方式

  • 下载工程
  • MySQL运行SQL文件夹下sql文件
  • 修改application-DataSource.properties文件中MySQL连接串
  • 示例代码是可以直接运行,对微博某个博主进行相册进行爬取
  • 需要修改resources/crawler目录下的properties文件 分别是访问页面所需要的headers
  • 如何修改headers配置文件可以看里面的注释。
  • 如果需要扩展,可以参考WeiboCrawlerServiceImpl
  • 启动CrawlerApplication,输入命令即可运行

About

使用MySQL,可随时重传的Java爬虫

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages