Web 是一个巨大的资源宝库,里面有你需要的大量有价值的信息,例如潜在客户的列表与联系信息,竞争产品的价格列表,实时金融新闻,供求信息,论文摘要等等。可是由于关键信息都是以半结构化或自由文本形式存在于大量的HTML网页中,很难直接加以利用。
采集插件(sscms.gather) 是专为 Web 页面采集而开发的 SS CMS 插件,通过插件定制的采集规则,插件能够从指定网站中获取内容并保存到 SS CMS 系统中,可迅速完成网站数据的搭建和扩充数据,功能强大,设置简单。
可以在插件文档 https://sscms.com/docs/v7/official/gather/ 中查看插件的详细使用手册。
可以在源码仓库 https://github.com/siteserver/sscms.gather 中查看并获取插件的最新源代码。
可以访问插件主页 https://sscms.com/plugins/plugin.html?id=sscms.gather 获取插件详细信息。