Skip to content
/ drpy Public
forked from liu673cn/drpy

欢迎使用DR-PY首页界面       当前版本: 3.7.14           框架开发:道长           框架美化:蓝莓           可以简单的自定义爬虫实现cms数据接口

License

Notifications You must be signed in to change notification settings

7noemo/drpy

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

🚀第二派-dr模板的python实现🚀

logo

🗂️A webServer convert web and x5 movie sites to cms api data

latest version discussions Downloads Downloads Downloads License License
python3.6-3.8完美运行(3.9以上不支持linux进程启动)

搭建教程 | install_help |goorm
dr项目QQ官群
参考T4
golang最好的js引擎-otto
dockerfile教程
获取本地设备信息
获取本地设备信息

2022/09/25
  • 1.v3.7.10 增加了自定义解析功能,解析.conf支持变量{{host}}
  • 2.新增了 jiexi/无名.js作为示例,接受vipUrl返回realUrl
  • 3.修复腾云驾雾并增加通用筛选
  • 4.自建解析增加重定向方法,方便明面上隐藏真实来源的解析地址
2022/09/23
  • 1.v3.7.5 优化了首图2模板的搜索定位以及几个相关的源
  • 2.二级渲染功能拆分,js单独调用
  • 3.v3.7.6 新增优酷源(pluto专用)
  • 4.v3.7.7 新增酷云77源(pluto专用),新增猫了个咪源,优化request等方法的post参数传递,增加rc函数
  • 5.v3.7.8 增加单一搜索无匹配关键字自动打印源码,注释进入二级详情页的日志打印
  • 6.v3.7.9 增加了用户解析合并功能并处理了几个坏的解析(准备跑路,原因是感觉海阔又牛逼了)
2022/09/22
  • 1.v3.7.3修复静态文件阿里token没渲染的bug,修复数据库升级bug,优化app.py
  • 2.v3.7.4修复自定义drives合并配置报错问题
2022/09/21
  • 1.未来功能增加显示和隐藏多选规则的实际逻辑,增加顺序字段等待有缘人
  • 2.版本升级至3.7.0
  • 3.版本升级至3.7.1,修复/js目录的内置源会被缓存的问题
  • 4.修复鸭奈飞,牛马tv内置源
2022/09/19
  • 1.增加20多个缓存源,需要在custom.conf文件自定义添加
  • 2.修复缓存js播放免嗅问题
2022/09/17
  • 1.pluto1.5.1最新beta版支持drpy首页推荐点击跳drpy内部聚搜(原理同T4)
  • 2.pluto1.5.1最新beta版支持searchable为2的源忽略参与聚搜,正常单一搜索
  • 3.drpy源增加内部聚搜进入二级详情页的简介签名备注真实来源规则名
2022/09/16
  • 1.规则headers合并优化
  • 2.基础js功能修复,如pdfh,request,Object.keys
  • 3.菜狗改为PC_UA
  • 4.增加drpy首页源,实现T4相同功能
  • 5.增加多源模式,聚搜超时等后台设置中心
  • 6.增加豆瓣首页插件以及详情评分功能,可以custom自定义
  • 7.增加嗅探配置,可自定义
  • 8.版本升级 至3.6.9
  • 9.版本升级 至3.7.10,优化drpy搜索必定成功
2022/09/15
  • 1.修复生成配置文件中静态文件链接对应的配置文本爬虫地址渲染异常问题
  • 2.删除custom里的xb、xp源
  • 3.未来功能页面设置为管理员登录后可见
  • 4.修复局域网ip可能会获取成网关地址问题
  • 5.设置中心增加自定义进程管理地址(可用于goorm等设备绑定快捷方式)
  • 6.直播文件目录迁移
  • 7.增加py_gitcafe.py和其他几个js首图2模板源
  • 8.版本号更新至3.6.6
  • 9.增加了start.sh脚本(感谢Antod提供),配置模板增加leshi的flag
2022/09/14
  • 1.升级至3.6.2,增加了一些解析
  • 2.升级至3.6.5,修复菜狗部分源解析失败问题(url参数有+号被自动变空格导致的)
2022/09/13
  • 1.升级至3.5.8
  • 2.迁移alist.conf文件,修改默认模板,增加模板url参数支持fyfilter变量从此支持更多筛选场景
  • 3.升级至3.5.9,修复重大bug:模板继承导致的自动生成配置的搜索开关异常问题
  • 4.增加菜狗热搜
  • 5.修复菜狗源纪录片和综艺
2022/09/12
特别说明:仅pluto 1.4.2以上版本支持此项目的筛选及自定义播放免嗅
  • 1.升级至3.5.7
  • 2.爱奇艺增加了筛选,修复搜索错误,修复json:表达式取不到数据问题
  • 3.尝试增加升级过滤txt目录下通过一键生成的配置文件
  • 4.主页增加静态配置文件的链接
  • 5.生成静态配置文件也会自动合并自定义配置了
  • 6.拖拽排序源(无限延期,有空再说)
  • 7.隐藏显示源(无限延期,有空再说)
2022/09/11
  • 1.升级至3.5.2.后台管理增加设置中心 (可能会存在bug)
  • 2.升级至3.5.3.增加菜狗源(筛选及解析播放暂未解决)
  • 3.升级至3.5.4 (此版本+pluto1.4.1以上版本支持filter,源示例:菜狗.js)
  • 4.升级至3.5.5 (菜狗播放返回json)
2022/09/10
  • 1.升级至3.4.4.增加小强迷源,增加二级重定向属性(提供重定向后的源码,让代码重新取重定向过后的线路和播放列表)
  • 2.升级至3.4.5.增加兔小贝儿歌源,优化json:细节处理以及详情页拼接细节
  • 3.升级至3.4.7 后台管理增加了py源开关
  • 4.升级至3.4.8 转移数据库到base目录防止被覆盖,增加js源的tab_exclude属性(线路名称过滤)
  • 5.v3.4.8 三架构镜像已发布
2022/09/09
  • 1.增加西瓜源,修复一级不支持lazy的bug
  • 2.兄弟们dockerhub没法push镜像不知道咋回事,3.4.1的镜像自己用docker目录下的文件build吧
  • 3.版本升至3.4.2,增加py源支持,放txt/py目录即可,特别鸣谢Pyramid开发者及xiaoya liu提供的技术和源
  • 4.版本升至3.4.3,增加了强制升级功能(本地增量覆盖大法)
2022/09/08
  • 1.升级到3.2.9,支持自动合并自定义用户配置(内置t4测试源)
  • 2.升级到3.3.0,增加奇珍异兽源
  • 3.升级到3.3.2,增加自定义本地文件路由: {{ host }}/files/文件名和{{ host }}/txt/文件名 比如 {{ host }}/files/custom_spider.jar
  • 4.升级到3.3.4,修改了默认爬虫jar方案,支持轮询和并发json解析,新增用户自定义解析配置
  • 5.待开发搜索支持js写法(后续再考虑首页推荐支持json双模式+js)
  • 6.版本升级3.3.5.搜索支持js写法,并修复了360影视搜索问题(搜索定位标题支持||多个分开合并,解决猫壳自动过滤搜索结果问题,比如月升沧海改名了会被猫壳过滤)
2022/09/07
  • 1.优化后台管理登录界面,升级更新脚本
  • 2.增加了镜像合并脚本(三合一直接拉 hjdhnx/drpy 即可)
  • 3.js源增加cate_exlude参数
  • 4.增加腾云驾雾源(二级暂未完善,后面再说)
  • 5.完善腾云驾雾源,修复直播下载乱码,修复网站强制证书验证
  • 6.升级到3.2.8,增加两套模板和多个对应源
2022/09/06
  • 1.增加了后台管理界面在线检测升级系统功能
  • 2.增加了后台管理界面修改直播源地址和同步直播源
  • 3.首页推荐内容不限制数量(新版pluto牛逼!!!)
  • 4.增加lsg配置模型和缓存
  • 5.增加了默认alist挂载
  • 6.升级到3.2.0,进行了全面后端重构用了蓝图写法,app.py文件以后尽量不动
  • 7.后台管理界面显示美化-感谢蓝莓果酱
  • 8.打包升级后的三平台镜像(v3.2.1)
  • 9.首页美化,升级版本号(v3.2.2)
2022/09/05
  • 1.内置jar修复了原本tv_box无法播放直播的问题
  • 2.重新构建了三种平台的镜像 amd64,armv7,arm64
  • 3.优化日志打印wlan信息
2022/09/04
  • 1.增加了dockerfile
  • 2.基于dockerfile构建的镜像并上传至dockerhub,小白可以一键运行.参考搭建教程
2022/09/03
  • 1.增加了json定位支持(需要升级依赖),写法为 字符串以json:开头,二级的话含is_json:true
  • 2.研究正版线路对接解析(摸索出type1与4的区别,但是不知道1怎么走解析)
  • 3.调整linux进程配置自动识别(自动去除https)
  • 4.搞定360影视和解析播放
  • 5.新增二级支持js写法(参考360影视)
2022/09/02
  • 1.优化了免嗅探的注入变量,封装了fetch_params变量
  • 2.一定程度兼容python3高版本,支持termux直装(高于3.9版本首页推荐无法获取)
  • 3.准备弃坑,基本完结撒花
  • 4.增加自定义配置直播外网地址
2022/09/01
  • 1.增加动态分类排除配置
  • 2.优化pdfh,pdfa,pd等函数,支持多个&&写法,自动取第一个
  • 3.增加vfed规则模板
2022/08/31
  • 1.增加管理员登录功能
  • 2.增加管理员上传和删除内置规则功能
  • 3.增加上传文件校验(仅支持pydr的js规则并且100kb以内)
2022/08/30
  • 1.增加动态局域网ip获取
  • 2.增加js规则热加载(增删改不用重启)
  • 3.增加视界的加密库
  • 4.增加蓝莓影视免嗅探
  • 5.增加免嗅耗时毫秒数统计
  • 6.增加自动装载配置
  • 7.增加js里单独设置某个源是否可搜索
  • 8.增加外网免嗅(自定义config.py里面改)
  • 9.增加错误处理和首页单个详情获取
  • 10.增加本地直播地址自定义
  • 11.增加数据库迁移,新版教程 旧版教程
  • 12.自动ocr识别过搜索验证码
2022/08/29
  • 1.更换js引擎,速度更快性能更好
  • 2.新版js支持与python互动,后期可能支持js免嗅(lazy:'js:xxx')
  • 3.支持了js免嗅和常用的fetch,post方法
  • 4.配置uglifyjs可以把js代码压缩到一行(es5不支持多行js)
2022/08/28
  • 1.增加linux进程启动,命令 supervisord -c manager.conf
  • 2.转移文本文件到txt目录
  • 3.增加服务器解析播放(全局配置和js分别配置.后期可以针对性运行解析)
  • 4.增加自定义免嗅(基于道长任务仓库核心逻辑实现云函数)
  • 5.增加模板继承,优化免嗅参数二
2022/08/27
  • 1.增加PC_UA变量
  • 2.首页增加更多功能按钮
  • 3.增加猫配置自动生成,分别有本地配置,局域网配置,在线配置
  • 4.修复默认网站的favicon图标问题
  • 5.增加 flask-sqlalchemy 用于驱动sqlite3数据库
  • 6.引入sqlite3数据进行缓存分类定位到的标签
  • 7.增加filter一键爬取和入库(filter_name,filter_url,filter_parse)
  • 8.使用gevent作为服务,提升大量性能
2022/08/26
  • 1.支持首页推荐功能,模板属性增加limit参数
  • 2.支持纯一级的功能(比如车车网没二级)
  • 3.解决配置首页报错和嗅探播放报错问题
  • 4.支持分类第一页独立链接,直接在链接后面加[第一页的独立链接]
  • 5.增加headers参数,可以传ua和cookie,此方法解决555影视搜索问题
  • 6.增加homeUrl和host参数,以及class_parse参数,可以动态定位分类标签
  • 7.获取二级详情函数增加了线程池的使用
  • 8.模板自定义filter过滤
  • 9.网页端显示缓存的规则以及提供点击清除缓存操作
  • 10.增加本地配置文件,增加指定编码。
  • 11.待开发模板渲染器,一键生成猫配置文件。
特性说明
  1. 参考了海阔视界dr模板设计思路
  2. 参考tv_box的t4项目思路重新设计了cms接口
本地搭建
  1. 安装zero termux
  2. 在termux里安装tome 虚拟机
  3. tome 虚拟机 里安装ubuntu1804容器
  4. ubuntu1804容器里安装python3-pip,nodejs
  5. pip3换源并安装requirements.txt(pip3 install -r requirements.txt)
  6. python3 app.py运行项目(也可以其他方式nohup或者 supervisord -c manager.conf)
  7. 访问地址加/index查看dr_py主页

测试地址

sqlite3使用教程
远程网站
本地网站
gevent下载地址 aarch64的cp310

本地服务配置地址
远程服务配置地址

配置相关

直接复制对应的三种地址就行了,不需要生成本地文件(下面教程不要了)
本地地址 clan://localhost/pycms_local.json
推荐把文件放到 /storage/emulated/0/PlutoPlayer/pycms_local.json
并且pluto要自己切换路径为PlutoPlayer

相关教程

pyquery定位

模板规则说明

所有相关属性说明

var rule = {
    title:'',//规则标题,没有实际作用,但是可以作为cms类名称依据
    编码:'',//不填就默认utf-8
    host:'',//网页的域名根,包含http头如 https://www,baidu.com
    homeUrl:'/latest/',//网站的首页链接,可以是完整路径或者相对路径,用于分类获取和推荐获取 fyclass是分类标签 fypage是页数
    url:'/fyclass/fypage.html[/fyclass/]',//网站的分类页面链接
    detailUrl:'https://yanetflix.com/voddetail/fyid.html',//非必填,二级详情拼接链接,感觉没啥卵用
    searchUrl:'',//搜索链接 可以是完整路径或者相对路径,用于分类获取和推荐获取 **代表搜索词 fypage代表页数
    searchable:0,//是否启用全局搜索,
    quickSearch:0,//是否启用快速搜索,
    filterable:0,//是否启用筛选,
    filter:{},// 筛选条件字典
    // 筛选网站传参,会自动传到分类链接下(本示例中的url参数)-url里参数为fyfilter,可参考蓝莓影视.js
    filter_url:'style={{fl.style}}&zone={{fl.zone}}&year={{fl.year}}&fee={{fl.fee}}&order={{fl.order}}',
    // 注意,由于猫有配置缓存,搜索配置没法热加载,修改了js不需要重启服务器
    // 但是需要tv_box进设置里换源使配置重新装载
    headers:{//网站的请求头,完整支持所有的,常带ua和cookies
        'User-Agent':'MOBILE_UA',
        "Cookie": "searchneed=ok"
    },
    timeout:5000,//网站的全局请求超时,默认是3000毫秒
    class_name:'电影&电视剧&动漫&综艺',//静态分类名称拼接
    class_url:'1&2&3&4',//静态分类标识拼接
    //动态分类获取 列表;标题;链接;正则提取 不需要正则的时候后面别加分号
    class_parse:'#side-menu:lt(1) li;a&&Text;a&&href;com/(.*?)/',
    // 除开全局过滤之外还需要过滤哪些标题不视为分类
    cate_exclude:'',
    // 除开全局动态线路名过滤之外还需要过滤哪些线路名标题不视为线路
    tab_exclude:'',
    // 服务器解析播放
    play_parse:true,
    // 自定义免嗅
    lazy:'',
    // 首页推荐显示数量
    limit:6,
    double:true,//是否双层列表定位,默认false
    // 类似海阔一级 列表;标题;图片;描述;链接;详情 其中最后一个参数选填
    // 如果是双层定位的话,推荐的第2段分号代码也是第2层定位列表代码
    推荐:'.col-sm-6;h3&&Text;img&&data-src;.date&&Text;a&&href',
    // 类似海阔一级 列表;标题;图片;描述;链接;详情 其中最后一个参数选填
    一级:'.col-sm-6;h3&&Text;img&&data-src;.date&&Text;a&&href',
    // 二级可以是*,表示规则无二级,直接拿一级的链接进行嗅探
    // 或者 {title:'',img:'',desc:'',content:'',tabs:'',lists:''} 同海阔dr二级
    二级:'*',
    // 搜索可以是*,集成一级,或者跟一级一样的写法 列表;标题;图片;描述;链接;详情
    搜索:'*',
}

模板继承写法

var rule = Object.assign(muban.mxpro,{
title:'鸭奈飞',
host:'https://yanetflix.com',
url:'/index.php/vod/show/id/fyclass/page/fypage.html',
class_parse:'.navbar-items li:gt(1):lt(6);a&&Text;a&&href;.*/(.*?).html',
});

About

欢迎使用DR-PY首页界面       当前版本: 3.7.14           框架开发:道长           框架美化:蓝莓           可以简单的自定义爬虫实现cms数据接口

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • JavaScript 57.2%
  • Python 35.3%
  • HTML 4.3%
  • CSS 3.0%
  • Shell 0.2%