赛事名称:隔镜杯数据爬虫开发大赛
主办方:上海隔镜信息科技有限公司
“隔镜杯”数据爬虫开发大赛,是隔镜科技举办的创意开发大赛,旨在为开发者和数据爬虫爱好者提供一个有趣的框架平台,尽情表达关于数据的灵感。 本次开发者大赛的主题为“让数据回家”,主办方希望通过本次比赛,激发参赛者关于个人数据主权的创意,我们鼓励参赛者通过爬虫技术,将自己的个人数据从互联网拿回自己手中,并基于这些数据开发各类有趣的应用,做数据的主人。
报名启动: | 6 月 22 日 |
报名 & 作品提交截止日期: | 7 月 22 日 |
评比公布: | 8 月 7 日 |
- 关注公众号 我的数据百宝箱(微信号:mydatabox),回复“报名”,获取报名链接
- 或通过社区论坛置顶贴报名
- 添加大赛客服微信:mydatahome,回复“开发者+姓名”,加入大赛技术协作群
- 首先想到一个关于个人数据采集的好点子
- 我们准备了一个简单的框架和一些爬虫样例,我们鼓励您fork我们的爬虫代码库,并基于此进行创作。您也可以选择其他语言和框架进行开发。
- 完成的作品应当具备完整可运行的代码、测试用例、使用文档、项目介绍材料(可以包括文档、PPT、视频等)。
- 确认已经完成了报名流程(提交了团队信息,并且同意了参赛协议)
- 确认比赛作品已经完成,并且可以通过阅读项目README文档获取所有资料。如果是私有库,请确认已经给官方账号(id: MyDataHomes)添加了阅读权限。
- fork本仓库,拷贝作品提交模板来创建一份副本,仔细阅读模板并填充团队和项目信息,注意不要遗漏必填项,也不要修改其他任何文件。
- 重命名为 团队名称.md。
- 发起一次pull request完成作品提交申请。
- 个人或自由组队参赛,每支队伍不超过3人,每人只能参加一支队伍,以队伍参赛须确定一名队长,便于后续赛事联系和通知
- 参赛选手报名须提供真实联系信息
作品内容:爬虫工具(含源代码、使用文档、测试用例等),作品介绍材料
作品要求:
- 进行爬虫工具的开发。爬虫工具能够帮助用户抓去自己的个人数据,抓取的数据源类型不限(如淘宝、京东等);
- 参赛者可基于爬虫工具获取的数据,自主进行数据应用的设计,本要求为可选项;
- 参赛者可以基于指定的爬虫项目进行开发,也可以自行开发;
- 参赛作品的开发语言不限;
- 作品介绍文档需涵盖爬虫算法思路、实现方法、爬虫运行与测试方法、数据应用介绍(如有)等,介绍文档格式不限。
本次比赛将由隔镜科技与上海交通大学软件学院的专家评判打分,评分标准如下:
爬虫评分(100分)
- 爬虫性能(40%):包括爬取数据的完整度、性能,爬虫鲁棒性等指标。
- 代码质量(30%):包括代码撰写是否规范、接口定义是否清晰、注释是否完整等。
- 创新性(30%):包括在数据获取方式、爬虫算法设计等方面的创新等。
附加分(20分)
- 用户界面(10%):良好的用户界面设计,操作方式、风格等方面具有创意和美感。
- 数据应用(10%):数据应用的实用价值、创新性等。
- 奖金预设
一等奖(1支队伍):10000元 + 证书
二等奖(3支队伍):5000元 + 证书
三等奖(6支队伍):2000元 + 证书
优秀奖(若干):将根据实际参赛队伍数量确定优秀奖名额,将获得由隔镜提供的神秘礼品
- 开源爬虫奖 对于基于指定爬虫代码库开发的爬虫工具,主办方将挑选优秀的作品提交至Github项目中,被选作品将获得“开源爬虫奖”,并获得神秘礼品。(本奖项与前述不冲突,可同时获取)