2021数据统计与分析大赛 比赛官网 overleaf在线论文作品
基于K12平台的13w条用户订单和行为数据展开数据挖掘与可视化分析,经过数据清洗、数据可视化、特征工程、论文复现、编程建模和对比择优等系列步骤,在类别极度不平衡(3.4%)的情况下,最终使用加权交叉熵改进CatBoost模型实现用户购买预测,AUC达99.61%,并进行可解释性分析。任务二使用基于熵权法改进的RFM模型给用户分级判断用户价值,实现营销成本最小化,拉新留存效益最大化,在Overleaf协作撰写论文。最终本科组排前1%。
方案后续整理上传
To be continued...