Skip to content

Latest commit

 

History

History
10 lines (7 loc) · 811 Bytes

README.md

File metadata and controls

10 lines (7 loc) · 811 Bytes

Data_Statistic_Analysis

2021数据统计与分析大赛 比赛官网 overleaf在线论文作品

基于K12平台的13w条用户订单和行为数据展开数据挖掘与可视化分析,经过数据清洗、数据可视化、特征工程、论文复现、编程建模和对比择优等系列步骤,在类别极度不平衡(3.4%)的情况下,最终使用加权交叉熵改进CatBoost模型实现用户购买预测,AUC达99.61%,并进行可解释性分析。任务二使用基于熵权法改进的RFM模型给用户分级判断用户价值,实现营销成本最小化,拉新留存效益最大化,在Overleaf协作撰写论文。最终本科组排前1%。

方案后续整理上传

To be continued...