Skip to content

simuler/MetaHeac

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

MetaHeac

论文复现赛-MetaHeac

MetaHeac模型

以下是本例的简要目录结构及说明:

├── data #样例数据
    ├── processed_data
        ├── train_stage1.pkl
        ├── train_stage2.pkl          
├── main.py # 入口函数
├── metamodel.py # 主模型
├── model.py # 核心模型组网
├── run.py # 运行主函数
├── utils.py # 计算指标的函数
├── readme.md #文档

注:在阅读该示例前,建议您先了解以下内容:

paddlerec入门教程

内容

模型简介

Package Recommendation with Intra- and Inter-Package Attention Networks 《利用“包内”和“包间”注意力网络的包推荐》。
随着移动互联网中在线社交网络的蓬勃发展,我们提出了一个新颖的社交推荐场景,名为Package Recommendation。在这种场景中,用户不再被推荐单个项目或项目列表,而是被推荐异构且类型多样对象的组合(称为包,例如,包括新闻、媒体和观看新闻的朋友)。与传统推荐不同,在包推荐中,包中的对象被明确显示给用户,用户会对显式展示的对象表现出极大的兴趣,反过来这些对象可能对用户行为产生重大影响,并显著改变传统的推荐模式。

数据准备

使用Tencent Look-alike Dataset,该数据集包含几百个种子人群、海量候选人群对应的用户特征,以及种子人群对应的广告特征。出于业务数据安全保证的考虑,所有数据均为脱敏处理后的数据。本次复现使用处理过的数据集,直接下载即可 propocessed data[https://drive.google.com/file/d/11gXgf_yFLnbazjx24ZNb_Ry41MI5Ud1g/view?usp=sharing] data/processed_data目录下存放了从全量数据集获取的少量数据集,做对齐模型使用。 若需要使用全量数据可以参考下方效果复现部分。

运行环境

PaddlePaddle>=2.0

python 2.7/3.5/3.6/3.7

os : windows/linux/macos

快速开始

本文提供了样例数据可以供您快速体验,在任意目录下均可执行。在MetaHeac模型目录的快速执行命令如下:

# 进入模型目录
# cd MetaHeac/ # 在任意目录均可运行
# 动态图训练
!python  -W ignore main.py --task_count 5 --num_expert 8 --num_output 5 --batchsize 1024 # 全量数据运行config_bigdata.yaml 

模型组网

模型整体结构如下:

效果复现

为了方便使用者能够快速的跑通每一个模型,我们在每个模型下都提供了样例数据。如果需要复现readme中的效果,请按如下步骤依次操作即可。
在全量数据下模型的指标如下:

模型 auc batch_size epoch_num Time of each epoch
MetaHeac 0.7246 1024 1 4个小时左右
  1. 确认您当前所在目录为MetaHeac/
  2. 进入Paddlerec/datasets/iprec
  3. 运行 !python -W ignore main.py --task_count 5 --num_expert 8 --num_output 5 --batchsize 1024

进阶使用

FAQ

About

论文复现赛-MetaHeac

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages