Awesome

Tencent2020_Rank11

2020腾讯广告算法大赛复赛rank11（lyu）

队名：日晨

分数：复赛B榜1.479998

排名：初赛rank6，复赛rank11

我的blog分享链接

本项目为我个人（lyu）部分代码，队友代码参考istar、wujie，其中本项目需要用到istar的tfidf部分特征和wujie的deepwalk部分特征，缺少这部分特征效果会有下降

项目环境

pytorch 1.3.0

cuda 10.1

gensim

yacs

torchcontrib

h5py

文件目录

Project
├─models
│  ├─data
│  │  ├─deepwalk
│  │  │  └─index
│  │  ├─stacking
│  │  │  ├─age
│  │  │  └─gender
│  │  ├─test
│  │  ├─tfidf
│  │  ├─train_final
│  │  └─train_preliminary
│  ├─istar
│  ├─lyu
│  │  ├─config
│  │  │  ├─config.py
│  │  │  └─__init__.py
│  │  │
│  │  ├─data
│  │  │  ├─npy_final
│  │  │  └─vec_final
│  │  ├─load
│  │  │  ├─data.py
│  │  │  ├─feature.py
│  │  │  └─__init__.py
│  │  │
│  │  ├─model
│  │  │  ├─model.py
│  │  │  └─__init__.py
│  │  │
│  │  └─save
│  │      ├─age
│  │      ├─gender
│  │      └─temp
│  └─wujie
└─scr
    ├─istar
    ├─lyu
    │  ├─data_process.py
    │  ├─inference.py
    │  ├─n2v.py
    │  ├─process.py
    │  ├─tfidf.py
    │  ├─train.py
    │  └─w2v.py
    │
    └─wujie

处理流程

将初赛、复赛、测试数据集分别放在models/data/train_preliminary/、models/data/train_final/、models/data/test/ 文件夹

运行 src/lyu/data_process.py 进行数据处理

运行 src/lyu/w2v.py 训练w2v

运行 src/lyu/n2v.py 处理wujie生成的deepwalk特征

运行 src/lyu/tfidf.py 处理istar生成的tfidf特征

修改 models/lyu/config/config.py 里面参数来调整任务和模型，修改项为cuda、fold、task、deepwalk、adversarial、trans_mode

运行 src/lyu/train.py 训练模型

运行 src/lyu/process.py 和 src/lyu/inference.py 推理模型