Home

Awesome

DCIC-2019-Credit-2th-Place

2019数字中国创新大赛 消费者人群画像 亚军

NLP队不完整代码(只包含我这部分)。

util.py: 一些工具函数

封装了lightgbm, catboost等,方便K折,且自定义了一些损失函数。

gotcha_lgb.ipynb: lightgbm模型

manual_feature = [
 '当月费用-前五个月消费平均费用',
 '前五个月消费总费用',
 'count_缴费',
 'count_当月费用',
 'count_费用差',
 'count_平均费用',
 'count_当月费用_平均费用'
 '是否998折']

gotcha_gbdt.ipynb: sklearn gbdt模型

gotcha_ctb.ipynb: sklearn ctb模型

stacking.ipynb

将所有模型的结果用huber_regressor做stacking

关于自定义loss

可参考