Home

Awesome

赛题链接

https://www.ppdai.ai/mirror/goToMirrorDetail?mirrorId=17

数据情况

表名内容备注
train训练集
test测试集
listing_info标的属性
user_info用户信息
user_taglist用户画像
user_behavior_logs用户行为SDK
user_repay_logs还款日志

特征工程

Y

lgb 正常33 468.35 /7211
lgb0619 468.98 2.05467
xgb 正常33 461/
去除0/32 535.85
472/8022

策略

  1. 33分类
  2. 10分类 (效果较差)
  3. 模型组合
    1. 以33类为基础,剔除0/32分箱训练,覆盖是否账单日还款/是否逾期(7153)(效果较差)
    2. 以33类为基础,正常训练,覆盖是否账单日还款/是否逾期(auc0.5 6404)
    3. 以上述最优模型为基础,覆盖是否1~31模型 6028
    4. 构建xgb模型,与lgb(7211)融合,加权平均(无效)
    5. 构建神经网络 和lgb融合
  4. 覆盖用户画像/可能的工资日等规则

train/test

6.18

距2018-03-02 /2019-02-19 元宵节 距2018-03-08 妇女节/2019-03-08 妇女节

listing_info

6.18

user_info

6.18

user_taglist

user_behavior_logs

6.18

6.30

user_repay_logs

6.18

6.30

两次一期借款的间隔

是否新客户(874841/928195为老客户,有历史纪录,)

(似乎效果不好,用户更倾向于按照截止日期还款,而不是每月固定时间)

other多表聚合特征

6.18