Home

Awesome

高校赛解决方案

赛题介绍

列名类型示例
query_idint3
queryhash string,term空格分割1 9 117
query_title_idtitle在query下的唯一标识2
titlehash string,term空格分割3 9 120
labelint,取值{0, 1}0

解决方案

特征工程(FE)

(共19个特征,放入LGB模型lb是0.597)

NN模型

线上提交

<hr>

我们的优势

真实的线上业务也是庞大的数据量,如何充分利用数据是个难题。我们的方案适用于大数据量(流式训练全量数据内存小+finetuing迁移学习效果佳)

我们总共才19个特征,不需要提取大量的手工特征,所以可以说不依赖于LGB模型,LGB模型是全量模型,要么只能选用小数据集提特征要么大数据量提取不了特征,不易迭代。我们的方案流式处理,易于迭代更新。