Home

Awesome

car-forum-customer

汽车论坛消费者用车体验内容的判别与标注 比赛的代码

比赛网址: https://www.datafountain.cn/competitions/365/datasets

models

运行

  1. 需要下载相应的预训练模型,对数据集的处理参考process_data.ipnb和ernie_process.ipynb文件

  2. 运行的参数保存在相应的sh文件里面,根据数据和模型的路径自己进行修改

  3. 修改相应的generate_ccf_submission.py文件,然后运行,就可以得到提交文件

results

模型精度备注
albert+roberta+zen0.89024699000投票
zenv1+roberta+albertv20.88196301000投票
roberta0.8753250200012层
ZEN_v10.8785336000011.10
XLNet0.86586291000
ERNIE0.84082258000
albert_v20.86472315000large版本
albert_v10.84656274000base版本
模型精度备注
albert+roberta+zen0.89336467投票

改进的地方

  1. 只进行了投票的处理,后期需要考虑对模型概率的融合
  2. 由于计算资源的限制,没有尝试更大的预训练模型
  3. 没有进行细致的调节参数(时间比较紧)