Home

Awesome

Kaggle

你已经抓住了石头,现在是挥舞它的时候了!

Note:

直播系列

kaggle入门系列

比赛直播系列

Kaggle 官方教程

机器学习入门

补充

竞赛

train loss 与 test loss 结果分析

机器学习比赛,奖金很高,业界承认分数。
现在我们已经准备好尝试 Kaggle 竞赛了,这些竞赛分成以下几个类别。

第1部分:课业比赛 InClass

课业比赛 InClass 是学校教授机器学习的老师留作业的地方,这里的竞赛有些会向public开放参赛,也有些仅仅是学校内部教学使用。

第2部分:入门比赛 Getting Started

入门比赛 Getting Started 给萌新们一个试水的机会,没有奖金,但有非常多的前辈经验可供学习。很久以前Kaggle这个栏目名称是101的时候,比赛题目还很多,但是现在只保留了9个最经典的入门竞赛:手写数字识别、沉船事故幸存估计、脸部识别、Julia语言入门。

第3部分:训练场 Playground

训练场 Playground里的题目以有趣为主,比如猫狗照片分类的问题。现在这个分类下的题目不算多,但是热度很高。

第4部分: 研究项目(少奖金) Research

研究型 Research 竞赛通常是机器学习前沿技术或者公益性质的题目。竞赛奖励可能是现金,也有一部分以会议邀请、发表论文的形式奖励。

第5部分:人才征募 Recruitment

人才征募 Recruitment 竞赛是赞助企业寻求数据科学家、算法设计人才的渠道。只允许个人参赛,不接受团队报名。

第6部分: 大型组织比赛(大奖金) Featured

推荐比赛 Featured 是瞄准商业问题带有奖金的公开竞赛。如果有幸赢得比赛,不但可以获得奖金,模型也可能会被竞赛赞助商应用到商业实践中呢。

第7部分: 限量邀请赛 Masters(新)

Masters(新) 限量参与比赛(受邀)

第8部分: 多评估标准赛 Analytics(新)

Analytics(新) 选择最优评估标准来排名的比赛

天池

其他部分

解决方案列表

如果解决方案太大,可以先放在这个列表中。以后再逐步整合到这个仓库。

机器学习算法

常用算法选择

常用工具选择

解决问题的流程

  1. 链接场景和目标
  2. 链接评估准则
  3. 认识数据
  4. 数据预处理(清洗、调权)
  5. 特征工程
  6. 模型调参
  7. 模型状态分析
  8. 模型融合

数据预处理

特征工程

特征处理

贡献指南

欢迎任何人参与和完善:一个人可以走的很快,但是一群人却可以走的更远

本项目接受大家提交 WriteUp(题解)。

WriteUp 需要带有预处理过程,从你能下载到的原始数据开始,并且带有验证过程和评价指标。

请放在/competitions/{分类}/{名称}目录下。

其中分类一共有六个,请见上面,名称是 URL 中/c/后面的部分。