【Kaggle从入门到放弃】(01):竞赛类型

    Kaggle比赛旨在为参赛人员在机器学习生涯的各个不一样阶段提供挑战。所以,竞赛类型多样化。从入门到大神,均可以在Kaggle找到适合本身的竞赛。算法

常见的竞赛类型以下,后面有具体的介绍。机器学习

a)入门,官方为新手入门准备的三个小项目,有提供答案。学习

b)游乐场,新手进阶练习项目,提升技能。3d

c)精选,企业给出的前沿项目比赛,组队刷比赛,有标准排名blog

d)研究,大神的世界。教程

入门

    新手入门级比赛是Kaggle最简单,最平易近人的比赛。这些是半永久性的比赛,旨在被新用户用于进入机器学习领域的第一步。他们没有提供奖品或积分。因为其长期运行性质,入门竞赛多是机器学习中最重要的教程问题 - 它们正是新手开始第一步须要的!文档

官方为新手入门准备的三个小项目,以下:深度学习

a)数字识别器pandas

b)泰坦尼克号:从灾难中学习机器学习 - 预测泰坦尼克号上的生还者。it

c)住房价格预测:高级回归技术

入门项目如图:

    入门比赛有两个月的滚动排行榜。提交超过两个月后,它将失效,再也不计入排行榜。这让新手有机会看到他们的分数如何与一群同水平的新手竞争排名而不是成千上万的用户。这对于新手是至关友好的。

    此外,Kaggle学习平台还为初学者提供了不少教程,从pandas到深度学习。教程被分红各个小模块,并包含Kernel练习。它们供您训练建模和学习新技术。您将学习到参加Kaggle比赛所需的全部技能。因此说,这儿不只提供从人门到大神级的项目比赛,也提供基础的学习资料。以后,若是利用好Kaggle平台,在内核里面你能够找到不少高级的学习资料哦〜

Kaggle学习平台如图:

操场

    游乐场比赛是一种“为了乐趣”的Kaggle比赛类型,难度比入门高出一些。这些比赛一般提供相对简单的机器学习任务,而且一样是针对新手设置的,适合那些对小项目有兴趣可是。但愿在时间投入较低的状况下能够练习新类型问题的Kagglers奖品包括荣誉奖品和小额现金游乐场比赛的一些例子是:

a)狗与猫 - 建立一种区分狗与猫的算法

b)叶子分类 - 你能看到叶子的随机森林(随机森林)吗?

c)纽约市出租车行程时间 - 共享代码和数据以改善乘车时间预测

如图所示:

精选

。精选比赛是Kaggle最有名的比赛类型这些都是全面并且难度较高的机器学习挑战,一般是商业目的的预测问题例如,过去的特点比赛包括:

a)Allstate索赔预测挑战 - 使用客户的购物历史来预测他们购买的保险单

b)Jigsaw毒性评论分类挑战 - 预测维基百科上有毒评论的存在和类型

c)Zillow奖 - 构建一个机器学习算法,进行房地产价格评估

如图所示:

 

精选竞赛吸引了一些最强大的专家,并提供高达一百万美圆的奖池。可是,任何人和每一个人均可以参加精选竞赛。不管您是该领域的专家仍是新手,精选竞赛都是学习该领域最优秀技能和技术的宝贵机会。

 研究

研究比赛是Kaggle的另外一种常见比赛类型。研究竞赛的特色是比精选比赛更具实验性例如,过去的一些研究比赛包括:

a)Google LandmarkRetrieval Challenge - 给定一张图像,您能在数据集中找到全部相同的地标吗?

b)右鲸识别 - 识别航空照片中濒临灭绝的右鲸

c)大规模分层文本分类 - 将维基百科文档分类为约300,000个类别之一

如图所示:

 

因为研究比赛的实验性质,研究比赛一般不会提供奖品或积分。但它们提供了一个机会来处理可能没有干净或简单解决方案的问题,而且这些问题在竞争性稍差的环境中对于特定领域是不可或缺的。