【Kaggle从入门到放弃】(01):竞赛类型

    Kaggle比赛旨在为参赛人员在机器学习生涯的各个不同阶段提供挑战。因此,竞赛类型多样化。从入门到大神,都可以在Kaggle找到适合自己的竞赛。

常见的竞赛类型如下,后面有具体的介绍。

a)入门,官方为新手入门准备的三个小项目,有提供答案。

b)游乐场,新手进阶练习项目,提高技能。

c)精选,企业给出的前沿项目比赛,组队刷比赛,有标准排名

d)研究,大神的世界。

入门

    新手入门级比赛是Kaggle最简单,最平易近人的比赛。这些是半永久性的比赛,旨在被新用户用于进入机器学习领域的第一步。他们没有提供奖品或积分。由于其长期运行性质,入门竞赛可能是机器学习中最重要的教程问题 - 它们正是新手开始第一步需要的!

官方为新手入门准备的三个小项目,如下:

a)数字识别器

b)泰坦尼克号:从灾难中学习机器学习 - 预测泰坦尼克号上的生还者。

c)住房价格预测:高级回归技术

入门项目如图:

    入门比赛有两个月的滚动排行榜。提交超过两个月后,它将失效,不再计入排行榜。这让新手有机会看到他们的分数如何与一群同水平的新手竞争排名而不是成千上万的用户。这对于新手是相当友好的。

    此外,Kaggle学习平台还为初学者提供了很多教程,从pandas到深度学习。教程被分成各个小模块,并包含Kernel练习。它们供您训练建模和学习新技术。您将学习到参加Kaggle比赛所需的所有技能。所以说,这儿不仅提供从人门到大神级的项目比赛,也提供基础的学习资料。之后,如果利用好Kaggle平台,在内核里面你可以找到很多高级的学习资料哦〜

Kaggle学习平台如图:

操场

    游乐场比赛是一种“为了乐趣”的Kaggle比赛类型,难度比入门高出一些。这些比赛通常提供相对简单的机器学习任务,并且同样是针对新手设置的,适合那些对小项目有兴趣但是。希望在时间投入较低的情况下可以练习新类型问题的Kagglers奖品包括荣誉奖品和小额现金游乐场比赛的一些例子是:

a)狗与猫 - 创建一种区分狗与猫的算法

b)叶子分类 - 你能看到叶子的随机森林(随机森林)吗?

c)纽约市出租车行程时间 - 共享代码和数据以改善乘车时间预测

如图所示:

精选

。精选比赛是Kaggle最有名的比赛类型这些都是全面而且难度较高的机器学习挑战,通常是商业目的的预测问题例如,过去的特色比赛包括:

a)Allstate索赔预测挑战 - 使用客户的购物历史来预测他们购买的保险单

b)Jigsaw毒性评论分类挑战 - 预测维基百科上有毒评论的存在和类型

c)Zillow奖 - 构建一个机器学习算法,进行房地产价格评估

如图所示:

 

精选竞赛吸引了一些最强大的专家,并提供高达一百万美元的奖池。但是,任何人和每个人都可以参加精选竞赛。无论您是该领域的专家还是新手,精选竞赛都是学习该领域最优秀技能和技术的宝贵机会。

 研究

研究比赛是Kaggle的另一种常见比赛类型。研究竞赛的特点是比精选比赛更具实验性例如,过去的一些研究比赛包括:

a)Google LandmarkRetrieval Challenge - 给定一张图像,您能在数据集中找到所有相同的地标吗?

b)右鲸识别 - 识别航空照片中濒临灭绝的右鲸

c)大规模分层文本分类 - 将维基百科文档分类为约300,000个类别之一

如图所示:

 

由于研究比赛的实验性质,研究比赛通常不会提供奖品或积分。但它们提供了一个机会来处理可能没有干净或简单解决方案的问题,并且这些问题在竞争性稍差的环境中对于特定领域是不可或缺的。