在Kaggle手写数字数据集上使用Spark MLlib的RandomForest进行手写数字识别

时间 2019-12-05

标签 kaggle 手写数字数据集上使用 spark mllib randomforest 进行识别栏目 Spark 繁體版

原文原文链接

昨天我使用Spark MLlib的朴素贝叶斯进行手写数字识别，准确率在0.83左右，今天使用了RandomForest来训练模型，并进行了参数调优。web 首先来讲说RandomForest 训练分类器时使用到的一些参数：dom numTrees：随机森林中树的数目。增大这个数值能够减少预测的方差，提升预测试验的准确性，训练时间会线性地随之增加。 maxDepth：随机森林中每棵树的深度。增长这个

>>阅读原文<<