在Kaggle手写数字数据集上使用Spark MLlib的RandomForest进行手写数字识别

昨天我使用Spark MLlib的朴素贝叶斯进行手写数字识别,准确率在0.83左右,今天使用了RandomForest来训练模型,并进行了参数调优。web 首先来讲说RandomForest 训练分类器时使用到的一些参数:dom numTrees:随机森林中树的数目。增大这个数值能够减少预测的方差,提升预测试验的准确性,训练时间会线性地随之增加。 maxDepth:随机森林中每棵树的深度。增长这个
相关文章
相关标签/搜索