Spark GBDT vs Random Forests vs xgboost

参考spark API文档 算法层面比较: GBDT vs Random Forests (RF) 1) GBDT一次只训练一棵树,而RF一次可以并行地训练多棵树,所以GBDT的训练时间更长。所以,GBDT通常会使用更小的树,同时也减少训练一棵树的时间。 2)RF更不容易过拟合,训练更多的树能够降低RF过拟合的可能性,却增加GBDT过拟合的可能性。 (因为在统计学角度,RF通过训练更多的树降低方差
相关文章
相关标签/搜索