《Scala机器学习》一一1.4 基本抽样、分层抽样和一致抽样

1.4 基本抽样、分层抽样和一致抽样 相当多的数据分析人员蔑视采样。通常要想处理整个数据集,只有改进模型。实际上,在这两者之间进行权衡会很复杂。首先,可以在抽样的数据集上建立更复杂的模型,特别是模型的时间复杂度是非线性(比如在大多数情况下至少是N* log(N))时更是如此。用更快的周期构建模型可让用户能更快地迭代模型,使其按最佳方式收敛。在很多情况下,若在整个数据集上建立模型,则在改进预测精度时
相关文章
相关标签/搜索