《Hands-On Machine Learning with Scikit-Learn & TensorFlow》第三章 分类

(1)为什么一定要打乱数据集? 让我们打乱训练集。这可以保证交叉验证的时所有的折叠都差不多(你不会希望某一个折叠数据集类缺少某类数字)。而且,一些学习算法对训练样例的顺序敏感,当它们在一行当中得到许多相似的样例,这些算法将会表现得非常差。打乱数据集将保证这种情况不会发生。 评估一个分类器,通常比评估一个回归器要困难的多。所以我们将会花大量的篇幅在这个话题上。有许多量度性能的方法,所以拿来一杯咖啡和
相关文章
相关标签/搜索