训练集，验证集，测试集

时间 2021-01-02

原文原文链接

关键字：普通参数，超参数，训练集，验证集，测试集很多机器学习过程实际上就是选择模型，由于模型只是参数未知，所以就需要得到一个最优参数，使得模型可以比较准确的描述自变量到因变量的变化情况。对于模型的训练和度量，就需要用到已知的数据集。数据集一般分为以下3种。如果已经有了一个大的标注数据集，那么通过随机抽样获得三种数据集，三者的比例为8:1:1。如果有标注的话，也可以只随机抽样出训练