欠拟合(一般表明高误差)html
精度微信
过拟合(一般表明高方差)网络
过少的数据样本与有效特征,太高的维度,会致使模型学到噪声和没必要要的无效特征,这个概念叫作过拟合,是维度灾难的一个直接后果。机器学习
如何改进模型的有效性函数
聊一下模型训练过程当中的学习曲线性能
咱们根据模型经过可视化图形从数据中学习的能力来探讨误差与方差之间的关系。机器学习中的学习曲线是一种可视化图形,能根据一系列训练实例中的训练和测试数据比较模型的指标性能。在查看数据与偏差之间的关系时,咱们一般会看到,随着训练点数量的增长,偏差会趋于降低。因为咱们尝试构建从经验中学习的模型,所以这颇有意义。咱们将训练集和测试集分隔开,以便更好地了解可否将模型泛化到未见过的数据而不是拟合到刚见过的数据。在学习曲线中,当训练曲线和测试曲线均达到稳定阶段,而且二者之间的差距再也不变化时,则能够确认模型已尽其所能地了解数据。学习
误差测试
方差spa
理想的学习曲线.net
说一下你理解的信息增益(Information gain)
在一个条件下,信息不肯定性减小的程度!
决策树就是这样来找特征的。
说一下分类和回归的区别?
二者追到本质是同样。
Logistic Regression 和 Linear Regression:
Support Vector Regression 和 Support Vector Machine:
Naive Bayes 用于分类 和 回归:
前馈神经网络(如 CNN 系列) 用于 分类 和 回归:
循环神经网络(如 RNN 系列) 用于分类 和 回归:
如文章你已看懂,点个「喜欢」便可。如若错误以及不清晰的地方,随时提出。欢迎扫一扫上面二维码加入个人我的微信号进行技术交流。