机器学习笔记(二)

一、错误率&误差 错误率: 错分样本的占比:E=a/m;(一共有m个样本,a个样本错误)相应的,1-a/m称为“精度” 误差:样本真实输出与预测输出之间的差异训练(经验)误差:训练集上 测试误差:测试集 泛化误差:除训练集外所有样本 由于事先并不知道新样本的特征,我们只能努力使经验误差最小化; 很多时候虽然能在训练集上做到分类错误率为零,但多数情况下这样的学习器并不好 二、过拟合与欠拟合 过拟合:
相关文章
相关标签/搜索