机器学习笔记之大规模机器学习

学习大数据集 获取高性能的机器学习系统途径是采用低偏差的学习算法,并用大数据进行训练。从下面的图中可以明确,只要使用大数据对算法进行训练,它的效果似乎会更好: 从这样的结果可以得出,在机器学习中,决定因素往往不是最好的算法而是谁的训练数据最多。 但是大数据集有它自己的特殊的问题,即计算问题。假设有一亿个训练样本,想要训练一个线性回归模型或一个逻辑回归模型,然后用梯度下降进行更新: θ j = θ
相关文章
相关标签/搜索