吴恩达机器学习笔记——获取大量数据与人工数据

更多训练样本的取得 我们可以通过对已有的真实数据集拉伸扭曲、增加噪声的引入失真方式创造更多衍生数据集。 也可以利用一些工具创造数据集,如下载各种字体人工随机放置在不同背景中。 使用众包平台。 大量数据生效的前提 而保证工具的可用性,除了提高数据集的数目,还应该预先保证模型本身的低偏差。 我们可以通过绘制学习曲线的方式检查分类器以保证我们拥有一个低偏差、高方差的分类器。 如果偏差较高,我们可以增加特
相关文章
相关标签/搜索