《特征工程入门与实践》---阅读笔记(一)

大体上,我们会在3个领域内对特征的好处进行量化: 1、监督学习 回归 — 预测任务(测量定量数据) 主要使用均方误差作为测量指标 分类 — 预测定性数据 主要使用准确率作为测量指标 2、无监督学习 聚类 — 将数据特征行为进行分类 主要使用轮廓系数作为测量指标 3、统计检验 用相关系数、t-检验,卡方检验,以及其他方法评估及量化原始数据和转换后数据的效果 一、特征理解:我的数据集中有什么 我们开始
相关文章
相关标签/搜索