特征工程总结与学习

文章目录 1. 机器学习流程 2. 数值型数据 2.1 标量、向量和空间 2.2 处理计数 2.3 对数变换 2.4 特征缩放/归一化 2.5 交互特征 2.6 特征选择 3. 文本数据:扁平化、过滤和分块 3.1 元素袋:将自然文本转换为扁平向量 3.2 使用过滤获取清洁特征 4. 特征缩放的效果:从词袋到tf-idf 4.1 tf-idf: 词袋的一种简单扩展 5. 分类变量:自动化时代的数据
相关文章
相关标签/搜索