数据挖掘之特征工程

特征工程是使用专业背景知识和技巧处理数据,使得特征能在机器学习算法上发挥更好的作用的过程。 本文主要目的在于熟悉做数据挖掘中对数据做预处理的主要流程。 1数据采集 哪些数据对最后的结果预测有帮助? 数据我们能够采集到吗? 线上实时计算的时候获取是否快捷? 2数据格式存储 确定存储格式 大多数情况下,需要关联非常非常非常多的hive表和 hdfs文件夹 ,这里有非常大的学问,涉计到大数据方面技术问题
相关文章
相关标签/搜索