机器学习深入与强化--工作流程与模型优化

实际建模之前,需要做数据的处理,首先是数据清洗,2点,然后是数据采样,因为大部分模型对正负样本的比例都十分敏感。 之后非常重要的就是特征工程,它包括特征处理和特征选择两部分,首先是特征处理,针对不同类型的特征值进行处理。特征选择包括 过滤型、包裹型和内嵌型,过滤型考虑单个特征与y值之间的相关度,挑选最相关的特征留下来。包裹型是指逐步取特征的子集,在子集上跑算法,看效果是否比在特征全集上好,比如准确
相关文章
相关标签/搜索