我对机器学习的整理理解

  在机器学习通常来说,特征工程对模型性能影响最大,参数调优一般提升不如特征工程提升。   首先需要对数据进行充分探索,如属性是字符串类型、日期类型 还是 数值类型;若提供的数据存在几张表中,表中数据是否存在关联,是否可以进行统计、聚合;从业务理解上,可能影响模型性能的因素有哪些,表中数据能否构造该因素。   其次,我们需要对数据进行预处理。对字符串、categories 一般来说我们可以:   
相关文章
相关标签/搜索