高级实训第四周周报

本周工作   本周主要还是数据预处理与特征选择部分,相比之前简单地用平均值填充数值类数据,用众数填充类别类数据并使用全部特征,我对数据分门别类进行了更细致的处理,并舍弃了一些不必要的或暂时较难利用的特征。 首先,除了object类的数据为类别类数据外,有些数值类数据的取值个数都比较有限,且取值集中在几个数值上(例如n0),此时采用均值填充缺失值可能并不是一个很好的选择,可以把它当作类型属性。对一些
相关文章
相关标签/搜索