机器学习算法面试题——聚类算法

【1】当数据缺失时怎么处理,除了直接舍去还有什么方法。如何使用聚类算法去填补缺失值。 答: 对于缺失值较多的特征处理:我们直接将该特征弃掉,否则可能反倒会带入较大的noist,对结果造成不良影响。 对于缺失值较少的特征处理: (1)把缺失值用一个数值,例如0表示; (2)均值,中值,分位数、众数,随机数,上下数据填充,插值法; (3)用算法拟合进行填充; 对于如何使用聚类算法去填补缺失值,我想到的
相关文章
相关标签/搜索