处理分类数据 非数值型编码

处理分类数据 目前为止,我们处理的都是数值型变量。但是真实世界的数据集通常都含有分类型变量(categorical value)的特征。当我们讨论分类型数据时,我们不区分其取值是否有序。比如T恤尺寸是有序的,因为XL>L>M。而T恤颜色是无序的。 在讲解处理分类数据的技巧之前,我们先创建一个新的DataFrame对象: 上面创建的数据集含有无序特征(color),有序特征(size)和数值型特征(
相关文章
相关标签/搜索