Python对离散变量处理:哑变量编码和one-hot编码

在数据进行建模分析,没法直接把类别变量放入模型中去分析,所以,须要对类别变量进行处理。最多见的方法是对类别变量作哑变量编码或one-hot编码,因此运用最近的业务数据进行了尝试。哑变量编码和one-hot编码的具体介绍和区别在ML小菜鸟的博客中有比较详细的介绍博客连接。html 作哑变量编码的库:pandas one-hot编码的库:sklearn、keras 注意:pandas默认只处理字符串类
相关文章
相关标签/搜索