什么是独热编码,它的坑你踩过吗?

为何要用独热编码函数 为何要用独热编码,这是特征工程中的问题,若是是类别型的特征,比较粗的方法就是将文本特征进行数值化,好比'A'->1,'B'->2。测试 可是,做为类别型特征,单纯的将其数值化会让模型赋予了数值大小含义,而实际上数字大或小并无区别。编码   因此针对类别型特征,用one-hot独热编码进行处理。如:特征A,有三个类别a,b,c。通过独热编码,将会生成3个特征:A_a,A_b,A
相关文章
相关标签/搜索