你真的懂one-hot编码吗?

一个很隐晦的问题         在回归,分类,聚类等机器学习算法中,特征之间距离的计算或相似度的计算是非常重要的,而我们常用的距离或相似度的计算都是在欧式空间的相似度计算,计算余弦相似性,基于的就是欧式空间,所以往往默认数据数据是连续的(可以计算距离?),并且是有序的。但是有时用数字表示的数据并不是有序的,而是随机分配的。 举个例子:有一个离散型特征,代表工作类型,该离散型特征,共有三个取值,不
相关文章
相关标签/搜索