KNN分类

一、算法思想 1. 首先分别读取训练集和验证集的csv文件数据,分别将数据传到列表sample_list、validation_list,通过两层循环建立无重复词语列表word_list,分别构建训练集和验证集的one_hot矩阵,对每一行的句子的每一个词语,找出词语在word_list出现的下标,在one_hot矩阵相应的对应位置置为1。 2. 采取不同的度量方式,分别有汉明距离、杰卡德距离、余
相关文章
相关标签/搜索