中文短文本聚类

文本聚类是将文档由原有的自然语言文字信息转化成数学信息,以高维空间点的形式展现出来,通过计算哪些点距离比较近,从而将那些点聚成一个簇,簇的中心叫做簇心。 import random import jieba import pandas as pd import numpy as np from sklearn.feature_extraction.text import TfidfTransfor
相关文章
相关标签/搜索