Python 获取Kmeans聚类结果每一类的数据

时间 2021-02-14

标签 spa code blog pandas class import 数据类型方法栏目 Python 繁體版

原文原文链接

获取聚类结果中每一类的数据,该数据类型是DataFramespa

思路：获取clf_KMeans的标签，我这里是聚三类，标签就是0，1，2code

将Label转成Series类型，再筛选出指定标签的res0，我筛选了1blog

最后在DataFrame里获取Label为1的数据pandas

import pandas as pd
from sklearn.cluster import KMeans
 
　　# 创建模型。n_clusters参数用来设置分类个数，即K值，这里表示将样本分为两类。 clf_KMeans = KMeans(n_clusters=3, max_iter=10) # 模型训练。获得预测值。 print "clf_KMeans聚类中心\n", (clf_KMeans.cluster_centers_) quantity = pd.Series(clf_KMeans.labels_).value_counts() print "cluster2聚类数量\n", (quantity) #获取聚类以后每一个聚类中心的数据 res0Series = pd.Series(clf_KMeans.labels_) res0 = res0Series[res0Series.values == 1] print"类别为1的数据\n",(df.iloc[res0.index])

另一种方法,更简洁it

res = dataframe[(clf_KMeans.labels_ == 1)]