从0开始学pyspark(十):使用pyspark.ml.clustering模块对商场顾客聚类

数据下载: 数据为kaggle上的关于商场客户的数据,地址:https://www.kaggle.com/vjchoudhary7/customer-segmentation-tutorial-in-python 数据准备: 数据集很小,四个特征值:性别,年龄,收入能力,消费能力,这里我们用收入能力和消费能力两项对客户进行聚类处理 from pyspark.sql import SparkSess
相关文章
相关标签/搜索