【Spark Summit East 2017】基于Spark的可扩展的层次聚类算法

时间 2020-12-30

原文原文链接

更多精彩内容参见云栖社区大数据频道https://yq.aliyun.com/big-data；此外，通过Maxcompute及其配套产品，低廉的大数据分析仅需几步，详情访问https://www.aliyun.com/product/odps。本讲义出自Chen Jin在Spark Summit East 2017上的演讲，数据挖掘的第一步工作就是进行聚类，聚类的目标是减少数据冗余或者定义数据