在全部聚类算法中KMeans算是表面上最简单的一种,没有过多恼人的古希腊符号公式,没有过度繁杂的公式嵌套。对于一个初学矩阵或者仅有向量概念的非专业人士的来讲,不可不畏是一把踹门利器。这个世界上越是简单的东西,其实越是复杂,尤为在笔者将其改形成MapReduce时,发现并不是那么容易一跃而过。虽然有现成的代码供把玩,可是对于练手仍是值得一试。 算法
· 纯理论一笔带过 多线程
KMean的大体实现过程就是任意指定N个的质心,而后对全部星星进行遍历,寻找与这个N个质心距离最近欧几里得距离的星星,将其归为一类,再从这一类中从新计算N个质心坐标属性。直至这N个质心坐标变化DELTA小至本身设定的阀值。架构
· 一些心得 oop
X Y 29 12 21 33 23 23 25 23 33 24 22 36 23 12 16 20 23 32 33 10 26 23 32 14 33 7 38 4 13 33 65 77 43 63 81 87 72 64 54 71 61 67 81 58 57 81 54 79 50 82 53 62 74 58 77 55 69 81 70 82 44 55 60 58