Mahout系列之------Canopy算法

Canopy 算法,流程简单,容易实现,一下是算法 (1)设样本集合为S,确定两个阈值t1和t2,且t1>t2。 (2)任取一个样本点p属于S,作为一个Canopy,记为C,从S中移除p。 (3)计算S中所有点到p的距离dist (4)若dist<t1,则将相应点归到C,作为弱关联。 (5)若dist<t2,则将相应点移出S,作为强关联。 (6)重复(2)~(5),直至S为空。 上面的过程可以看出
相关文章
相关标签/搜索