非负矩阵分解算法基于hadoop streaming的实现

非负矩阵分解算法思想如下: 并行化思路: 由公式(2-8)和(2-9)可以看出,矩阵更新所需要的主要操作就是矩阵之间的乘法运算,并行化操作也主要是对乘法运算进行并行,对矩阵H的并行化步骤如下: 并行化算法设计: 针对以上的并行化流程,并行化步骤如下: 算法实现和结果: 算法采用hadoop streaming实现,矩阵采用稀疏结构进行存储,部署在5个计算节点,每个节点为8核心,设置的map数量为0
相关文章
相关标签/搜索