大数据处理实例——Amazon商品评分&评论(四)

背景 在本系列的第二篇中给出了Storm实时处理框架。其中有提到因为后面的离线学习部分都是基于文本的词频向量,所以须要统计非重复单词个数(向量维度)以及为每一个单词编号(该单词词频所在列)。本篇就重点介绍本身基于ZK集群的实现方式web 分析 我本身的想法就是在Storm Topolopy的去停用词阶段(StopWordsFilterBolt)为每个新单词在ZK指定路径上建立一个新的节点。同时启动
相关文章
相关标签/搜索