一起hadoop(三)关于合并块split

雷迪斯 街特闷, 上两篇说道上传,下面说一下,上传后的处理。 需求:分析页面中是否包含关键字。并返回页面的路径地址及名称 首先: 上传文件至HDFS,这一步看上一篇已经OK的。 接下来要做的事情,不只是查询几个单词的事情了。   要做的事情:1.文件夹的读取。                          2.页面内容的读取                          3.匹配    
相关文章
相关标签/搜索