Hadoop MapReduce编程 API入门系列之查找相同字母组成的字谜(三)

  找出相同单词的所有单词。现在,是拿取部分数据集(如下)来完成本项目。     项目需求   一本英文书籍包含成千上万个单词或者短语,现在我们需要在大量的单词中,找出相同字母组成的所有anagrams(字谜)。   思路分析   基于以上需求,我们通过以下几步完成:     1、在 Map 阶段,对每个word(单词)按字母进行排序生成sortedWord,然后输出key/value键值对(so
相关文章
相关标签/搜索