“1000万字符串,去掉重复”的一些思考和java实现

题目:1000万字符串,其中有些是重复的,需要把重复的全部去掉,保留没有重复的字符串。请怎么设计和实现? 大数据的字符串处理我一般想到了trie树和hashmap,jdk里有hashmap的实现,所以想先用hashmap来试试效果,在用hashmap来测试前先编个小代码,用来生成1000万的字符串,使用随机函数来选择字符: //生成sum个单词,并输入到word.txt文件中去。 public
相关文章
相关标签/搜索