“1000万字符串,去掉重复”的一些思考和java实现

题目:1000万字符串,其中有些是重复的,须要把重复的所有去掉,保留没有重复的字符串。请怎么设计和实现? java 大数据的字符串处理我通常想到了trie树和hashmap,jdk里有hashmap的实现,因此想先用hashmap来试试效果,在用hashmap来测试前先编个小代码,用来生成1000万的字符串,使用随机函数来选择字符:node //生成sum个单词,并输入到word.txt文件中去。
相关文章
相关标签/搜索