“1000万字符串，去掉重复”的一些思考和java实现

时间 2019-12-06

原文原文链接

题目：1000万字符串，其中有些是重复的，须要把重复的所有去掉，保留没有重复的字符串。请怎么设计和实现？ java 大数据的字符串处理我通常想到了trie树和hashmap，jdk里有hashmap的实现，因此想先用hashmap来试试效果，在用hashmap来测试前先编个小代码，用来生成1000万的字符串，使用随机函数来选择字符：node //生成sum个单词，并输入到word.txt文件中去。

>>阅读原文<<