福哥答案2020-07-03:测试
1.双重遍历。 时间复杂度是O(N^2)。url
2.排序。 采用外部排序。时间复杂度是O(NlogN)。.net
3.遍历加哈希存储。 空间换时间,时间复杂度是O(N),空间复杂度是O(N)。这种方法适用于小数据量,在这里用明显不合适。blog
4.布隆过滤器。 根据公式计算,万分之一的失误率须要228M内存。我的感受这种方法不太合适。排序
5.压缩位图。 根据我目前的分析,压缩位图适合稀疏存储,在这里用,效果不明显。32位整数总共有42亿个,这道题有1亿个数字,1/42算不算稀疏,就不得而知了。时间有限,没测试。内存
6.哈希分组。 这1亿个数字整数范围不限。 一个分组里有两个参数,一个参数保存数据,另外一个参数保存个数DataCount。重复的数字必定在同一个分组中,而后对每个分组进行遍历加哈希存储。若是DataCount过大,再次哈希分组。get
7.位图。 32位整数范围,占用内存4G/8=512M。 最大值和最小值范围,占用内存 (max-min)/8+1,最小占用内存 1亿/8=不到12M。io
结论:方法6和方法7都行。方法6适用的范围广,浮点数也行。方法7只适用于32位整数。class
评论遍历