一个大的含有50M个URL的记录,一个小的含有500个URL的记录,找出两个记录里相同的URL。

 首先使用包含500个url的文件建立一个hash_set。 而后遍历50M的url记录,若是url在hash_set中,则输出此url并从hash_set中删除这个url。 全部输出的url就是两个记录里相同的url。
相关文章
相关标签/搜索