两个大文件求交集

前段时间有人问我,给你两个文件,每一个文件每行都是字符串,如何找出两个文件中行相同的字符串。当时提供了两个思想,可是对方不满意。 假设文件为a,b 1.直接遍历法。通常人第一时间都是想遍历吧。读取每一行a,在b中遍历,这样时间复杂度为O(n^2),显然通常人都不能接受这个时间复杂度。 2.利用哈希思想。先把a文件hash,在遍历b文件,去判断是否存在。时间复杂度下降为O(n) ,可是空间复杂度上来
相关文章
相关标签/搜索