如何在海量数据中判断某个数据是否存在?

原文始发于微信公众号(BeCoder):如何在海量数据中判断某个数据是否存在?   这是一道面试题:如何在海量数据(如亿级数据)中判断某个数据是否存在? 回想一下,在java中我们可以使用列表、集合等数据结构来存放数据,如hashmap,然后判断某个数据是否存在,但在此问题中显然不适用,因为上亿的数据在内存较小的计算机中无法存放。 通常我们有以下解决思路: 将海量数据分散存储到多个文件中去,依次将
相关文章
相关标签/搜索