大数据处理问题

常见海量数据处理的关键 1、分而治之。通过哈希函数将大人物分流到机器,或分流成小文件 2、常用的hashMap或bitMap 难点:通讯、时间、空间的估算 哈希函数: 哈希函数又叫散列表,哈希函数的输入可以使非常大的范围,但是输出与是固定范围。假设为S。 性质: 典型的哈希函数都拥有无限的输入值域 输入值相同时,返回值一样 输入值不同时,返回值可能一样,也可能不一样 不同输入值得到的哈希值,整体均
相关文章
相关标签/搜索