这个面试问题很难么 | 如何处理大数据中的数据倾斜

数据倾斜 数据倾斜是我们在处理大数据量问题时绕不过去的问题,也是在面试中几乎必问的考点。 正常的数据分布理论上都是倾斜的,就是我们所说的'二八原理':80%的财富集中在20%的人手中, 80%的用户只使用20%的功能 , 20%的用户贡献了80%的访问量。 简单来说数据倾斜就是数据的key 的分化严重不均,造成一部分数据很多,一部分数据很少的局面。 表现 相信大部分做数据的童鞋们都会遇到数据倾斜,
相关文章
相关标签/搜索