解读Cardinality Estimation算法(第二部分:Linear Counting)

在上一篇文章中,我们知道传统的精确基数计数算法在数据量大时会存在一定瓶颈,瓶颈主要来自于数据结构合并和内存使用两个方面。因此出现了很多基数估计的概率算法,这些算法虽然计算出的结果不是精确的,但误差可控,重要的是这些算法所使用的数据结构易于合并,同时比传统方法大大节省内存。 在这一篇文章中,我们讨论Linear Counting算法。 简介 Linear Counting(以下简称LC)在1990年
相关文章
相关标签/搜索