python3 锦鲤第一步!了解随机抽样之蓄水池算法

python3 锦鲤第一步!了解随机抽样之蓄水池算法 蓄水池算法 问题背景: 样本空间为N,从N个样本中随机不重复地抽取K个样本,其中N是未知且非常巨大的数,如何保证每个样本是等概率被抽取才是关键。 算法逻辑: (1)先选取前k个数据(0,1,2,…k-1,角标从0开始) (2)对于第i个数据(k<=i<n),随机生成区间[0, i)的一个数r,如果r<k,则将数据替换。 近期的朋友圈都在疯转各式
相关文章
相关标签/搜索