【NLP复习】集成学习——Bootstraping、Bagging、Boosting、GBDT、XGBoost

一、Bootstraping、Bagging、Boosting的思想? Bootstraping(自助抽样法): 从给定训练集中有放回的均匀抽样。假设给定的数据集包含d个样本。 该数据集有放回地抽样d次,训练集中没出现的概率就是d次都未被选中的概率,即(1-1/d)^d。当d趋于无穷大时,这一概率就将趋近于e^(-1)=0.368,所以留在训练集中的样本大概占原来数据集的63.2%。 Baggin
相关文章
相关标签/搜索