LightGBM 挖掘 SNP 的注意事项

1. 决策树难以挖掘到有意义的稀有突变 每次节点所选择的特征是对整体影响最大的特征,而越靠近树根时,集合内样本数量越大,越混乱,越难分离出异常值,进而也就越难选择对表型有显著影响的稀有突变。 而当节点越靠近叶片时,集合内样本数量越少,在群体中 MAF 越高的 SNP 越有可能在子集中有两种基因型,从而对子集有区分能力。对于在群体中 MAF 低的 SNP 在样本数量越少的子集中越可能只有一种基因型,
相关文章
相关标签/搜索