【动手学数据分析】Task03笔记

建模: 前两个task中学会了怎么清洗数据准备数据,相当于得到了喂给模型的建模数据。 判断是否存活,所以是个监督问题。 下面这个图实在是有灵性。     【思考】 划分数据集的方法有哪些? 留出法、k折验证法 为什么使用分层抽样,这样的好处有什么?分层抽样的精度比简单随机抽样的精度高 单次使用留出法得到的估计结果往往不够稳定可靠,在使用留出法时,一般要采用若干次随机划分、重复进行模型评估后取平均值
相关文章
相关标签/搜索