该实例使用数据为kaggle经典入门竞赛,泰坦尼克
比赛解析 https://github.com/apachecn/Interview/tree/master/docs/Kaggle/competitions/getting-started/titanicgit
对于csv数据每一列表明的含义以及详细分析见比赛解析给的网址(在上面哦!!)
github
观察发现,'Age’列含有大量缺失值,Nan即表明缺失值
web
若是不对缺失值作预处理,获得结果为nan
只对有效数据进行计算获得平均值
使用dropna()丢弃缺失值
apache
通常使用pivot_table()获得index和values之间的关联
app
对Age进行排序操做,但index不变化
对Age进行排序操做,同时index也按照顺序排序
svg
使用apply()调用自定义函数
函数