Pandas学习笔记系列:html
原文:https://morvanzhou.github.io/tutorials/data-manipulation/np-pd/3-4-pd-nan/ 本文有删改python
NaN
的矩阵有时候咱们导入或处理数据, 会产生一些空的或者是 NaN 数据,如何删除或者是填补这些 NaN 数据就是咱们今天所要提到的内容.git
创建了一个6X4的矩阵数据而且把两个位置的值为空.github
dates = pd.date_range('20130101', periods=6) df = pd.DataFrame(np.arange(24).reshape((6,4)),index=dates, columns=['A','B','C','D']) df.iloc[0,1] = np.nan df.iloc[1,2] = np.nan """ A B C D 2013-01-01 0 NaN 2.0 3 2013-01-02 4 5.0 NaN 7 2013-01-03 8 9.0 10.0 11 2013-01-04 12 13.0 14.0 15 2013-01-05 16 17.0 18.0 19 2013-01-06 20 21.0 22.0 23 """
注意:如下函数并不会在原数据上作修改,只是会返回一个新的pandas.DataFrame
函数
pd.dropna()
若是想直接去掉有 NaN 的行或列, 能够使用 dropna学习
df.dropna( axis=0, # 0: 对行进行操做; 1: 对列进行操做 how='any' # 'any': 只要存在 NaN 就 drop 掉; 'all': 必须所有是 NaN 才 drop ) """ A B C D 2013-01-03 8 9.0 10.0 11 2013-01-04 12 13.0 14.0 15 2013-01-05 16 17.0 18.0 19 2013-01-06 20 21.0 22.0 23 """
pd.fillna()
若是是将 NaN 的值用其余值代替, 好比代替成 0:spa
df.fillna(value=0) """ A B C D 2013-01-01 0 0.0 2.0 3 2013-01-02 4 5.0 0.0 7 2013-01-03 8 9.0 10.0 11 2013-01-04 12 13.0 14.0 15 2013-01-05 16 17.0 18.0 19 2013-01-06 20 21.0 22.0 23 """
判断是否有缺失数据 NaN, 为 True 表示缺失数据:code
df.isnull() """ A B C D 2013-01-01 False True False False 2013-01-02 False False True False 2013-01-03 False False False False 2013-01-04 False False False False 2013-01-05 False False False False 2013-01-06 False False False False """
检测在数据中是否存在 NaN, 若是存在就返回 True:htm
np.any(df.isnull()) == True # True