一、info()
二、isnull(),可与any()和all()结合使用
三、notnull()web
导入数据:
使用info()能够查看每一列的相关信息,能够知道每一列有多少个非空数值。
使用isnull()判断空值,按列判断。
使用notnull()判断非空,按列判断。
svg
对于缺失值,能够丢弃处理(dropna)。
参数:3d
导入数据:
使用dropna()按行删除缺失值。本来有1396行数据,删除缺失值后,剩余1098行。
设置how
设置axis = 1,只要该列有缺失值就删除该列。
设置thresh,只要大于等于设置的值,该行才会被保留。
xml
对于缺失值,能够填充处理(fillna)。
参数:对象
导入数据:
使用固定值填充
根据字典填充
向上填充ffill
向下填充bfill
limit最多连续填充NaN次数
blog
describe()针对数值列和非数值列,显示的信息不同。图片
导入数据:
it
duplicated()发现重复值,该方法返回一个series类型对象,值为布尔类型。
参数:
subset:指定依据哪些列来判断是否重复,默认是全部列,即一行的全部值彻底相同视为重复。
keep:指定标记重复记录的规则,默认是first。ast
导入数据:
查看重复值
subset判断只要某些列相同,则认为是重复。
也可写subset = (字段名1,字段名2…)
class
drop_duplicates()删除重复值。
参数:
subset:指定依据哪些列判断是否重复。
也可写subset = (字段名1,字段名2…)