pandas缺失值处理之——如何消去Nan值对数字型字符串数据类型的影响,让数字型字符串保持原始str类型,而不会自动变为float类型?

在利用pandas处理表格时,每每有时咱们用表格作的测试用例每每会设计考一些必填项*故意赋值为空(表明不输入)的测试用例,测试

好比说咱们的手机号、身份证号码、社会统一信用代码等都是数字型字符串。以下所示:spa

pandas读取表格,会把表格中的空单元格置为float类型的Nan值,会致使数字型字符串列的数据类型从原始的str类型自动转换为float类型,以下图所示:设计

读取的效果:3d

从上图可看出,pandas读取excel时,遇到空白单元格会自动置为nan值,float型。excel

致使原始表格中的文本类型的social_code(社会信用代码)和 telno(手机号)从原始的本文str类型转变为了float类型,致使数据显示错误,不是咱们想要的结果。code

 

那如何将nan值所有置为空,而且还不会影响原始表格中的数字型字符串呢???blog

咱们能够在读取表格时,就以字符串型读取,以下图所示:ci

效果以下:字符串

这时,原始的数字型字符串数据就不会受到nan值的影响了。pandas

若是须要对nan值进行替换,直接采用fillna()填充便可。

 

替换、填充效果:

 

这样就完成了~~~~

相关文章
相关标签/搜索