Python数据分析：pandas经常使用函数

时间 2019-12-10

标签 python 数据分析 pandas 经常使用函数栏目 Python 繁體版

原文原文链接

pandas是python中的一个数据处理库，一样在使用的时候咱们要先输入import pandas as pd引入。python

1.df = pd.read_csv("文件路径")：这是读取csv文件的方法，若是要读取excel或其余文档，都有相应的read函数。app

2.df.dtypes：若是在文件中有字符型数据返回的是object。函数

3.df.head(n)：将前n行数据显示出来，若是不传入参数则显示前5行数据。spa

4.df.tail(n)：将后n行数据显示出来，若是不传入参数则显示后5行数据。excel

5.df.columns：以列表的形式显示数据表的列名。code

6.df.shape：以元组的形式显示表中数据的行数和列数。排序

7.df.loc[n]：返回索引值为n的行。索引

8.df.loc[m][n]：返回索引值为m行n列的数据。图片

9.df.loc[m:n]：返回索引值为m到n的行。rem

10.df.loc[[m,n,k]]：返回索引值分别为m,n,k的行。

11.df["str"]：返回列名为str的这一列。

12.df.columns.tolist()：将列名作成列表。

13.df["str"]*df["str"]：两列维度相同，则两列的对应位置相乘。

14.df.sort_values("str",inplace=True,ascending=False)：将str一列按照降序排列，且获得的数据替换原数据。inplace表示是否用排序后的数据替代原数据，默认为False，也就是不替换。ascending表示排序的顺序，默认为True，也就是按照升序排列。

15.judge = pd.isnull(df["str"])：返回bool型值，str这一列的数据是空值返回True，不是空值返回False。

16.a["judge"]：返回judge为True，也就是缺失的数据，这时再调用len()函数便可求得缺失数据的个数。

17.df.pivot_table(index="a",values="b",aggfunc=np.mean)：这是一个很重要的函数，将b求平均值，按照a的类别进行分类，第三个参数默认为求平均值。

18.df.loc[n,"str"]：定位到第n行，列名为str处的数据。

19.sort_res.reset_index(drop=True)：将排序后的数据的编号也从新排列，drop指是否丢弃原数据。运行后的结果与14的图对比能够发现，编号已经从新排列了。

20.df.apply()：这是在pandas中的自定义函数的使用方法，括号中传入函数名。