pandas是python中的 一个数据处理库,一样在使用的时候咱们要先输入import pandas as pd
引入。python
1.df = pd.read_csv("文件路径")
:这是读取csv文件的方法,若是要读取excel或其余文档,都有相应的read函数。app
2.df.dtypes
:若是在文件中有字符型数据返回的是object。函数
3.df.head(n)
:将前n行数据显示出来,若是不传入参数则显示前5行数据。spa
4.df.tail(n)
:将后n行数据显示出来,若是不传入参数则显示后5行数据。excel
5.df.columns
:以列表的形式显示数据表的列名。code
6.df.shape
:以元组的形式显示表中数据的行数和列数。排序
7.df.loc[n]
:返回索引值为n的行。索引
8.df.loc[m][n]
:返回索引值为m行n列的数据。图片
9.df.loc[m:n]
:返回索引值为m到n的行。rem
10.df.loc[[m,n,k]]
:返回索引值分别为m,n,k的行。
11.df["str"]
:返回列名为str的这一列。
12.df.columns.tolist()
:将列名作成列表。
13.df["str"]*df["str"]
:两列维度相同,则两列的对应位置相乘。
14.df.sort_values("str",inplace=True,ascending=False)
:将str一列按照降序排列,且获得的数据替换原数据。inplace表示是否用排序后的数据替代原数据,默认为False,也就是不替换。ascending表示排序的顺序,默认为True,也就是按照升序排列。
15.judge = pd.isnull(df["str"])
:返回bool型值,str这一列的数据是空值返回True,不是空值返回False。
16.a["judge"]
:返回judge为True,也就是缺失的数据,这时再调用len()
函数便可求得缺失数据的个数。
17.df.pivot_table(index="a",values="b",aggfunc=np.mean)
:这是一个很重要的函数,将b求平均值,按照a的类别进行分类,第三个参数默认为求平均值。
18.df.loc[n,"str"]
:定位到第n行,列名为str处的数据。
19.sort_res.reset_index(drop=True)
:将排序后的数据的编号也从新排列,drop指是否丢弃原数据。运行后的结果与14的图对比能够发现,编号已经从新排列了。
20.df.apply()
:这是在pandas中的自定义函数的使用方法,括号中传入函数名。