pandas

series对象html

1.声明series对象数据库

    没有指定标签:json

    指定标签:数组

    查看组成series对象的:index和values数据结构

2.选择内部元素:app

3.为元素赋值:函数

4.用numpy数组或其余series对象定义新series对象excel

5.筛选元素:orm

6.series对象运算和数学函数htm

7.seri对象的组成元素:

    unique()

    value_counts()

    isiin()

8.NaN(非数值)

9.series用做字典

10.series对象之间的用算

DataFrame对象

1.定义DataFrame对象

2.选取元素

3.赋值

4.元素的所属关系

5.删除一列

6.筛选

7.用嵌套字典生成DataFrame对象

8.DataFrame转置

Index对象

1.index对象的方法

2.含有重复标签的Index

索引对象的其余功能

1.更换索引:reindex()

2.删除:

3.算数和数据对齐

数据结构之间的运算:

1.算数运算:

    add()

    sub()

    div()

    mul()

2.series对象和DataFrame对象之间的运算

pandas库函数:

    np.sort()计算DataFrame每一个对象的平方根

    fame.apply(f,axis=1):f为自定义函数,axis肯定操做的是行仍是列

    sum():计算DataFrame对象元素之和

    mean():平均值

    describe():计算多个统计量

索引排序:sort_index()

元素排序:

    1.Serise对象使用order()函数

    2. DataFrame对象:sort_index()函数,by指定哪一列,多列放在数组传给by

        ranking排序:rank()函数

相关性与协方差:corr()和cov()

corrwith()能够计算Dataframe对象的的列或行与Serise对象或其余Dataframe对象元素两辆之间的相关性。

为元素赋NaN值:np.NaN

过滤NaN:1. dropna():how选项避免删除整行或整列

2. notnull()做为选取元素的条件,实现直接过滤。

为NaN元素填充其余值:fillna()

等级索引:unstack():把Serise对象转换为DataFrame对象

stack()相反

swaplevel()函数以要互相交换两个层级的的名称为参数,返回交换位置后一个的一个新对象,其中各元素的顺序保持不变

sortlevel()只根据一个层级对数据排序

level参数对层级进行统计

读取函数和写入函数:

cvs和文本文件:read_cvs(),read_table(),to_cvs()具体参数,正则解析TXT文件。

读写html文件:

    read_html()

    to_html()

读写Excel文件:

    to_excel()

    read_excel()

json文件:

    read_json()

    to_json()

    json_normalize()

pandas实现对象序列化

pandas对接数据库

相关文章
相关标签/搜索
本站公众号
   欢迎关注本站公众号,获取更多信息