命令行输入ipython notebookpython
此时,浏览器会自动运行并打开ipython网页数组
如上图所示,新建一个项目浏览器
导入相关模块,创建一个数据集app
制造数据缺失项,并给新插入部分部分赋值函数
这样就构造了一个二维的DataFrame数组,其中包含了一些空数据命令行
处理空数据通常有两种blog
先建立一个随机序列排序
调用value_counts()索引
调用.mode()查看出现次数最多的元素ip
先建立一个10*4的数组
查看合并后的数组是否与原数组相等
或
先建立两个数组
调用merge,等价于select * from left inner join right on left.key = right.key;
先建立一个数组
调用append,若是插入列数不一样,将为缺失值
先建立数组
单个对'A‘’分组,groupby('A')
多分组,groupby([])
归纳:行索引与列索引作位置互换
先建立一个元组列表
给双层索引从新命名
建立一个8*2的数组
调用stack()函数将列索引变行索引,
调用unstack()将最后一层行索引转换为列索引,每调用一次,取一层行索引转换为列索引
概念:根据需求只看数组中的一部分
先建立一个数组
调用pivot_table(),参数为values、index、columns,分别表示要查看的列数据与行索引与列索引范围
好比查看D这一列,以A、B为联合行索引,以C为列索引的数据,若是对应数据不存在则为NaN,若是对应位置有多个值,则为平均值
先建立时间序列
根据时间序列建立对应的随机数数组
如没两分钟采样求平均值
还有一种建立时间序列的方式:以季度建立
调用to_timestamp()能够转换为时间日期的格式
pandas对于时间的计算至关简单,如
先建立一个数组
添加类别数据
查看类别索引,并给类别索引从新赋值,若是对grade排序,并非以grade排序,而是以raw_grade来排序
先建立一个数组
调用cumsum函数对数据求和
调用plot(),将数据可视化
先建立一个数组