以前学了用python制做爬虫去爬取数据,可是不知道数据有什么用途。在请教惨绿青年小哥哥后,得知数据能够用pandas库进行数据分析而后得出有用的信息。python果真厉害,还能用来进行数据分析。在小哥哥的教导下,Paradoxical总算掌握了pandas的基本用法,一块儿来学习吧~
python
首先咱们要安装pandas库,在命令行输入“pip install pandas”就能够安装了。数据结构
先说说pandas的经常使用数据结构DataFrame,这是相似表格的结构,由若干行和列组成,你们能够将它看成一个表格来看。下面是使用ExcelFile()读取练习数据文件的代码,能够看到df对象是DataFrame类型。app
有些列是不须要的,因此咱们只提取有用的列便可。ide
还有另外一种经常使用的提取方法loc。学习
也能够直接用“.”和“[]”来提取列。spa
数据提取方法掌握这些就能够了,接下来看一下其余方面的。命令行
查看数据表属性orm
能够用如下方法查看数据表的属性。对象
对数据表的数据进行清洗blog
能够用如下方法对数据进行清洗。
对数据表的数据进行统计
能够用如下方法对数据进行统计。
对数据表的数据进行筛选
能够用如下方法对数据进行筛选。结合上面的统计方法使用也能够的。
对数据表的数据进行汇总
能够用如下方法对数据进行汇总。
pandas的功能还有不少,这里只展现了一部分,你们能够参考pdf去挖掘更多的功能哦~