跟小白学Python数据分析——数据导入1

Mr.林:今天咱们来学习数据导入,须要使用到Pandas模块。
小白:模块?这个是什么东东?
Mr.林:模块至关因而一个文件夹,它可以用于存放同个主题相关的Python代码段,包括定义函数、类和变量。
例如将数据处理相关的函数都存放在一个模块里,将数据分析相关的函数都存放在一个模块里,将数据可视化相关的函数都存放在一个模块里。这样就能够在其余有须要的地方进行调用,在编写程序的时候,常常须要引用其它模块。
你能够将Excel菜单中的每一个选项卡 当作是一个模块,例如数据选项卡下就包含了数据获取和转换、链接、排序和筛选、数据工具等功能。只是它以图形界面的方式供咱们选择使用。
跟小白学Python数据分析——数据导入1
而Python中的模块通常看不见摸不着,须要在使用的时候进行导入使用,因此对初学者来讲不算太友好,这也是你们认为Python难学的缘由之一。
另外Python中模块的概念,在 Java 中称之为包(package),而在 C\C++中则称之为库(library),Java和C\C++都是程序员经常使用的编程语言,因此有些程序员就会把Python 中的模块混淆称之为包和库,你只要明白它们说的是一回事便可。
小白:原来是这么回事,那Pandas模块又是什么?
Mr.林:Pandas模块是Python的一个数据分析模块,它最初被用做金融数据分析工具而开发出来,因此Pandas为时间序列分析提供了很好的支持。
为了提供高效操做大型数据集的工具,Pandas提出了一套相似Excel的标准数据应用框架,包含了相似Excel表格的数据框DataFrame,以及快速便捷地处理数据的函数和方法,让数据分析整个过程变得快速、简单。能够绝不夸张地说,Pandas是Python中进行数据分析的最好工具。
小白:Pandas模块怎么使用呢?它在哪呢?
Mr.林:在安装Anaconda的时候,都已经一块儿安装好了,咱们只需把它导入就可使用了,主要有两种使用方法:
第一种是使用import语句进行导入。
import 模块名
这是模块导入最常使用的方法,模块导入后,就能够经过使用 模块名.变量名调用模块中的变量,使用 模块名.函数名 调用模块中的函数。
第二种是使用 from import 语句进行导入。
from 模块名 import 函数名
这种状况就是明 确知道要导入哪一个模块哪一个函数或变量的时候使用。使用这种导入的方式,在使用函 数或变量的时候,就不用在前面加上对应的模块名了。
小白:那咱们是否是能够导入Pandas模块了?
Mr.林:能够,不过不用那么急,咱们先来看咱们要导入的数据data.csv,先使用Notepad++打开查看数据是什么样子的:
跟小白学Python数据分析——数据导入1
这份数据是一份用户数据,记录了用户的id,注册日期reg_date,用户的身份证号id_num,性别gender,生日birthday,年龄age六个字段数据,每一个字段使用英文逗号分隔。
还有一个很重要的信息,就是这份数据采用UTF-8的编码格式记录数据。
UTF-8是互联网上使用最广的一种unicode的实现方式,为传输而设计的编码,最大的特色是统一无国界,能够显示全世界上全部文化的字符。
如今咱们能够来导入数据了,打开spyder,输入如下代码python

1import pandas
2data = pandas.read_csv(
3'D:/D/data.csv',
4 engine='python',
5 encoding='utf8'
6)

小白:前三行我大概看懂了,那么第4、五行都是什么意思呀?
Mr.林:我给代码加上对应的注释,使用#来添加注释,这样解析器就不会执行注释所在的行的内容。你再看看。程序员

1# 导入pandas模块
 2import pandas
 3# 使用pandas模块中的read_csv导入data.csv文件
 4data = pandas.read_csv(
 5# 第一个参数为数据文件所在的路径,由于是字符串须要用单引号引发
 6'D:/D/data.csv',
 7# 第二个参数是为了解决路径中包含中文字符没法导入的问题
 8 engine='python',
 9# 第三个参数是设置数据文件对应的编码格式
10 encoding='utf8'
11)

小白:懂了,懂了,原来是这么回事。
Mr.林:在变量浏览窗口中就能够看到刚导入的data变量了,双击打开data变量,就能够获得下面这张表。
跟小白学Python数据分析——数据导入1
Mr.林:今天就到这,下次咱们继续学习数据导入的其余操做,小白你回去要多多练习,多敲代码。
跟小白学Python数据分析——数据导入1编程

若是你喜欢本文,能够点击右下角在看
若是你在跟着学习,请在留言区留言:打卡
若是你刚看到本文,能够查看本系列历史文章跟着学习:
跟小白学Python数据分析——Anaconda安装
跟小白学Python数据分析——使用spyder

长按识别下方二维码,并关注公众号
回复“DR”获取案例数据
回复“++”获取Notepad++下载地址
跟小白学Python数据分析——数据导入1框架

相关文章
相关标签/搜索