在进行数据分析时,免不了要用到pandas库,网上关于pandas的操做说明已是很全了,在这里再也不赘述。程序员
我将记录一下今天下午在进行数据集的读取时,遇到的一些小问题,进行相关的记录,望后来者再也不犯相同的错误,也是给本身的一个小小的总结。工具
1.(.csv)文件;3d
2.工具:Jupyter Notebook(简称jp) ,Pycharm(简称pc);code
3.使用anconda中的pandas库;对象
1、问题描述blog
当我在利用jp进行.csv文件的读取时出现了下面这种现象:utf-8
这个实际上是很常见的问题,那是由于咱们经常会忘记先执行以前的代码,而是先执行了后面的代码,致使pandas库其实是没有被import的。pycharm
很快我也发现了这个问题,这都是粗心致使的,小伙伴们须要警戒这些小错误!cmd
这个问题被解决了,不幸的是,出现了另外一个问题,以下图所示:编译器
看到这一长串错误,做为一个上手没多久的小白来讲内心不免会心慌,这问题处在哪里呢?
2、思考错误来源
强行让本身冷静下来,想想我在这些操做中哪里会出现问题?百度了一番,我有如下3个怀疑对象:
1.代码写错了?(不可能啊,一共就两行代码,校对了100遍也看不出什么错误,排除!)
2.这是我第一次使用jp,是否是这个编译器出现问题了?(应该不会吧,其它加减乘除均可以的呀,路径/环境从错误中能够看出也没有问题,为确保万无一失,
我在cmd中查看个人pandas库是否安装,种种迹象代表应该不是编译器的问题,但我仍是不放心,因为我屡次使用且运行pc(pycharm)是没有问题的,我把这
两行代码放到pc上是否是能够正常运行,可是实践告诉我也出错了,也排除了jp的错误,冤枉它了,对不起!)
3.有多是我读取的数据集有问题,由于错误的最后是:'utf-8' codec can't decode byte 0xcf in position 2: invalid continuation byte ,这让我想起数据集通常都不
是utf-8的格式,所以我另存为了utf-8格式的.csv数据集,而后进行数据的读取操做,终于正常了!
3、反思
这一个可能对于有经验的程序员来讲可能几分钟或者几秒钟就解决了,而我花了将近一个小时进行思考、错误定位、实践检验等,这其中有个人不仔细形成的错误,
也有原先我并不知道的错误,现将这些错误整理一下,为未来的本身或者读者遇到相似的问题能够参考,也是对本身的一种反思、警惕!
2019.05.19