原文连接:Step by step approach to perform data analysis using Python
译文连接:使用Python一步一步地来进行数据分析--By Michael翔python
你已经决定来学习Python,可是你以前没有编程经验。所以,你经常对从哪儿着手而感到困惑,这么多Python的知识须要去学习。如下这些是那些开始使用Python数据分析的初学者的广泛遇到的问题:git
当开始学习一项新技术时,这些都是能够理解的困惑,这是《在20小时内学会任何东西》的做者所说的。不要惧怕,我将会告诉你怎样快速上手,而没必要成为一个Python编程“忍者”。github
在开始使用Python以前,我对用Python进行数据分析有一个误解:我必须不得不对Python编程特别精通。所以,我参加了Udacity的Python编程入门课程,完成了code academy上的Python教程,同时阅读了若干本Python编程书籍。就这样持续了3个月(平均天天3个小时),我那会儿经过完成小的软件项目来学习Python。敲代码是快乐的事儿,可是个人目标不是去成为一个Python开发人员,而是要使用Python数据分析。以后,我意识到,我花了不少时间来学习用Python进行软件开发,而不是数据分析。编程
在几个小时的深思熟虑以后,我发现,我须要学习5个Python库来有效地解决一系列的数据分析问题。而后,我开始一个接一个的学习这些库。segmentfault
在我看来,精通用Python开发好的软件才可以高效地进行数据分析,这观点是没有必要的。数组
有许多优秀的Python书籍和在线课程,然而我不并不推荐它们中的一些,由于,有些是给大众准备的而不是给那些用来数据分析的人准备的。一样也有许多书是“用Python科学编程”的,但它们是面向各类数学为导向的主题的,而不是成为为了数据分析和统计。不要浪费浪费你的时间去阅读那些为大众准备的Python书籍。数据结构
在进一步继续以前,首先设置好你的编程环境,而后学习怎么使用IPython notebookapp
从code academy开始学起,完成上面的全部练习。天天投入3个小时,你应该在20天内完成它们。Code academy涵盖了Python基本概念。可是,它不像Udacity那样以项目为导向;不要紧,由于你的目标是从事数据科学,而不是使用Python开发软件。函数
当完成了code academy练习以后,看看这个Ipython notebook:工具
Python必备教程(在总结部分我已经提供了下载连接)。
它包括了code academy中没有提到的一些概念。你能在1到2小时内学完这个教程。
如今,你知道足够的基础知识来学习Python库了。
首先,开始学习Numpy吧,由于它是利用Python科学计算的基础包。对Numpy好的掌握将会帮助你有效地使用其余工具例如Pandas。
我已经准备好了IPython笔记,这包含了Numpy的一些基本概念。这个教程包含了Numpy中最频繁使用的操做,例如,N维数组,索引,数组切片,整数索引,数组转换,通用函数,使用数组处理数据,经常使用的统计方法,等等。
Pandas包含了高级的数据结构和操做工具,它们使得Python数据分析更加快速和容易。
教程包含了series, data frams,从一个axis删除数据,缺失数据处理,等等。
这是一个分为四部分的Matplolib教程。
第一部分介绍了Matplotlib基本功能,基本figure类型。
包含了怎么调整figure的样式和颜色,例如:makers,line,thicness,line patterns和color map.
图的注释--包含若干图,控制坐标轴范围,长款比和坐标轴。
包含了一些复杂图形。
MatplotLib Part4
你学习Python时能犯的最简单的错误之一就是同时去尝试学习过多的库。当你努力一会儿学会每样东西时,你会花费不少时间来切换这些不一样概念之间,变得沮丧,最后转移到其余事情上。
因此,坚持关注这个过程:
你能够从个人github上下载这些文件。这些文件是以.ipynb格式存放。这些文件也包含了我用来讲明的一些图片。
博客连接: