Python在1991年首次发布,Python2.0于2000年发布,8年后Python3.0发布。根据Stack Overflow在2017年的调查显示,近45%的数据科学家使用Python做为主要的编程语言,Python每一次的进步都是它成为数据分析主流工具的重要因素。web
推荐下我本身建立的Python学习交流群960410445,这是Python学习交流的地方,无论你是小白仍是大牛,小编都欢迎,不按期分享干货,包括我整理的一份适合零基础学习Python的资料和入门教程。
编程
近年来,Python的被使用性愈来愈高,尤为是Jupyter Notebook备受你们喜好。根据Ben Frederickson进行的一项调查显示,Jupyter Notebook在Github上的月活跃用户(MAU)的占比在2015年后大幅上升。机器学习
能够看到,在CDA对数据分析人才等级的划分中,基本上对Python软件的应用都有必定的要求。编程语言
既然Python这么受欢迎,那咱们就有一个问题了,Python一个开源的软件,到底能够作什么呢?工具
Python具备丰富和强大的库,其语言简洁、优雅,有时候能够用几句话就能表达出C语言几千行、Java几百行的代码。学习
Python能够作的事情有不少:excel
一、web开发、cdn
二、数据分析、blog
三、数据挖掘、教程
四、机器学习、
五、爬虫等等
包括它的可视化功能也是和R能够媲美的。
在我看来,Python近几年受追捧的一部分缘由和数据分析行业的爆发有着密不可分的关系,随着各大中小型企业对数据的重视程度的增长,数据分析师需求的大幅上涨,而Python做为数据分析界最容易入门上手而且作数据分析首选的的分析工具,需求也相应有了暴增。
Python中有两个最基础的包:Pandas和Numpy。
Pandas是Python中一种数据分析的包,而Numpy是一个能够借助Python实现科学计算的包,能够计算和储存大型矩阵。因此,用Python来作数据分析基本需求均可以被实现,这也是Python能够普遍运用到数据分析中的缘由。
接下来我要提到的就是Python第一次引发我兴趣的一个点——爬虫,我是经过感到这个名词有趣而后去了解学习Python从而感到Python的有趣之处。爬虫就是爬取网页上咱们看到的信息,经过编写语句、整理获得咱们想要的数据,进而去作一些其余的数据分析,固然,这一切都要创建在合法合理的基础上。下面我给你们分析一个我本身爬虫的小练习。
这是一个爬取豆瓣tap250电影排行的程序代码:
爬取到结果整理以后以下(输出评分排名前十的电影):
使用上面的代码,我爬取了豆瓣top250电影的影名、类型、国家、时间、简介、评论等相关信息并最终输出为excel表格,这将有助于你剧荒的时候更好的选择高质量的电影。以上代码仅仅是我的练习所操做,有更简洁的语言欢迎你们一块儿交流。Python真的是一个神奇的工具!