【不单单是爬虫还有数据分析】从零开始学Python网络爬虫

点击获取书籍提取码:oqpq

内容简介—
Python是数据分析的首选语言,而网络中的数据和信息不少,如何从中获取须要的数据和信息呢?最简单、直接的方法就是用爬虫技术来解决。

本书是一本教初学者学习如何爬取网络数据和信息的入门读物。书中不只有Python的相关内容,并且还有数据处理和数据挖掘等方面的内容。本书内容很是实用,讲解时穿播了22个爬虫实战案例,能够大大提升读者的实际动手能力。

本书共分12章,核心主题包括Python零基础语法入门、爬虫原理和网页构造、第一个爬虫程序、正则表达式、Lxml库与×path语法、使用API、数据库存储、多进程爬虫、异步加载、表单交互与模拟登陆、Selenium模拟浏览器、Scrapy爬虫框架。此外,书中经过一些典型爬虫案例,讲解了有经纬信息的地图图表和词云的制做方法,让读者体验数据背后的乐趣。

本书适合爬虫技术初学者、爱好者及高等院校的相关学生,也适合数据爬虫工程师做为参考读物,同时也适合各大Python数据分析的培训机构做为教材使用。


前言

随着Internet的飞速发展,互联网中天天都会产生大量的非结构化数据。如何从这些非结构化数据中提取有效信息,供人们在学习和工做中使用呢?这个问题促使网络爬虫技术应运而生。因为Python语言简单易用,并且还提供了优秀易用的第三方库和多样的爬虫框架,因此使得它成为了网络爬虫技术的主力军。近年来,大数据技术发展迅速,数据爬取做为数据分析的一环也显得尤其重要。程序员要进入与数据处理、分析和挖掘等相关的行业,就必需要掌握Python语言及其网络爬虫的运用,这样才能在就业严峻的市场环境中有较强的职场竞争力和较好的职业前景。
目前,图书市场上仅有的几本Python网络爬虫类图书,要么是国外优秀图书,但书籍翻译隐晦,阅读难度大,并且每每因为网络缘由,使得书中的案例不能正常使用,所以不适合初学者;要么是国内资料,但质量良莠不齐,并且不成系统,一样不适合初学者。整个图书市场上还鲜见一本适合初学者阅读的Python网络爬虫类图书。本书即是基于这个缘由而编写。本书从 Python语言基础讲起,而后深刻浅出地介绍了爬虫原理、各类爬虫技术及22个爬虫实战案例。本书所有选用国内网站做为爬虫案例,便于读者理解和实现,同时也能够大大提升读者对Python网络爬虫项目的实战能力。





程序员

相关文章
相关标签/搜索