Python 学习资料推荐

时间 2019-11-06

原文原文链接

本人业余写python爬虫、python小工具已有两年有余了，在这里推荐一些学习时以为比较好的视频教程、文章教程等，纯属我的建议，不喜勿喷css

资料篇

自学最好的仍是动手操做，想用什么找什么，语法文章推荐Python3菜鸟教程视频教学中国大学MOOC，我的比较偏好嵩天老师的课程,有不少课程涉及到了Python语言程序设计、Python网络爬虫与信息提取、Python数据分析与展现、Python科学计算三维可视化等，能够说很全嵩天老师全部课程，其次视频推荐莫烦Python,里面有文章介绍和视频介绍，别人偏向与文章介绍，这样更快更节省时间html

爬虫篇

介绍一下爬虫涉及到的第三方库及其相关文档python

数据分析篇

数据分析的第三方库介绍mysql

附上github上python不一样用途的第三方库的总价awesome-pythongit

css选择器语法

表达式                          说明
*                              选择全部节点
#container 选择id为container的节点
.container                     选取全部class包含container的节点
li a                           选取全部li下的全部a节点
ul + p                         选择ul后面的第一个p元素
div#container > ul 选取id为container的div的第一个ul子元素

ul ~ p                         选取与ul相邻的全部p元素
a[title]                       选取全部有title属性的a元素
a[href="http://baidu.com"]     选取全部href属性为http://baidu.com值的a元素
a[href*="baidu"]               选取全部href属性包含baidu的a元素
a[href^="http"]                选取全部href属性值以http开头的a元素
a[href$=".jpg"]                选取全部href属性值以.jpg结尾的a元素
input[type=radio]:checked      选择选中的radio的元素

div:not(#container) 选取全部id非container的div属性
li:nth-child(3)                选取第三个li元素
tr:nth-child(2n)               第偶数个tr

[css视频介绍](http://www.w3school.com.cn/css/css_selector_type.asp)
复制代码

re正则表达式语法

字符                     匹配
.                       任意字符（除了\n）
[...]                   字符集
\d/\D                   数字/非数字
\s/\S                   空白/非空白
\w/\W                   单词字符[a-zA-Z0-9]/非单词字符
*                       前一个字符0次或者无限次
+                       前一个字符1次或者无限次
?                       前一个字符0次或者一次
{m}/{m,n}               前一个字符m次或者n次
*?/+?/??                非贪婪（尽量少匹配字符）
^                       字符串开头
$                       字符串结尾
\A/\Z                   指定的字符串必须出如今开头/结尾
|                       匹配左右任意一个表达式
(ab)                    括号中表达式做为一个分组
\<number>               引用编号为num的分组匹配到的字符串
(?P<name>)              分组起一个别名
(?P=name)               引用别名为name的分组匹配字符串
[\u4E00-\u9FA5]         一个汉字
复制代码

xpath语法

表达式                     说明
article                   选取全部article元素的全部子节点
/article                  选取跟元素article
article/a                 选取全部属于article的子元素的a元素
//div                     选取全部div子元素（不论出如今文档任何地方）
article//div              选取全部输入article元素的后代的div元素，无论它出如今article之下的任何位置
//@class                  选取全部名为class的属性

/article/div[1]           选取属于article子元素的第一个div元素
/article/div[last()]      选取输入article子元素的最后一个div元素
/article/div[last()-1]    选取属于article子元素的倒数第二个div元素
//div[@lang]              选取全部拥有lang属性的div元素
//div[@lang='eng] 选取全部lang属性为eng的div元素 /div/* 选取属于div元素的全部子节点 //* 选取全部元素 //div[@*] 选取全部带属性的title元素 //div/a|//div/p 选取全部div元素的a和p元素 //span|//ul 选取文档中的span和ul元素 article/div/p|//span 选取全部属于article元素的div元素的p元素以及文档中全部的span元素 复制代码

Python 学习资料推荐

目录

资料篇

爬虫篇

数据分析篇

css选择器语法

re正则表达式语法

xpath语法