python3爬虫基础-pyquery解析库

简介

看名称和jQuery比较接近,对没错,pyQuery容许您对XML文档进行jQuery查询。API尽量相似于jQuery。pyquery使用lxml进行快速XML和html操做。支持CSS选择器,操做在查找和操做HTML上是很是便捷的。html

安装和使用

直接使用pip便可安装python

pip install pyquery

URL初始化this

# -*- coding: utf-8 -*-
from pyquery import PyQuery as pq                           # 引入 pyquery 并设置别名
html_obj = pq('<html>this is test</html>')                  # html字符初始化对象
url_obj = pq(url='http://www.python.org',encoding='gbk')    # URL初始化对象
local_obj = pq(filename='test.html',encoding='gbk')         # 本地文件初始化对象

print(html_obj)                                             # 全部内容
print(url_obj('head'))                                      # 根据CSS标签类型选择
print(local_obj('#ID_01 .class_01 p'))                      # 根据CSS选择器来选择

==更多选择器请参考博文==url

  • 《jQuery基础 - 经常使用基本属性》
  • 《jQuery基础 - 选择器》
  • 《jQuery基础 - 筛选器》

官方文档code

https://pyquery.readthedocs.io/en/latest/
相关文章
相关标签/搜索