jsoup( HTML parser ) cookbook

时间 2019-11-09

标签 jsoup html parser cookbook 栏目 Java 繁體版

原文原文链接

Introduction

Parsing and traversing a Document

Input

Parse a document from a String

Parsing a body fragment

Load a Document from a URL

Load a Document from a File

Extracting data

Use DOM methods to navigate a document

Use selector-syntax to find elements

Extract attributes, text, and HTML from elements

Working with URLs

Example program: list links

Modifying data

Set attribute values

Set the HTML of an element

Setting the text content of elements

Cleaning HTML

Sanitize untrusted HTML (to prevent XSS)

Cookbook 目录

入门

解析和遍历一个html文档

输入

解析一个html字符串

解析一个body片段

从一个URL加载一个Document对象

根据一个文件加载Document对象

数据抽取

使用dom方法来遍历一个Document对象

使用选择器语法来查找元素

从元素集合抽取属性、文本和html内容

URL处理

程序示例：获取全部连接

数据修改

设置属性值

设置元素的html内容

设置元素的文本内容

HTML清理

消除不受信任的html (来防止xss攻击)