jsoup: Java HTML Parser

jsoup  Java HTML Parser

jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套很是省力的API,可经过DOM,CSS以及相似于jQuery的操做方法来取出和操做数据

HTMLParser 过小众,连官方文档都太少,中文的更少

不知道jsoup是否是把整个页面都解析成DOM树了,若是是这样可能会有一点点慢,同事说他那个爬新浪页面的爬虫项目,用jsoup知足得了客户需求
jsoup把整个页面都解析成DOM树






相关文章
相关标签/搜索