爬虫入门(Java)

网络爬虫 网络爬虫是什么?是一种按照必定规则,自动抓取网页信息的脚本。对于获取公开数据,是一个效率很高的工具。本篇文章先介绍HttpClient,Jsoup这两个开源工具。html HttpClient 官方文档http://hc.apache.org/httpcomponents-client-ga/index.htmljava HttpClient不是浏览器,一个apache开源的库。它是一个
相关文章
相关标签/搜索