Java网络爬虫抓取新浪微博我的微博记录

在正题以前,先了解一下java下抓取网页上特定内容的方法,也就是所谓的网络爬虫,在本文中只会涉及简单的文字信息与连接爬取。java中访问http的方式不外乎两种,一种是使用原生态的httpconnection,还有一种是使用封装好的插件或框架,如httpclient,okHttp等。在测试爬取网页信息的过程当中,本人是使用的jsoup工具,由于该工具不单单封装了http访问,还有强大的html解析
相关文章
相关标签/搜索