HtmlUnit实现ajax网络爬虫

网上关于网络爬虫实现方式有不少种,可是不少都不支持Ajax,李兄说:模拟才是王道。确实,若是可以模拟一个没有界面的浏览器,还有什么不能作到的呢?关于解析Ajax网站的框架也有很多,我选择了HtmlUnit,官方网站:http://htmlunit.sourceforge.net/,htmlunit能够说是一个Java版本的无界面浏览器,几乎无所不能,并且不少东西都封装得特别完美。这是这几天来积累
相关文章
相关标签/搜索