HtmlUnit是Java一个无界面浏览器,既然是浏览器,对于咱们爬取网页数据来讲就很喜欢啦。因为HttpClient没法对JavaScript进行处理,而如今不少网页又大量使用了JavaScript和JQuery,对于须要执行JS方法爬取的来讲,这个框架就相当重要。java
下面为请求执行一个js方法,废话很少说,上代码:web
final WebClient webClient=new WebClient(); webClient.getOptions().setCssEnabled(false); HtmlPage page=webClient.getPage("目标地址"); String hrefValue = "js方法"; ScriptResult s = page.executeJavaScript(hrefValue);//执行js方法 page = (HtmlPage) s.getNewPage();//得到执行后的新page对象 System.out.println(page.asXml()); webClient.close();
执行后便可得到你想要的东西,是否是so easy,哪里不会点哪里~浏览器
纯手打,欢迎各位童鞋拍砖。框架
转载请指明出处:http://my.oschina.net/u/1991646/blog/694993.net