最近须要抓取部分网页股票板块数据,使用的一些开源工具html
页面抓取:java
HttpComponent中的HttpClient4.1: http://hc.apache.org/downloads.cgiapache
页面解析:ide
HttpParser: http://htmlparser.sourceforge.net/工具
http://htmlparser.sourceforge.net/javadoc/index.html.net