HttpWebRequest采集（二）-- C#解析html

时间 2021-07-14

原文原文链接

上次说到了用HttpWebRequest来采集网站信息然而对于采集下来的html源码怎么来解析呢，这个问题网上很多人都说采用正则来实现，这个的要求是高的，也会很烦锁。相对于一个简单的页面来说这个方法还行，如果要采集的数据很多的话就要写N多个正则，N*M次的判断来取得自己想要的数据，这个工作量是很大的，并且对采集的功能上也会有影响。有人会问有没有方法可以像解析xml那样来解析html呢

>>阅读原文<<