利用QT编写一个简单爬虫程序

从高中到大学,一直在固定小说网中下载小说,小说网停机过好几次但最后又起死回生。最近萌发一个想法,把小说网里的小说都爬下来。。 既然要爬网站肯定要对网站结构十分了解,幸好小说网没有弄什么登陆防爬措施,结构还是很简单的。 几个分类,各个分类下按页以时间排序 获取小说详细页地址其实很简单,利用正则表达式即可获得。 <div class="s">作者:<a href="/Writer/22265.html
相关文章
相关标签/搜索