WinHTTrack Website Copier使用说明

WinHTTrack Website Copier使用说明html

WinHTTrack Website Copier能够抓取整个网站或者某个网页、某个论坛帖子。以抓取论坛某个主题帖子为例:web

一、打开WinHTTrack Website Copier,下一步浏览器

二、工程名能够以帖子标题命名,最好用英文,分类随意,保存路径建议非C盘。工具

 

 

 三、咱们要下载若干个帖子,因此操做选择下载个别文件,web地址能够逐个输入,也能够用list列表,列表以回车键分开,对于有规律的帖子,能够在excel中拖动快速造成。post

http://bbs.tianya.cn/post-399-70857-1.shtml网站

http://bbs.tianya.cn/post-399-70857-2.shtmlspa

http://bbs.tianya.cn/post-399-70857-3.shtml3d

  四、选项,最大深度选择1,最大外部连接深度选择0这样咱们只搜索当前帖子或页面所在的网址内容,不要外链到其余网站,因此选择0.这两个选项很重要。excel

 五、连接我选择了试图捕获全部的URLs,保存全部指向非HTML文件的连接,例如外部的zip文件或图片文件,首先保存HTML文件,取默认也行,没看出多少区别。htm

 六、构造取默认值便可。

 七、搜寻页面取默认值。

 八、浏览器标致取默认值。

 九、肯定后直接开始。

 10、特别要注意的是,新建一个工程要从新命名,不然会覆盖原来的地址!

WinHTTrack Website Copier比Offline Explorer Portable(离线浏览器工具)的好处是抓取的文件很精准,没有多余的外链和文件,并且文件都是压缩以后存储的,占用空间较小,并且文件数量很小。而Offline Explorer Portable搜索深度设置为1的时候,会搜索本站点的外链,这不是我想要的,可是设置搜索深度为0的话,又会出现附件没有被下载的问题。

缺点是同一个站点的文件不能共用,须要再次下载,若是把列表放在一块儿下载,之前下载的又会被覆盖,而Offline Explorer Portable会更新之前下载的目录,它是以站点为单位进行下载的,网站有更新直接刷新下就行了。

WinHTTrack Website Copier还有个缺点是网址不支持变量,对于有规律的网址,须要借助excel生成。而Offline Explorer Portable有网址宏功能,能够自定义网址的起始页,例如page=:{1..4}表明1~4页。

WinHTTrack Website Copier和Offline Explorer Portable均可如下载论坛的附件(包括zip和jpg等类型的图片附件),可是论坛的图片不必定能正确抓取,网页内嵌的图片能够正常抓取,缘由有待探索。

 

2018年10月9日