Heritrix研究笔记(一)

这个开源的Web爬虫,Internet Archive在它的官方文档中说只维护在linux下,我不想用那么麻烦的bash shell去设置那些环境变量什么的,所以还是偷点懒,自己写个windows命令脚本来让这个爬虫在windows下面跑起来吧,现在就跟我来吧,呵呵。 要在Windows上让Heritrix跑起来,下面三步就OK了: <!--[if !supportLists]-->1) <!--
相关文章
相关标签/搜索