天蛛爬虫学习笔记——盗亦有道

天蛛爬虫学习笔记——盗亦有道 爬虫应该遵循网络协议,有些网站中有Robots协议需要遵守,查看某个网站的Robots协议在对应的URL后加robots.txt,例如:https://www.csdn.net/robots.txt。 User_agent:*,表示对所以的爬虫用户 Disallow:/scripts ,表示禁止爬取/根目录下的 scripts 目录 User_agent:EtaoSp
相关文章
相关标签/搜索