今天爬知乎的时候把整个html写进本地文件,拟先用浏览器打开,观察爬虫请求到的网页大体什么样子,再作解析页面的策略html
但浏览器打开.html文件后页面一直跳转,以下 浏览器
解决方案: 用文本编辑器打开html文件,按Ctrl+H,将全文的js替换成空格或者其余便可 编辑器
再打开就正常了 htm