python 使用pyquery提取字段遇到的一个坑

时间 2021-01-06

原文原文链接

问题描述：在抓取网页内容时，利用requests，bs4等均能在结果中看到我想要的某字段，但是使用pyquery提取时却没有了检查后不是编码的问题（结果中有正常显示的汉字），也不是xhtml和html的问题发现问题：打开网页源代码，检索“尾页”，发现含有此字段的代码被注释了！！！解决办法：将被注释代码提取出来，再利用pyquery转化并提取，就可以了。