python 使用pyquery提取字段遇到的一个坑

问题描述: 在抓取网页内容时,利用requests,bs4等均能在结果中看到我想要的某字段,但是使用pyquery提取时却没有了 检查后不是编码的问题(结果中有正常显示的汉字),也不是xhtml和html的问题 发现问题: 打开网页源代码,检索“尾页”,发现含有此字段的代码被注释了!!! 解决办法: 将被注释代码提取出来,再利用pyquery转化并提取,就可以了。
相关文章
相关标签/搜索