xpath 在firefox,chrome中正常,在requests中不正常的解决。

经屡次测试发现:html

lxml中的etree格式化之后,直接使用firefox或chrome提取的xpath检索不到内容。chrome

主要是由于tbody测试

# 车种xpath
czxx = '/html/body/table/tbody/tr/td/table/tbody/tr[1]/td[7]'
# 车型xpath
cxxx = '/html/body/table/tr/td/table/tr[1]/td[5]'

看上面两个,去掉tbody就能够了。spa

上面两个xpath是用firefox提取的。firefox

下面是chrome提取的,也是要去掉tbodyxml

 

# 车种xpath
czxx = '//*[@id="report1"]/tr[1]/td[7]'
# 车型xpath
cxxx = '//*[@id="report1"]/tr[1]/td[5]'
相关文章
相关标签/搜索