xpath匹配标签下面全部内容文字

在咱们利用xpath匹配页面标签时,常常会遇到标签下面还包含标签,可是咱们只想取下面的全部文字

例如相匹配图中 div[@class='display-content']下面全部P的文字,此时咱们能够利用这个方法

图片描述

直接上代码编码

def get_details(url):
    text_response = requests.get(link)
    print('编码格式', text_response.encoding)
    encode_rsp = text_response.encoding
    response = text_response.text.encode(encode_rsp).decode('utf-8')
    text = etree.HTML(response)
    tt = text.xpath("//div[@class='display-content']")
    text_info = tt[0].xpath("string(.)")
    return text_info

返回结果如图
图片描述url

相关文章
相关标签/搜索