爬虫 : url的自动补全

正常的url是有前缀 https://note.youdao.com 的,而有些a标签的url只有path路径,要实现自动拼接有两种办法: 1、需要先提取a标签中的部分url以后才能使用urljoin() 2、不需要提取a标签中的部分,LinkExtractor会自动提取并且补全url from scrapy.linkextractors import LinkExtractor 获取某个a标签的
相关文章
相关标签/搜索