爬虫实战-微博主页内容,评论

微博可用selenium获取页面,分析页面数据,提取数据,就是有点慢;能够对手机端api数据提取:scrapy连接html 能够经过粉丝列表,关注列表取出微博id后依次循环抓取全站,反爬需cookies访问,构建cookies池反反爬,代理ip等反爬手段,python 单页分析:json import re,json import requests import pandas # 没接触pand
相关文章
相关标签/搜索