爬虫实战-微博主页内容，评论

时间 2020-02-01

原文原文链接

微博可用selenium获取页面，分析页面数据，提取数据，就是有点慢；能够对手机端api数据提取：scrapy连接html 能够经过粉丝列表，关注列表取出微博id后依次循环抓取全站，反爬需cookies访问，构建cookies池反反爬，代理ip等反爬手段，python 单页分析：json import re,json import requests import pandas # 没接触pand