Python大佬利用网络爬虫抓取新浪微博,一天可抓取1300万条数据!

爬虫功能:python 此项目和QQ空间爬虫相似,主要爬取新浪微博用户的我的信息、微博信息、粉丝和关注。 代码获取新浪微博Cookie进行登陆,可经过多帐号登陆来防止新浪的反扒(用来登陆的帐号可从淘宝购买,一块钱七个)。 项目爬的是新浪微博wap站,结构简单,速度应该会比较快,并且反扒没那么强,缺点是信息量会稍微缺乏一些(可见爬虫福利:如何爬wap站)。 爬虫抓取微博的速度能够达到 1300万/天
相关文章
相关标签/搜索