新浪微博爬虫(一)

最近一个项目须要爬取微博用户的发微博数量、转发量、评论数、点赞数,并对评论作情感分析。这两天大概作出了一个雏形,在此把爬微博过程当中遇到的问题记录一下,供本身学习和你们参考。 1、模拟登录 抓包要耐心; 读懂新浪帐号密码加密算法 request的使用web 2、PC 端vs. 移动端 PC端:页面更复杂,但好像反爬比移动端要宽松点儿 移动端:页面结构简单,适合新手算法 3、爬取过程当中遇到的坑 编
相关文章
相关标签/搜索