[python爬虫] Selenium爬取新浪微博内容及用户信息

在进行天然语言处理、文本分类聚类、推荐系统、舆情分析等研究中,一般须要使用新浪微博的数据做为语料,这篇文章主要介绍若是使用Python和Selenium爬取自定义新浪微博语料。由于网上完整的语料比较少,而使用Selenium方法有点简单、速度也比较慢,但方法可行,同时可以输入验证码。但愿文章对你有所帮助~ 源码下载地址:http://download.csdn.net/detail/eastmou
相关文章
相关标签/搜索