python实例:自动爬取豆瓣读书短评,分析短评内容

思路:html 一、打开书本“更多”短评,复制连接python 二、脚本分析连接,经过获取短评数,计算出页码数app 三、经过页码数,循环爬取当页短评函数 四、短评写入到txt文本post 五、读取txt文本,处理文本,输出出现频率最高的词组(前X)----经过分析获得其余结果可自由发散url 用到的库:spa lxml 、re、jieba、time 整个脚本以下code # -*-coding:
相关文章
相关标签/搜索