《Python 数据分析与挖掘实战》第十五章 电商产品评论数据LDA主题模型、文本挖掘

一、分析方法与过程 本次针对京东商城上的“美的”热水器的文本评论数据进行建模分析。本文进行基本的预处理、分词等操作后建立LDA主题模型,实现对文本评论数据的倾向性判断及信息挖掘分析。 (1)利用爬虫进行数据采集(由于最近较忙,爬虫代码等空了再附上,暂且先用书中提供的数据进行建模),原始文本评论数据为 将品牌为“美的”的一列评论抽取,另存为文本文件。代码如下 (2)对数据进行基本处理,包括数据预处理
相关文章
相关标签/搜索