易数云数据抓取词云图制作

“文字云”就是对文本数据中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”。文字云本身对分析数据用处不大,但是在做报告的时候是道加分题,为什么呢?因为它好看呀,美的事物总是会加个印象分的。

在R中做文字云用的是wordcloud和wordcloud2,wordcloud2包是对wordcloud的改进升级,先举个例子,直接拿内置数据demoFreq,具体如下:
在这里插入图片描述
文字云图片如下:
在这里插入图片描述
是不是非常简单,当然这是因为用了wordcloud2包中的内置数据集,如果用实际的文本数据改如何处理呢?我们再以另一个例子说明。

如下图所示,我手中有一份在某网上超市对某款护发素的评价数据:
在这里插入图片描述
现在对这款数据做个文字云图,要做词云图首先要知道数据中有哪些词,每种词的频率是多少,所以首先我们要对文本数据进行分词和统计频次,在R中,分词要用到Rwordseg包,具体使用方法及过程如下:
在这里插入图片描述

我们可以对上面生成的datas处理一下,如上用summary()函数查看数据频次结果,包括频次最大值,最小值,中位数,3分位数,均值等,也可删除一些觉得无关紧要的单词,剔除一些频次太低的单词,具体操作如下:
在这里插入图片描述
这里就不对数据进行处理了,直接用wordcloud2对datas数据生成文字云图如下:
在这里插入图片描述
在文字云中点击里面的单词是可以看到词频数的,比如点击喜欢,会出现(喜欢:50)
在这里插入图片描述
另外对于文字云图也是可以对背景色(backgroundColor),文字云展示的形象(shape),文字云字体等进行调整(size/fontFamily),根据需要设置参数既可:在这里插入图片描述

了解更多分析及数据抓取可查看: http://cloud.yisurvey.com:9081//html/37be8794-b79e-4511-9d0a-81f082bac606.html