做者:AI算法与图像处理算法
参考:http://www.sohu.com/a/149657007_236714网络
由词汇组成相似云的彩色图形。“词云”就是对网络文本中出现频率较高的“关键词”予以视觉上的突出,造成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就能够领略文本的主旨。app
一、直观,高大上
二、可装逼,很潇洒函数
命令:pip install jieba
命令:pip install wordcloud
备注:对于pycharm等可采用各自的方法导入包学习
文本:可爬取网上资料或某歌曲书籍等关键字,亦或是像我是本身手动输入文字并用tab隔开
图片:找本身喜欢的图片,这里我采用乔巴的图片做为背景,并且除了主要人物外,其余背景都为白色,显示效果较好。字体
# coding: utf-8
import jieba
from wordcloud import WordCloud,STOPWORDS
from scipy.misc import imread # 处理图像的函数
import matplotlib.pyplot as plt
# 读取文本文件
text = open('/media/pzw/0E50196C0E50196C/weixin/t1.txt', 'r').read()
# 对文本进行分词
cut_text = ''.join(jieba.cut(text))
# 读取图片
color_mask = imread('/media/pzw/0E50196C0E50196C/weixin/qiaoba.jpg')
# 生成词云
cloud = WordCloud(font_path='G:/py/wc/new_songti.ttc',# 这里是导入字体,由于我是采用英文的,全部不导入也并不影响,如果中文的或者有其余的字符须要本身选择合适的字体包
background_color="white",
mask=color_mask,
max_words=2000,
max_font_size=80)
word_cloud = cloud.generate(cut_text)
# 输出图片
plt.axis('off')
plt.imshow(word_cloud)
plt.show()
复制代码
今天的学习就到这里了,但愿你们能点个右下角小小的“好看”spa
很是感谢哈!!!!3d
END code