Hello!上一期我们生成了一个好看的词云、虽然不是很好看、但我们今天要做真正好看的词云。
1.用jieba库来分词、实现词云、不是句云:
(资料图片)
我们上期做的词云、是以句子分的。因为wordcloud库默认是以标点符号和空格来分开各个“词”的。这对中文明显不友好、所有我们要先用jieba库分词。
先打开上期的文件
导入jieba库。然后新建一个列表text_list、设它的初始值为jieba库分词返回的列表。
generate函数的参数只能接收字符串类型的数据、所以我们用join()来将text_list转换为字符串、列表的像之间用空格隔开、以便计算机区分。
现在来看一下我们的词云。
现在就是一个一个的词啦。
2.生成有形状的词云
现在的词云都是杂乱无章的、鱼龙混杂、何必不让它像一张图片?
说好就干。新增的库:pillow(导入图片),numpy(获得图片数据)。
首先导入它们俩、用()打开一张准备的图片。
这张图在桌面。
再用()获得图片数据。
再在第9行那修改mask参数、设为图片数据。
再来看一下我们的词云。
嗯……你们觉得像吗?
3.生成类似的颜色
现在的词云有一点“像”图片了、但颜色不像。
这需要导入wordcloud的ImageColorGenerator类。用来生成图片颜色。
将它设置在第12行的color_func参数中。
现在看一下词云。
乍一看、不像呢?
下一次得抠图啦!!!