Python3制作词云进阶
2023-07-08 18:44:20 来源:哔哩哔哩

Hello!上一期我们生成了一个好看的词云、虽然不是很好看、但我们今天要做真正好看的词云。

1.用jieba库来分词、实现词云、不是句云:


(资料图片)

我们上期做的词云、是以句子分的。因为wordcloud库默认是以标点符号和空格来分开各个“词”的。这对中文明显不友好、所有我们要先用jieba库分词。

先打开上期的文件

导入jieba库。然后新建一个列表text_list、设它的初始值为jieba库分词返回的列表。

generate函数的参数只能接收字符串类型的数据、所以我们用join()来将text_list转换为字符串、列表的像之间用空格隔开、以便计算机区分。

现在来看一下我们的词云。

现在就是一个一个的词啦。

2.生成有形状的词云

现在的词云都是杂乱无章的、鱼龙混杂、何必不让它像一张图片?

说好就干。新增的库:pillow(导入图片),numpy(获得图片数据)。

首先导入它们俩、用()打开一张准备的图片。

这张图在桌面。

再用()获得图片数据。

再在第9行那修改mask参数、设为图片数据。

再来看一下我们的词云。

嗯……你们觉得像吗?

3.生成类似的颜色

现在的词云有一点“像”图片了、但颜色不像。

这需要导入wordcloud的ImageColorGenerator类。用来生成图片颜色。

将它设置在第12行的color_func参数中。

现在看一下词云。

乍一看、不像呢?

下一次得抠图啦!!!

相关新闻: