
LDA主题分析中,如何生成专业主题词云图?
我们在LDA主题分析报告时,时常想优化主题词云图,那么怎么做才能凸显各个主题下的主题词呢?
这次我来交大家几种常见的制作主题词云图的简单教程。
本次使用的工具如下:
总体思考:
- 把各个主题下的词进行提取出来
- 给每个主题词配置一个专属颜色
- 生成词云图excel表数据
一、下载主题词列表数据结果
我们打开中文主题分析工具,生成主题分析报告,还不知道如何生成报告的小伙伴,查看这篇文章1款强大的主题分析软件,文科学妹也能秒上手!
我们会在【主题词列表】那里看到各个主题词的数据,并且也可以下载这些数据,同时也方便分析者进行其他方面的分析使用。
我们打开下载好的数据,提前了解下这些主题词,为下面制作词云做好铺垫
表头有很多信息,现在我们只需要3个信息就足够了“单词、次数、主题概率”,其他的表头信息直接删除即可,最终效果如下图所示
我们先来看主题概率这一列:100%所属某个主题的绝对是这个主题下的词,如中国:100%的词为中国这个主题下的词,住房公积金:100.00%就是所属住房公积金下的词、chatgpt:100.00%是chatgpt所属主题下的词
那么我们能筛选出这些词的话,我们就很容易制作各个主题下的词云图了,而不到100%主题概率的,都算作共有主题词了
二、制作主题分析词云图
根据上面的步骤,我们就可以制作好几种类的词云图
1、各个主题独有词云图
我们打开微词云的词云设计工具,这款工具是专门生成词云图的工具,支持高级编辑,任意修改词云参数,可以生成很有个性特色的词云图
首先我们要把100%所属主题分类词导入到词云图编辑器中即可
我先下载excel表3模版,因为这个表可以自定义关键词颜色,就是给予我们主题词赋予独特的颜色,用颜色来区分关键词所属主题。
我先把中国分类下的单词和次数都复制粘贴到我下载的这个表中,以及赋予一个主题色为绿色如:#02A702,而住房公积金主题的关键词颜色我设置为了红色#FF4B26
其他主题也是类似的方法,每个主题颜色都是独立的,颜色差距要大一些,好用来区分各个主题的区别即可。
主要说明下,词云图编辑器中的excel表的表头“词频”与主题分析主题词表头信息的“次数”是一个意思
因为词云图编辑器只识别“单词、词频”这个表头信息。
所以直接复制单词和次数两列信息到excel模版的单词和词频列下面即可。
我们直接把这个表数据上传上来,点击右下角的蓝色按钮“生成并使用”,就会自动回到主页面,点击顶部中间位置的红色按钮“加载词云”一张主题词云图基础版就生成完了
我们还可以调整下基础配置,来优化下主题词云图美观成功
例如可以重新选择一个形状,例如矩形、椭圆形、云,都是相对比较正规的词云形状
如果显示的单词太小,或者距离太远的话,我们还可以调整单词间距
如果单词想更粗一些,还可以修改下字体,选个更粗一点的字体即可。
2、各个主题共有的主题词云图
共有词就是非100%概率的其他词,这些词颜色都一致即可,所以生成起来更简单
我们直接把这些词复制到词云图编辑器中即可,复制单词和次数这两列数据,到简单导入中,最后点击右下角蓝色按钮“生成并使用”
剩下的就是修改下形状、单词颜色(建议黑色)、间距等配置即可,和上面的配置类似
3、多个主题下,主题交叉词云图
在主题分析报告中的主题词云图就是交叉式的,也有共有主题词和主题下独有词,那么生成思路也是和上面类似
我们在“各个主题独有词云图”表中,把共有词加入进去就行了,并且把共有词颜色指定为黑色#000000即可。
其实生成主题词云图方法很简单,主要是搞明白主题下的独有词有哪些,共有词有哪些,以及配置好颜色,颜色用来区分所属主题的值而已,颜色并没有实际分析的价值。
文章推荐
1.文本情感分析中,如何生成专业情感词云图?
2.如何利用词频表制作词云图
,已经有词频表数据!
3.LDA主题分析时,如何提高主题分类文本量的识别率?
4.网络关系图分析价值与关系网络可视化生成方法