文本词频分析报告“现在的部分女性为什么不想生孩子”

文本词频分析报告“现在的部分女性为什么不想生孩子”

想借助在线分词,词频统计分析工具,来分析解读下近几年热火的话题”现在的部分女性为什么不想生孩子?”;

文本信息内容来源于知乎,我本身对生育与教育很感兴趣,所以更想写这篇“关于现在女性甚至是家庭生孩子话题”的文本分析报告。
好了直接开门见山,进入报告分析正题中。




文本分析信息统计

文本大小:4.35M纯文本

文字总数:2246390

回答人数:5000+




文本分析词频统计工具


微词云·在线文本分词词频统计分析


中文分词 在线词频统计 词频分析




报告词频统计与分析过程


01.内容文本导入

首先我们进入到微词云的分词文本导入

我是直接把抓去下来的问答内容变换成了txt文本,一键上传文本的形式。
目前微词云文本最大导入量是10M的纯文本大小,太大的文本系统会自动帮助拆分,文本过大分析确实会慢一些,因为分出的关键词会非常的庞大。


文本分析 文本上传 微词云



文本配置

配置1:如果你想提取“现在的部分女性为什么不想生孩子”文本中最大的关键词数量,可以把单次提取量配置为【返回所有单词】这是单词提取量最大的配置;如果你只是想提取高频词,其他低频词不关心的话,那么你的单词返回数量在500~1000之间足够了


文本提取量 词频统计 中文分词


配置2:有时候我会不勾选顶部的【去掉未知词性】,未知词性一般是“不在系统默认的词典范围内”的词性。

配置3:后面在说关于右侧的【自定义词典】功能,这个功能非常的棒,“本次着重也会介绍这款功能如何使用的”


文本提取量 词频统计 中文分词



发现自定义词

第一次没有任何的自定义词,发现有一些关心的单词并没有被系统分出来,我又点击(1)输入内容,把我希望分出来的词进行自定义词典了

其实很多人也很关心如何发现自定义词典的词语呢?我也很苦恼这个问题,如果我们可以轻松的把自己关心的自定义词找到的话很容易挖掘更有价值的文本内容呀

此处我总结的两个经验大家可以选择借鉴

方法1利用微词云的简单导入功能

点击微词云分词编辑器右上角顶部的【创建词云】,进入到词云图编辑器页面,点击左侧的【内容】,点击旁边的「导入单词」系统默认的就是简单导入

接下来把你要分析的文本导入进去,此处只支持复制粘贴的方式导入,挖掘自定义词重点在于底部的配置


主要把底部的限制字数改为3~3个,就是可以提取出3个字的关键词;当你设置为4~4提取出的就是4个字的关键词


文本提取量 词频统计 中文分词


虽然简单导入可以粗糙的划分颗粒度,但不建议在简单导入中进行分词,因为准确率相对比较低,微词云放入在线分词编辑器统计更精准;

那么接下来根基简单导入提取的3个字/4个字/5个字…的关键词进行筛选需要的自定义词吧


文本提取量 词频统计 中文分词


方法2利用微词云分词报告中的高频词位置定位

关键词定位在微词云分词中的第三步,也就是在筛词完的下一步生成文本分析报告步骤中,我一般优先照高频词进行定位发现自定义词,其次就是我比较关心的关键词了。


文本提取量 词频统计 中文分词


好了发现自定义词的技巧就先说到这里



02.筛选单词

筛词方法有四种

第一种:通过单词【词频大小】过滤掉一些单词,配置好一定选择【提交】按钮

第二种:通过左侧【词性列表】进行筛选需要的单词,并【打勾】

第三种:通过搜索单词进行细致的筛选单词

第四种:通过右侧的大面板进一步的筛选需要与过滤掉的单词,确保单词筛选无误


我每次的筛词顺序也基本上都是这样的,筛选单词的过程对接下来的分析很重要。


文本筛词 过滤无用词 中文分词


切记一定要提前下载自己的分词结果,防止数据丢失。

【下载分词结果】在右侧顶部位置处


最终通过这几种方法帮我筛选出80多个自定义词,自定义词为单个字的词,如果在导入内容时勾选了过滤单个字时,是没办法帮你分出来单个字的自定义词的,这一点大家要了解下。

如果发现你明明自定义了80个自定义词,在筛词页面发现只有60多个自定义词呢,一般是因为系统词频数过滤导致的,直接把你的低频词自定义词给过滤掉了。

解决办法就是;可以取消勾选词频过滤功能,并点击提交按钮即可。


文本筛词 过滤无用词 中文分词



03.得到报告并分析


筛词完成后,点击右下角的【确定使用所选单词并生成报告】


报告分析 词云图 词性柱状图 相关词分析



top20热词

一目了然,文本主题一下子就出来了,孩子,自己,生孩子,女性,我们,生活,父母,问题,结婚,老公,工作,他们,生育,妈妈,女人,家庭,选择,小孩,怀孕,社会


相关词分析 高频词分析 中文文本分析


我筛选的词云相关图


相关词分析 高频词分析 中文文本分析


鼠标移动到任意关键词身上会显示词频数,此处即是一个交互词云图,也可以直接点击关键词查看所在为文本位置以及与其他的词相关性

其实不难看出大家为什么大部分人不想生孩子,工作事业、社会、时间、教育、责任、经济、痛苦、压力、影响生活、付出、自私…

top30单词相关性


相关词分析 高频词分析 中文文本分析



分析孩子关键词

(1)我们先搜下孩子这个关键词,都可以看到什么结果

热词分析 关键词挖掘 文本分析


在搜索结果中我们直接点击生孩子,看看大家都提到了什么


文本提取关键词 关键词分析 在线分词


大家说了自己生孩子的痛苦、工作忙社会也没有给女人生孩子的时间、不想承担责任、对女性不公平、被忽略、经济承受不起、现代人生孩的观念改变、婚姻的不稳定等


文本提取量 词频统计 中文分词

可视化图来源懒人图云制作-图标云编辑器



分析结婚关键词

我们直接搜索结婚这个关键词,看看都提取了哪些关键词


相关词分析 高频词分析 中文文本分析

我们在看看大家对结婚与婚姻的看法是什么


婚姻句子提取 文本分析 关键词定位

可视化图来源懒人图云制作-图标云编辑器


为什么很多女性发声不想结婚,更多的是一种婚姻意识的觉醒,不想将就过一生;父母家庭婚姻的不健全多多少少都会给孩子的婚姻观造成影响,其实中国的婚姻社会是很不健全的,畸形的社会

我想不仅仅是女性不想结婚,也会有很多的男性不想结婚吧;然而不得不说,社会普遍现象,男性没房没车,很难找到老婆。婚姻非要增加上这层物质,也不会给男女的爱情婚姻上增加长久的幸福吧。




结尾总结

其实我们还可以单独的分析情感类的词或者某一类的词性关键词,可以从不同的维度进行分析文本;这里不得不在提出来,自定义词语筛词过程真的很重要,虽然话的时间成本比较高,但是文本分析的结果会更加的精准,可以挖掘更深层的内容

微词云中的关键词定位以及搜索关键词功能大大提交了词频的分析,一款值得信任的文本分析工具加上人工的分析会赋予文本分析新的灵魂。

最后更新于: 2021-08-21 19:40:31
感谢您的阅读,本文由 微词云 版权所有。如若转载,请注明出处:微词云(https://www.weiciyun.com/blog/fenxi-baogao2/
文本分析:"新东方转型培训家长"词频分析报告来了!

目录

  1. 1. 文本分析信息统计
  2. 2. 文本分析词频统计工具
  3. 3. 报告词频统计与分析过程
    1. 3.1. 01.内容文本导入
      1. 3.1.1. 文本配置
      2. 3.1.2. 发现自定义词
        1. 3.1.2.1. 方法1利用微词云的简单导入功能
        2. 3.1.2.2. 方法2利用微词云分词报告中的高频词位置定位
    2. 3.2. 02.筛选单词
      1. 3.2.1. 筛词方法有四种
      2. 3.2.2. 切记一定要提前下载自己的分词结果,防止数据丢失。
    3. 3.3. 03.得到报告并分析
      1. 3.3.1. top20热词
      2. 3.3.2. 我筛选的词云相关图
      3. 3.3.3. top30单词相关性
      4. 3.3.4. 分析孩子关键词
      5. 3.3.5. 分析结婚关键词
  4. 4. 结尾总结