我用集搜客分词和文本分析做了分词和选词,虽然集搜客分词软件有显示词云图的功能,而且能显示多种形状的词云图,但是,我的项目要求在Jupyter Notebook中做分析。怎样用Python实现画词云图的功能,集搜客分词软件导出的数据是否可以被Jupyter Notebook使用?

举报 使用道具
| 回复

共 9 个关于本帖的回复 最后回复于 2021-5-31 11:57

沙发
内容分析应用 金牌会员 发表于 2021-5-28 11:23:34 | 只看该作者
集搜客分词软件导出的词频统计表, 可以直接用在Jupyter Notebook中生成词云图。
我准备下数据, 下午把整个过程跟帖发出来


举报 使用道具
板凳
内容分析应用 金牌会员 发表于 2021-5-28 16:38:55 | 只看该作者
这个词频统计文件是微博关键词搜索的数据导入集搜客分词工具后生成的: 词频表_202105281424115730.zip (113.09 KB, 下载次数: 3)
用python在notebook里生成词云图的步骤如下:
1. 读取excel词频表,生成字典, 就是类似这样: {"马拉松":568, "甘肃":367, "天气":443 , ...}
2. 使用wordcloud的fit_words生成词云
3. 使用matplotlib画图



举报 使用道具
地板
内容分析应用 金牌会员 发表于 2021-5-28 16:41:30 | 只看该作者
生成的词云图如下:




举报 使用道具
5#
内容分析应用 金牌会员 发表于 2021-5-28 16:43:31 | 只看该作者
这个图还需要调整以更美观。
这2天会发布一个新的notebook出来, 只需要把从集搜客分词工具导出的词频统计excel放到指定的目录下, 运行notebook就可以看到词云图


举报 使用道具
6#
Fuller 管理员 发表于 2021-5-28 17:01:37 | 只看该作者
在集搜客分词和文本分析软件基础上,使用Jupyter Notebook处理集搜客分词软件导出的结果表,可以大大扩大文本内容分析的能力
举报 使用道具
7#
内容分析应用 金牌会员 发表于 2021-5-31 09:59:23 | 只看该作者
内容分析应用 发表于 2021-5-28 16:43
这个图还需要调整以更美观。
这2天会发布一个新的notebook出来, 只需要把从集搜客分词工具导出的词频统计e ...

在notebook中可以用下面的语句来调整词云图的大小和显示:
  1. plt.figure(figsize=(13,7))
  2. plt.imshow(wd)
  3. plt.axis("off")
  4. plt.show()
复制代码






举报 使用道具
8#
Fuller 管理员 发表于 2021-5-31 11:39:15 | 只看该作者
举报 使用道具
9#
发誓学好内容分析 金牌会员 发表于 2021-5-31 11:51:50 | 只看该作者
Fuller 发表于 2021-5-31 11:39
总结到一篇文章中了《微博内容分词后怎样用Jupyter Notebook画词云图》

这个Jupyter notebook文件,包括这个文章说的目录结构,能发给我吗?

举报 使用道具
10#
Fuller 管理员 发表于 2021-5-31 11:57:44 | 只看该作者
发誓学好内容分析 发表于 2021-5-31 11:51
这个Jupyter notebook文件,包括这个文章说的目录结构,能发给我吗?

我已经发出来了,在文章的13章
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-20 23:39