上一个帖子:Jupyter Notebook数据分析实验:用Dataframe查询词频统计表

使用集搜客文本分词和情感分析软件导出的词频统计表,做了数据处理的一些探索。

今天继续用这个词频统计表,来做数据可视化的探索。
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2021-3-4 18:03

沙发
马涌河畔 金牌会员 发表于 2021-3-4 09:49:20 | 只看该作者
本帖最后由 马涌河畔 于 2021-3-4 09:51 编辑

程序环境和数据准备
  1. import pandas as pd
  2. import os
  3. import numpy as np
  4. import matplotlib.pyplot as plt
  5. from pylab import *
  6. # 打开文件
  7. plt.rcParams['font.sans-serif']=['SimHei']
  8. data_dir = os.path.join(os.getcwd(), '..\\..\\data\\raw')
  9. file_word_freq = '词频表_20210303091849990.xlsx';
  10. # 数据统计
  11. df_word_freq = pd.read_excel(os.path.join(data_dir, file_word_freq));
  12. df_word_freq_groupby = df_word_freq.groupby(["词性"], as_index=True)['标签词'].count()
  13. df_word_freq_groupby
复制代码




举报 使用道具
板凳
马涌河畔 金牌会员 发表于 2021-3-4 09:55:03 | 只看该作者
用DataFramede的plot方法,缺省是画折线图,等同于plot.line()
  1. df_word_freq_groupby.plot()
复制代码




举报 使用道具
地板
马涌河畔 金牌会员 发表于 2021-3-4 09:57:18 | 只看该作者
指定画饼图
  1. df_word_freq_groupby.plot.pie(subplots=True)
复制代码




举报 使用道具
5#
内容分析应用 金牌会员 发表于 2021-3-4 18:03:03 | 只看该作者
可以把饼图的某块突出显示:
  1. explodes = (0,0.1,0,0,0,0)
  2. df_word_freq_groupby.plot.pie(explode=explodes)
复制代码




举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-20 13:40