看到了攻略上面,做完情感分析后做了这样的评论走势图。


但是情感分析的时候不是会切分句子,之后也是用数据透视表完成的合计倾向吗?所以要怎样操作才能把日期添加进来做这样的图呢?
如果可以步骤请尽量详细一点(excel稀烂....)

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 8 个关于本帖的回复 最后回复于 2021-6-16 15:15

来自 2#
wangyong 版主 发表于 2021-6-16 15:15:35 | 只看该作者
本帖最后由 wangyong 于 2021-6-16 15:17 编辑

GooSeeker发布了一套配套GooSeeker文本分析软件的Jupter Notebook,其中就包含《情感分析结果怎样用Jupyter Notebook生成走势图等图表》

下载该notebook,将数据文件替换成自己用GooSeeker文本分析软件生成的情感分析数据。依次执行该notebook就可以生成情感分布图和情感走势图等。

情感分布图
情感走势图

情感分布图

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
板凳
Fuller 管理员 发表于 2020-3-19 18:14:23 | 只看该作者
要做走势图,一定要在数据中含有时间字段。有两个方案:

方案1,导入分词任务的时候,数据表就加上时间字段,如下图箭头指向的字段,给数据表加上表头,表头名字严格按照截图上给的名字,那么集搜客分词软件会保留这些字段,如果再使用软件的分类检索功能,就可以按照时间进行检索。

方案2,如果只是用来分词和情感分析,因为导出表中只有文字内容,所以,没有必要采用方案1,而是表头只含有下图红框两个字段就行。这样,导出数据后,就会把序号原封不动导出来,再跟原始数据中的序号匹配上,就知道所分析的数据是哪一天的那条了。

剩下就是按天或者其他时间粒度进行统计了


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
地板
ym 版主 发表于 2020-3-19 20:25:22 | 只看该作者
本帖最后由 ym 于 2020-3-19 20:28 编辑

1、首先要把每一条原始数据的情感倾向算出来
把原始数据切分后的每个句子的情感倾向,做一个简单计算来得到原数据的情感倾向,把正负面中性改为1 0 -1数值

然后选中全部数据,用“数据菜单”->“数据透视表”功能,以序号为行,统计情感倾向的求和就可以了。

情感倾向大于0就是正面,小于0是负面,等于0是中性。我们拷贝透视表,在旁边列里粘贴为数值,在新一列里输入下面函数式,这里的引用单元格要根据自己的情况修改。然后按住单元格右下角的+标志往下拖动填充计算。
=IF(N2>0,"正面",IF(N2=0,"中性","负面"))


2、与原数据匹配到发布时间
为了方便后面的计算,在底部新建工作表,把它命名为“导入数据表”,然后把最初导入平台的数据表拷贝到里面,注意要有发布时间这一列,而情感分析表就命名为“情感分析表”。

在“情感分析表”的新一列里输入下面的函数式,这里引用的数据表名和单元格要根据自己的实际情况修改,再自动填充计算。目的是把上表的序号(行标签列),与“导入数据表”中的序号进行关联匹配,就可以把发布时间索引到新一列里,下图的发布时间是显示成了文本格式,下面会调整成正常格式。
=INDEX(导入数据表!E:E,MATCH(情感分析表!M2,导入数据表!A:A,0))

自动填充计算后,选中发布时间一列,右键选设置单元格格式,弹窗里选日期的标准格式,就可以显示成年月日格式。



3、按日期统计各种情感倾向的数量
这里的时间是带有小时分钟,为了能统计到同一天的情感数量,通过查找替换功能来过滤小时分钟,只保留年月日,如下图,在查找内容里输入空格和星号,替换为空字符即可。

然后用数据透视表功能,把发布时间作为行,情感倾向作为列,计算情感倾向的数量,再把时间设置为降序,就可以得到做折线图的统计表。

有些日期的情感倾向是空的,这种要用0代替,把时间一列拷贝到旁边位置,再把正面、负面、中性3列拷贝粘贴为数值,然后逐列筛选出空的单元格填上0。


4、用折线图可视化
选中统计表,用“插入菜单”->“折线图”->“普通折线图”,就可以生成折线图。

最后对折线图的样式和排版做些调整就完成了。



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
5#
JessicaXD 新手上路 发表于 2020-3-20 00:26:24 | 只看该作者
Fuller 发表于 2020-3-19 18:14
要做走势图,一定要在数据中含有时间字段。有两个方案:

方案1,导入分词任务的时候,数据表就加上时间字 ...

好的,做出来了,谢谢!
举报 使用道具
6#
JessicaXD 新手上路 发表于 2020-3-20 00:27:01 | 只看该作者
ym 发表于 2020-3-19 20:25
1、首先要把每一条原始数据的情感倾向算出来
把原始数据切分后的每个句子的情感倾向,做一个简单计算来得到 ...

太感谢啦!
举报 使用道具
7#
yiyan_yifei_cao1 初级会员 发表于 2021-2-24 08:39:21 | 只看该作者
感谢
举报 使用道具
8#
18301272820 初级会员 发表于 2021-3-12 10:25:32 | 只看该作者
下面的横坐标日期好像不对吧
举报 使用道具
9#
Fuller 管理员 发表于 2021-3-12 10:55:32 | 只看该作者
18301272820 发表于 2021-3-12 10:25
下面的横坐标日期好像不对吧

哪里不对?
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的

热门用户

GMT+8, 2024-11-21 23:57