222 107502

集搜客文本分词标注工具(V1版)

ym 于 2016-11-15 10:55 发表 [复制链接]
15964002091 金牌会员 发表于 2021-9-29 19:51:34 | 显示全部楼层
匹配矩阵表它可以用来分析什么
举报 使用道具
gz51837844 管理员 发表于 2021-9-30 11:09:26 | 显示全部楼层
导出的是词共现矩阵,通过词的共现关系和紧密度, 可以做主题发现,关键词提取。
比如下图的矩阵,可以初步看出文本中和图书馆相关的是哪些词, 基于此做主题分析
xc_tsg网络图 (1).png
举报 使用道具
Fuller 管理员 发表于 2021-9-30 11:17:06 | 显示全部楼层
15964002091 发表于 2021-9-29 19:51
匹配矩阵表它可以用来分析什么

有两类矩阵

第一类:文档 与 词 的关系矩阵,这个可以做很多运算,比如,抽取关键词、计算文档表示、计算词表示,文档分类、降维运算等

第二类:共现词矩阵,主要做各种中心性运算

常用算法都放在Notebook中了,汇总在这里:https://www.gooseeker.com/doc/thread-18414-1-2.html
举报 使用道具
最爱追梦小少年 新手上路 发表于 2021-11-7 17:40:49 | 显示全部楼层
我想问一下这个算法原理是啥呀?
举报 使用道具
Fuller 管理员 发表于 2021-11-7 18:28:09 | 显示全部楼层
最爱追梦小少年 发表于 2021-11-7 17:40
我想问一下这个算法原理是啥呀?

这个软件含有几大块功能,他们的原理各不相同:
1,分词功能:使用隐马尔可夫过程相关的算法进行分词
2,情感分析:先切分句子,然后根据情感词库进行匹配,得到每个句子的情感得分,然后算出来整个内容的总得分
3,关键词抽取:根据text rank算法,算出来整篇内容的比较重要的关键词。还有其他一些算法,可以参看这些Jupyter Notebook: https://www.gooseeker.com/doc/thread-18414-1-4.html
4,文本分类:先设置类别和包含的关键词,对文本进行匹配和分类
举报 使用道具
15画 新手上路 发表于 2021-11-12 20:17:54 | 显示全部楼层
能不能有具体的情感得分结果呢?只有定性的结果使用起来不太方便。
举报 使用道具
gz51837844 管理员 发表于 2021-11-12 21:49:33 | 显示全部楼层
15画 发表于 2021-11-12 20:17
能不能有具体的情感得分结果呢?只有定性的结果使用起来不太方便。

在下载的excel文件里,有得分数据: QQ截图20211112214802.png
举报 使用道具
mm1111 新手上路 发表于 2021-12-15 08:55:36 | 显示全部楼层
请问没有情感强度分析吗?
举报 使用道具
马涌河畔 金牌会员 发表于 2021-12-15 09:05:44 | 显示全部楼层
mm1111 发表于 2021-12-15 08:55
请问没有情感强度分析吗?

在导出的情感分析结果表里有打分值
举报 使用道具
17862191081 新手上路 发表于 2021-12-16 10:23:58 | 显示全部楼层
有聚类功能么
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 05:19