分词和文本分析平台是专门为高校师生和研究机构开发的内容分析工具,做到0技术门槛,导入数据后只专注于内容的处理,就可导出需要的数据表。

1,能做什么?
1.1,能输出的数据表
a,词频表:所有词的词性和词频。不需要额外操作,导入数据后,就会自动分词,完成后就能导出该表
b,分词效果表:用空格分隔句子中的词,并自动提炼关键词。也不需要额外操作,这是自动分词的结果。自动提炼出来的关键词反映了句子的主题。
c,选词结果表:需要先筛选词语才能导出该表,通过人工选词,可以最精准的选择符合分析目的的词语,弥补自动提炼关键词的不精准的不足。
d,选词匹配表:也需要先筛选词语,展示所选词与句子的对应关系
e,选词矩阵表:也需要先选词,与选词匹配表不同,所选词并不是放在一起,而是每个词独自占一列,方便统计运算
f,共词矩阵表:需要先执行共词匹配才能导出该表,行和列都是所选词,构成一个四方矩阵,数字是对应词同时出现的句子数。可用于社交关系分析。
g,情感分析表:需要先执行情感分析才能导出该表。把含有情感倾向的句子罗列出来,标明情感倾向

下面是各表的示例:
a,词频表:


b,分词效果表


c,选词结果表


d,选词匹配表


e,选词矩阵表


f,共词矩阵表


g,情感分析表


点击查看情感分析打分计算方法

1.2,能生成的分析图

a,词云图:筛选词语以后才能生成词云图。



b,社交关系图:执行了共词匹配后才能生成社交关系图





2,操作方法
2.1,使用手册
《分词和分类检索平台使用手册》
《情感分析案例——豆瓣电影评论的情感分析》

情感分析的算法及自定义情感词典的注意事项
《社会网络图》


《GooSeeker情感分析的打分原理》

2.2,数据分析案例

《关于鸿蒙操作系统的知乎讨论热点分析
《抓取头号玩家电影的微博评论数据做口碑分析》
《挖掘淘宝爆款商品名称中的关键词》
《利用GooSeeker分词、Ucient和NetDraw进行社会网络分析》
《爬取豆瓣电影短评做中文分词与数据分析》

2.3,其他问题
《集搜客分词是否可以不选词就直接得到全部词频统计结果?》
《怎样用情感分析表计算出一条原始数据的情感倾向呢?》
《情感分析之后怎么做走势分析图?》
《集搜客的情感分析词典是用的哪个?》

2.4,深度数据挖掘
使用Jupyter Notebook,可以在分词软件导出的数据表基础上进行深度挖掘,常用的场景都总结成了Jupyter Notebook模板,具体参看《用集搜客分词软件和Jupyter Notebook做文本分析和数据探索的案例汇总





本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 110 个关于本帖的回复 最后回复于 2024-10-18 16:15

来自 95#
Fuller 管理员 发表于 2023-2-17 15:52:36 | 只看该作者
情感分析打分原理参看:https://www.gooseeker.com/doc/article-722-1.html
举报 使用道具
沙发
ym 版主 发表于 2019-9-23 10:24:29 | 只看该作者
分词应用的历史版本介绍

当前是v3版
举报 使用道具
板凳
elvisll 新手上路 发表于 2019-11-20 10:42:07 | 只看该作者
想请教下 这个分词工具用的是什么算法呢?
举报 使用道具
地板
Fuller 管理员 发表于 2019-11-20 11:11:37 | 只看该作者
elvisll 发表于 2019-11-20 10:42
想请教下 这个分词工具用的是什么算法呢?

这个分词工具发展了很多版本了,每次都会增加更多的NLP处理算法。1,分词方面,这个平台目前使用中科院的分词器,更多分词器参看:《中文分词工具汇总》

2,词性标注:使用了HANLP的开源版本
3,其他处理功能是GooSeeker自己开发的
举报 使用道具
5#
秋风烟雨 初级会员 发表于 2019-12-22 18:17:05 | 只看该作者
想问下,情感分析数据下载不下来是因为?
举报 使用道具
6#
Fuller 管理员 发表于 2019-12-22 18:37:17 | 只看该作者
秋风烟雨 发表于 2019-12-22 18:17
想问下,情感分析数据下载不下来是因为?

点击下载,右上角的图标会变成绿色,并且闪动



点击那个图标,可以看下载进度



下载结果存放在电脑的 “下载”文件夹中

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
7#
zhyzhyzhy 金牌会员 发表于 2019-12-23 11:56:59 | 只看该作者
请问英文语料可以吗?
举报 使用道具
8#
Fuller 管理员 发表于 2019-12-23 12:12:43 | 只看该作者
zhyzhyzhy 发表于 2019-12-23 11:56
请问英文语料可以吗?

英文也是可以的,但是,通常我们不说能处理英文,因为,要完美地处理因为,必须做词干识别,不然的话,不同时态、单复数等等都会当成不同词了。您可以试试导入一篇英文文章
举报 使用道具
9#
li97124 初级会员 发表于 2020-2-23 06:01:10 | 只看该作者
请问一下,浏览器没有安装框架该如何做呢?我该在哪里去找需要下载安装的框架?
举报 使用道具
10#
li97124 初级会员 发表于 2020-2-23 06:27:40 | 只看该作者
浏览器不支持框架该怎么办
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的

热门用户

GMT+8, 2024-11-21 17:14