快捷导航
分词和文本分析平台是专门为高校师生和研究机构开发的内容分析工具,做到0技术门槛,导入数据后只专注于内容的处理,就可导出需要的数据表。

1,能做什么?
1.1,能输出的数据表
a,词频表:所有词的词性和词频。不需要额外操作,导入数据后,就会自动分词,完成后就能导出该表
b,分词效果表:用空格分隔句子中的词,并自动提炼关键词。也不需要额外操作,这是自动分词的结果。自动提炼出来的关键词反映了句子的主题。
c,选词结果表:需要先筛选词语才能导出该表,通过人工选词,可以最精准的选择符合分析目的的词语,弥补自动提炼关键词的不精准的不足。
d,选词匹配表:也需要先筛选词语,展示所选词与句子的对应关系
e,选词矩阵表:也需要先选词,与选词匹配表不同,所选词并不是放在一起,而是每个词独自占一列,方便统计运算
f,共词矩阵表:需要先执行共词匹配才能导出该表,行和列都是所选词,构成一个四方矩阵,数字是对应词同时出现的句子数。可用于社交关系分析。
g,情感分析表:需要先执行情感分析才能导出该表。把含有情感倾向的句子罗列出来,标明情感倾向

下面是各表的示例:
a,词频表:
词频表.png

b,分词效果表
分词效果表.png

c,选词结果表
选词结果表.png

d,选词匹配表
选词匹配表.png

e,选词矩阵表
选词矩阵表.png

f,共词矩阵表
共词矩阵.png

g,情感分析表
情感分析表.png



1.2,能生成的分析图

a,词云图:筛选词语以后才能生成词云图。

词云图.png

b,社交关系图:执行了共词匹配后才能生成社交关系图

共现图.png



2,操作方法
2.1,使用手册
《分词和分类检索平台使用手册》
《情感分析》
《社会网络图》

2.2,数据分析案例

《关于鸿蒙操作系统的知乎讨论热点分析
《抓取头号玩家电影的微博评论数据做口碑分析》
《挖掘淘宝爆款商品名称中的关键词》
《利用GooSeeker分词、Ucient和NetDraw进行社会网络分析》
《爬取豆瓣电影短评做中文分词与数据分析》

2.3,其他问题
《集搜客分词是否可以不选词就直接得到全部词频统计结果?》
《怎样用情感分析表计算出一条原始数据的情感倾向呢?》
《情感分析之后怎么做走势分析图?》
《集搜客的情感分析词典是用的哪个?》










举报 使用道具
| 回复

共 55 个关于本帖的回复 最后回复于 2021-4-2 07:50

ym 版主 发表于 2019-9-23 10:24:29 | 显示全部楼层
分词应用的历史版本介绍

举报 使用道具
elvisll 新手上路 发表于 2019-11-20 10:42:07 | 显示全部楼层
想请教下 这个分词工具用的是什么算法呢?
举报 使用道具
Fuller 管理员 发表于 2019-11-20 11:11:37 | 显示全部楼层
elvisll 发表于 2019-11-20 10:42
想请教下 这个分词工具用的是什么算法呢?

这个分词工具发展了很多版本了,每次都会增加更多的NLP处理算法。1,分词方面,这个平台目前使用中科院的分词器,更多分词器参看:《中文分词工具汇总》

2,词性标注:使用了HANLP的开源版本
3,其他处理功能是GooSeeker自己开发的
举报 使用道具
秋风烟雨 初级会员 发表于 2019-12-22 18:17:05 | 显示全部楼层
想问下,情感分析数据下载不下来是因为?
举报 使用道具
Fuller 管理员 发表于 2019-12-22 18:37:17 | 显示全部楼层
秋风烟雨 发表于 2019-12-22 18:17
想问下,情感分析数据下载不下来是因为?

点击下载,右上角的图标会变成绿色,并且闪动

下载20191222183333.png

点击那个图标,可以看下载进度

下载20191222183351.png

下载结果存放在电脑的 “下载”文件夹中
举报 使用道具
zhyzhyzhy 金牌会员 发表于 2019-12-23 11:56:59 | 显示全部楼层
请问英文语料可以吗?
举报 使用道具
Fuller 管理员 发表于 2019-12-23 12:12:43 | 显示全部楼层
zhyzhyzhy 发表于 2019-12-23 11:56
请问英文语料可以吗?

英文也是可以的,但是,通常我们不说能处理英文,因为,要完美地处理因为,必须做词干识别,不然的话,不同时态、单复数等等都会当成不同词了。您可以试试导入一篇英文文章
举报 使用道具
li97124 初级会员 发表于 2020-2-23 06:01:10 | 显示全部楼层
请问一下,浏览器没有安装框架该如何做呢?我该在哪里去找需要下载安装的框架?
举报 使用道具
li97124 初级会员 发表于 2020-2-23 06:27:40 | 显示全部楼层
浏览器不支持框架该怎么办
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 新闻内容分词后在Jupyter Notebook中使用TF
  • Jupyter Notebook使用sklearn的TF-IDF算法
  • 基于TSC 理论的网络社区中知识动员模式研究
  • 网页数据采集使用嵌套整理箱获得有层次的数
  • 我国旅游管理研究的知识来源与结构—基于文

热门用户

GMT+8, 2021-8-1 08:53