本帖最后由 ym 于 2018-3-23 14:26 编辑

集搜客分词打标软件 > 应用例子

集搜客文本分词软件对文本数据分词,最后输出的打标结果表里,会看到一条条文本变成对应于每个特征词的矩阵,就可以用量化计算对文本内容进行分析。
例如,对消费者对手机使用体验的评论信息进行分词打标,得到这样一个矩阵


针对这样的数据表,通过统计运算和数据挖掘运算,可以得出很多量化的结论。




本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2021-5-29 23:01

wuli色混94 新手上路 发表于 2021-5-29 21:30:55 | 显示全部楼层
老师我想问一下,上面说“获得分词打标矩阵表之后,可以通过统计运算和数据挖掘运算,可以得出很多量化的结论”,我想问一下这个统计运算和数据挖掘运算具体是指哪些呢,怎么做才能得到上面最后两张图那样的结果和图像呢。
举报 使用道具
Fuller 管理员 发表于 2021-5-29 23:01:02 | 显示全部楼层
wuli色混94 发表于 2021-5-29 21:30
老师我想问一下,上面说“获得分词打标矩阵表之后,可以通过统计运算和数据挖掘运算,可以得出很多量化的结 ...

分词和选词完成以后,可以下载这些表



利用这些表,可以用excel做统计和画图,也可以用python做更加复杂的计算。如果用python,建议在Jupyter Notebook中做。在本网页的搜索框中搜索“notebook”就能看到好多案例。

至于要做哪些统计,这要看你的研究问题是什么

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 09:47