我要把集搜客网络爬虫采集下来的微博内容做一个自动分类,以前我用集搜客分词软件的时候,发现有专门一个分类菜单,这次发现名字变了,叫“抽关键词”了,害得我找了半天。

我现在遇到一个问题,中心词和标签词到底是什么意思?输入的词同时用?还是分开用?


举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2020-12-21 11:13

沙发
Fuller 管理员 发表于 2020-12-21 11:04:06 | 只看该作者
界面确实变了,因为大部分用户使用自动抽取关键词的功能,所以大菜单变成了“抽关键词”,界面上增加了导出关键词按钮。

抽关键词是自动做的,不需要任何输入。

而分类是需要手工输入中心词、标签词、排除词的。


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
板凳
发誓学好内容分析 金牌会员 发表于 2020-12-21 11:08:11 | 只看该作者
Fuller 发表于 2020-12-21 11:04
界面确实变了,因为大部分用户使用自动抽取关键词的功能,所以大菜单变成了“抽关键词”,界面上增加了导出 ...

鼠标浮在中心词的问号上,看到的解释:中心词将于原数据做and匹配 ,标签词那里是:标签词将于原数据做or匹配


什么意思?


举报 使用道具
地板
Fuller 管理员 发表于 2020-12-21 11:12:40 | 只看该作者
发誓学好内容分析 发表于 2020-12-21 11:08
鼠标浮在中心词的问号上,看到的解释:中心词将于原数据做and匹配 ,标签词那里是:标签词将于原数据做or ...

这里的解释确实不清楚,下个版本将改掉,解释应该是这样的:

中心词:每个词都必须匹配上。也就是说缺一不可
标签词:其中一个词匹配上即可
排除词:每个词都不能匹配上

例如,中心词设置了A和B,标签词设置了C,D,E,那么

如果句子含有:A B C,就能匹配上,会被列在这个类别中
如果句子含有:A C D E,就匹配不上,因为缺少B

举报 使用道具
5#
发誓学好内容分析 金牌会员 发表于 2020-12-21 11:13:06 | 只看该作者
Fuller 发表于 2020-12-21 11:12
这里的解释确实不清楚,下个版本将改掉,解释应该是这样的:

中心词:每个词都必须匹配上。也就是说缺一 ...

那么中心词匹配和标签词匹配是有顺序的吗?

举报 使用道具
6#
Fuller 管理员 发表于 2020-12-21 11:13:57 | 只看该作者
发誓学好内容分析 发表于 2020-12-21 11:13
那么中心词匹配和标签词匹配是有顺序的吗?

首先要确保中心词都能匹配上,才能去匹配标签词。如果不设置中心词,就直接跳过去,直接去匹配标签词
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-4-21 10:41