本帖最后由 ym 于 2018-3-23 14:26 编辑

集搜客分词打标软件 > 使用介绍

集搜客分词打标软件是一款在线文本分词应用,不用安装软件,操作非常简单,下面介绍一下:

1.导入数据

登录到系统中,点击“导入数据”开始创建任务。点击进入任务,在“原数据”页面可以看到导入状态,如果数据量很大,自动分词需要一些时间。


2.选出要用的高频词语

筛选词语默认是按词频从大到小排序,把与研究目的相关的词勾上,点击“确定”,这一屏的词就消失了,勾上的词会保存到选词结果里,没有勾上的词就不要了,同时,软件会用勾上的词匹配每条文本,形成一个矩阵,含有某个词,对应的矩阵单元的值就是1。点击词语可以查看样本数据,帮助你快速判断词语的留存。


3. 手工补充词语
有些词语会被切碎,如果没有切出你想要的词语,可以人工添加进去,提交添加的时候,软件也会用添加的词去匹配每条文本。


4.下载数据表
最后下载数据,一次性下载3张表:选词结果、打标结果(标签矩阵)、分词效果;



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 0 个关于本帖的回复 最后回复于 2018-3-20 11:48

您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的

热门用户

GMT+8, 2024-11-22 06:56