下面以京东的手机评论为例介绍集搜客文本分词标注工具的用法。 一. 建立打标任务、导入只有一列数据的excel表 点击“新建任务”,就开始第1步导入数据,在这里,要自定义任务名称,导入只有一列数据的excel表,注意excel大小不要超过10M,再点击“下一步”。 如果数据上量达到10万以上,建议导入部分数据作为样本来打标或者是分多次导入。本工具不会对数据过滤重复,但会过滤空的数据。 数据导入后,需要等待后台进行分词处理,10M数据大概耗时10分钟左右。当状态为“已完成”时,就可以点击“下一步”打标。点击“我的任务”->对应任务的“导入状态”可以查看处理进度,点击“导入更多”可以继续导入数据,点击“继续打标”可以继续筛选标签词。 |