小伙伴好,如果你做过文本挖掘方面的研究,就会知道文本处理有多烦琐啦,所以给大家推荐一款简单好用的分词应用,不仅能让你减少50%的工作量,快速得到想要的分词结果,还可以做选词、打标等操作。如果还需把分词打标结果发给同学,好方便啦,用“分词作业帮”小程序,既能从PC发送到微信,也能发给好友和微信群。 下面以建立手机用户评论特征词库为例介绍它的用法,这些文本来自于电商网站,是消费者对手机产品的评论。 1、准备好要分词的文件 首先要准备好手机商品的用户评论数据,把评论数据整理到Excel或者txt/word/pdf等格式的文件里; 2、往分词工具里导入数据 有两种导入数据的方式 方式一:在电脑的浏览器上操作 在电脑上访问分词打标工具https://www.gooseeker.com/tagtool2,然后选择文件导入进去; 方式二:在手机上操作 第二种是在手机上操作,先把文件发送到手机上,再关注“集搜客gooseeker”公众号,然后从公众号点进“分词作业帮”小程序,选择文件上传; 3、选择特征词 自动分词后,在网页版上筛选词语,选出手机的品牌词、特征词,这是按词频大小排序的,并且是过滤掉英文、数字、单字、网址等,选出的就是高频词了; 4、把结果通过小程序分享给别人 选词结束后,点击“微信发送”,扫码进入小程序的任务转发页,点击发送图标,分享给微信群或者好友。 5、下载数据表 作为原创者,你可以下载到5张数据表,分别是切词表、选词结果表、分词效果表、打标结果表、匹配矩阵表;而接收者在小程序里接收到结果后,去访问网页版就可以下载到前4张数据表 最后,给大家分享用这次整理到的手机用户评论特征词做成的词云图,如下: |