你们的应用举例那里,“帮一个弱智儿童买的,能基本使用不错了”,为什么能够自动归结为“易用” 他的评论里没有出现过完整的易用这个词
QQ图片20200331144912.png

举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2020-3-31 16:21

lan_1985 金牌会员 发表于 2020-3-31 14:51:07 | 显示全部楼层
易用是二级属性分类了,二级属性是对标签词的再次归类,这个是由人工整理和统计的
举报 使用道具
Fuller 管理员 发表于 2020-3-31 15:15:37 | 显示全部楼层
为了做一个分析报告,通常会做两次分类,第一次用软件自动做,第二次基于第一次人工进行调整。这样才能确保精度。因为自动软件是无法准确识别自然语言的,都是根据概率进行估计的,当遇到网络上的很自由的语言表达,尤其含有一些隐喻的时候,就不可能正确处理,这时候就需要人工进行标定。

如果使用集搜客分词软件,那么导出excel格式的分析结果以后,在excel中进行纠正
举报 使用道具
远大贾丽 初级会员 发表于 2020-3-31 16:21:09 | 显示全部楼层
谢谢,明白了,确实提高了准确度,不错的一款工具。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 10:00