求教各位大佬,如果我想爬取评论中的星级评价,并且转化为数字,应该用这款软件如何操作,麻烦赐教,感激感激!

WX20180514-103725@2x.png (41.14 KB, 下载次数: 481)

WX20180514-103725@2x.png
举报 使用道具
| 回复

共 6 个关于本帖的回复 最后回复于 2018-5-14 17:53

沙发
数据集 高级会员 发表于 2018-5-14 10:43:45 | 只看该作者
可以把规则名贴出来,不同的星级评价一般都有不同的class值,可以把class值采集下来,后期通过Excel的查找替换功能把class值替换成相应的星级评价
举报 使用道具
板凳
shengchengx 金牌会员 发表于 2018-5-14 10:44:21 | 只看该作者
可以看看这个的class中是不是包含这个星级信息,抓取下来可以在Excel中去进行处理
举报 使用道具
地板
Kellyj103 初级会员 发表于 2018-5-14 11:57:11 | 只看该作者
数据集 发表于 2018-5-14 10:43
可以把规则名贴出来,不同的星级评价一般都有不同的class值,可以把class值采集下来,后期通过Excel的查找 ...

我有看到class值,请问如何将class值采集下来?
举报 使用道具
5#
数据集 高级会员 发表于 2018-5-14 12:07:23 | 只看该作者
本帖最后由 数据集 于 2018-5-15 09:29 编辑
Kellyj103 发表于 2018-5-14 11:57
我有看到class值,请问如何将class值采集下来?

class值在网页上看不到,不能用直观标注,需要通过dom窗口用内容映射抓取

找到class值 右键-》内容映射-》新建抓取内容,然后给抓取的内容命名
举报 使用道具
6#
Kellyj103 初级会员 发表于 2018-5-14 17:52:31 | 只看该作者
数据集 发表于 2018-5-14 12:07
把class值在网页上看不到,不能用直观标注,需要通过dom窗口用内容映射抓取

找到class值 右键-》内容映射 ...

你好,我已经按照操作操作了一遍,坐了内容印射,和样例复制,但查看测试的时候,第一个和第二个可以显示class值,第三条以及之后数据其他内容都有,就是星级评价又是为空白,请问您知道这是什么原因吗?
举报 使用道具
7#
wangyong 版主 发表于 2018-5-14 17:53:48 | 只看该作者
做定位标准的节点,要选择所有星级别共有的节点,不要选择单独某一种
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-26 09:40