问题:不同于京东等,国美的在线评论星级评分是以style之width的宽度比例来指定的,请问有什么办法可以抓取吗?
规则名:my_gm_20181129
敬请指教
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2018-11-29 20:49

沙发
Fuller 管理员 发表于 2018-11-29 11:08:47 | 只看该作者
我加载了你的规则,没有看到对星级做的映射,其实很简单,就是把style属性抓下来,里面的width能准确对应到星级。100%就是5星,其他的看一看结果文件里面的表示,就能整理出来对应关系。
举报 使用道具
板凳
yuanxiqd 初级会员 发表于 2018-11-29 16:33:01 | 只看该作者
嗯嗯,我按照您说的做了操作:
  1. //*[@class='bgiprd']/@style
复制代码

但是,又出现了一个问题,就是有些评论的星级评分是一级,那么相应的,style='width=20%';但是,实际提取的值却仍然是100%。这是怎么回事呢?请问~

QQ图片20181129163024.png (179.83 KB, 下载次数: 478)

Figure. 1

Figure. 1
举报 使用道具
地板
Fuller 管理员 发表于 2018-11-29 17:02:31 | 只看该作者
yuanxiqd 发表于 2018-11-29 16:33
嗯嗯,我按照您说的做了操作:

但是,又出现了一个问题,就是有些评论的星级评分是一级,那么相应的,styl ...

你的规则是要采集一个列表,那么抓取内容的自定义xpath就不能是 // 开头,否则,列表中的每个内容都是采集了同一个节点。

而是应该以 .//开头,表示相对于容器节点的点位表达式。你把start这个抓取内容的定位标志映射去掉吧,然后修改xpath,只要在你现在的这个xpath上,前面加一个点,应该就可以了
举报 使用道具
5#
yuanxiqd 初级会员 发表于 2018-11-29 20:49:18 | 只看该作者
Fuller 发表于 2018-11-29 17:02
你的规则是要采集一个列表,那么抓取内容的自定义xpath就不能是 // 开头,否则,列表中的每个内容都是采 ...

非常感谢。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-24 22:04