做规则的详情可以采集,样例复制后有个别商品字段少了挡板材料,导致规则不适用,写了xpath,但是测试后还是无效。求教一下


举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2018-9-30 14:59

沙发
Fuller 管理员 发表于 2018-9-29 17:57:39 | 只看该作者
主题名是什么?

根据你的截图,你写的xpath都含有position(),这是明确指定第几个节点的,万一某个页面结构稍微变化一下,就失效了。xpath尽量利用网页上的一些标志,如果是文本标志,就用contains(text(),'xxx')之类的函数,如果是有@class或者@id,就用上这些。尽量避免用position()函数,如果用上一些标志,那么xpath中还可以写成类似这样的  div//a[@class='page'],中间用了 // ,这样就不限定多少个层级,适应性进一步提高
举报 使用道具
板凳
文学作品动态扫描 金牌会员 发表于 2018-9-30 14:59:51 | 只看该作者
明白了,感谢
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-27 02:42