1 6438

规则2是什么意思?

小蜜蜂a 于 2017-10-12 11:08 发表 [复制链接]
规则2是什么意思?
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2017-10-12 11:36

wangyong 版主 发表于 2017-10-12 11:36:22 | 显示全部楼层
在采集网页时,有时候会遇到同一个网站展示同类信息的页面有多种网页结构。

在做采集规则时需要每种结构需要做一个采集规则,但是又是同类信息中的不同网页结构,所以就用同一个规则名规则编号编号不同实现。

比如在淘宝中搜索关键词,展示的商品有天猫的数据也有淘宝的数据,在做第二级规则时就可以淘宝用规则1天猫有规则2。参考教程《怎样采集同一网站的不同网页结构信息》

要注意的是只有网页结构区别很大的时候才需要用到规则1,规则2,在这之前可以通过做定位标志映射自定义xpath来提供规则适应性。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 09:30