快捷导航
1 71

规则2是什么意思?

小蜜蜂a 于 2017-10-12 11:08 发表 [复制链接]
规则2是什么意思?
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2017-10-12 11:36

wangyong 版主 发表于 2017-10-12 11:36:22 | 显示全部楼层
在采集网页时,有时候会遇到同一个网站展示同类信息的页面有多种网页结构。

在做采集规则时需要每种结构需要做一个采集规则,但是又是同类信息中的不同网页结构,所以就用同一个规则名规则编号编号不同实现。

比如在淘宝中搜索关键词,展示的商品有天猫的数据也有淘宝的数据,在做第二级规则时就可以淘宝用规则1天猫有规则2。参考教程《怎样采集同一网站的不同网页结构信息》

要注意的是只有网页结构区别很大的时候才需要用到规则1,规则2,在这之前可以通过做定位标志映射自定义xpath来提供规则适应性。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 爬wish等瀑布流网站时使用清除老数据功能
  • 从淘宝的买家评论中,能挖掘出什么有用的信
  • 连续动作:如何把抓到的信息与动作步骤对应
  • 淘宝开店运营十大攻略
  • 深圳市咨询投诉分析

热门用户

集搜客GooSeeker网络爬虫 ( 粤ICP备11065265号-2 )

GMT+8, 2017-10-20 14:44