名字:宝马网页版
样例页面:https://www.etkbmw.com/bmw/ZH/search/selectCar/F10/Lim/BMW+523i/EGY/71_0959
该页面分3个模块,
1是标题加图
2是不带条件的数据,
3是带条件的数据,
现在的问题是样例做了,只能抓同块里的样例1,样例2,不能抓同样形式的模块里的别的,。
求大神指点

举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2017-6-20 09:51

沙发
wangyong 版主 发表于 2017-6-19 18:13:53 | 只看该作者
本帖最后由 wangyong 于 2017-6-19 18:21 编辑

带条件和不带条件的可以放在同一个整理箱里,在同一个整理箱中做嵌套样例复制
把条件作为一个抓取字段,有条件的就抓取下来没条件的为空

创建两个新的容器节点,整理箱关系图如下,原有抓取内容做右移,成为新建容器节点的子节点

因为一个模块中没有条件这个抓取内容,所以要对条件做自定义xpath

xpath语句如下:
  1. .//*[@class='hasOptions']/span
复制代码
对三级节点选择样例复制映射

选择第一个模块对应的第一个、第二个TR分别映射到样例复制1,样例复制2

对第二级容器节点做定位标志映射
选择包含每一个模块的@class=‘row’的div节点做定位标志映射到第二级节点

将包含整个要抓取的网页区域的@class='container bgLines'的DIV节点做定位标志映射到整理箱顶级的“有标题”
举报 使用道具
板凳
zhengyu 初级会员 发表于 2017-6-20 09:51:55 | 只看该作者
谢谢版主大大,弄懂了,
另外说下,样例按照第一个ROW去做,条件会错位,因为第一快ROW,没有条件,按照第二ROW去做样例1,2.就没问题了。
谢谢版主大人,图文非常给力,您辛苦了,我会买会员的。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 11:46