快捷导航
今天我使用连续动作点击页面上的一个缩略图,然后抓取上面的一个大图,已经设置好了xpath,而且也显示了20条数据, 但是为什么在执行的时候,只把第一个抓了20次,没有抓后面的那20个啊

页面是这样的

抓取.png

这是网址
https://www.potterybarn.com/products/turner-leather-sofa-collection/?pkey=csofas-all&isx=0.0.0
这是xpath
//*[@class='scroller-container horizontal ']//*[@class='panel']/li
举报 使用道具
| 回复

共 16 个关于本帖的回复 最后回复于 6 天前

yangwenge 中级会员 发表于 6 天前 | 显示全部楼层
规则名多少?
举报 使用道具
dukewang666 新手上路 发表于 6 天前 | 显示全部楼层
本帖最后由 dukewang666 于 2017-11-13 11:05 编辑

规则名是  sofas_details
举报 使用道具
umsung 高级会员 发表于 6 天前 | 显示全部楼层
本帖最后由 umsung 于 2017-11-13 11:33 编辑

1,缩略图和大图的@src节点的值是一样的,直接对缩略图做样例复制抓取缩略图的@src值就行了,不需要做连续动作
2,如果想要用连续动作抓大图,应该做两级规则,第一个规则定义连续动作,目标主题名对应第二级规则,第二级规则再抓取大图的@src值。
9.jpg
举报 使用道具
dukewang666 新手上路 发表于 6 天前 | 显示全部楼层
@umsung
1.二级规则我定了
2.缩略图我下载了 确实跟大图不一样
举报 使用道具
umsung 高级会员 发表于 6 天前 | 显示全部楼层
本帖最后由 umsung 于 2017-11-13 12:08 编辑
dukewang666 发表于 2017-11-13 11:38
@umsung
1.二级规则我定了
2.缩略图我下载了 确实跟大图不一样

1,第二级规则在哪呢? 第二级主题名要与第一级的目标主题名对应一致
2,把缩略图的@src最后的 “-r“  改成”-c“ 就是大图的地址了。

4.jpg
49.jpg
举报 使用道具
dukewang666 新手上路 发表于 6 天前 | 显示全部楼层
本帖最后由 dukewang666 于 2017-11-13 12:50 编辑

@umsung

抱歉 规则名写错了.....手残
应该是这个规则名sofas_detail它的二级规则名是sofas_details2 这个是抓大图的规则
举报 使用道具
umsung 高级会员 发表于 6 天前 | 显示全部楼层
1,直接用样例复制采集缩略图的@src,然后把缩略图的@src最后的 “-r“  改成”-c“ 就是大图的地址了。不用连续动作那么麻烦。
2,你的网址加载比较慢,如果用连续动作采集的话可能是不好实现。
试试这个xptah   .//*[@id='_scroller0']/div[position()=2]/ul/li   
  最好使用第一种方法,别用连续动作。
举报 使用道具
dukewang666 新手上路 发表于 6 天前 | 显示全部楼层
好的 我试试你那个xpath 关键是第一个图片路径格式基本相同 但是其他的都不一样了
还有个问题大神
我的那个xpath哪里有问题啊?
举报 使用道具
dukewang666 新手上路 发表于 6 天前 | 显示全部楼层
@umsung 大神
刚刚试了下您那个xpath 貌似不行啊 一直抓取第一个
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 百度推广后台数据DIY
  • 采集表单中的input动态内容
  • 采用刷新动作实现手机页面采集
  • 通过划定滚轮范围实现精确点击手机页面
  • 放大或者缩小页面便于采集手机网页内容

热门用户

集搜客GooSeeker网络爬虫 ( 粤ICP备11065265号-2 )

GMT+8, 2017-11-19 09:18