今天我使用连续动作点击页面上的一个缩略图,然后抓取上面的一个大图,已经设置好了xpath,而且也显示了20条数据, 但是为什么在执行的时候,只把第一个抓了20次,没有抓后面的那20个啊

页面是这样的



这是网址
https://www.potterybarn.com/products/turner-leather-sofa-collection/?pkey=csofas-all&isx=0.0.0
这是xpath
//*[@class='scroller-container horizontal ']//*[@class='panel']/li
举报 使用道具
| 回复

共 16 个关于本帖的回复 最后回复于 2017-11-13 17:56

沙发
yangwenge 金牌会员 发表于 2017-11-13 10:44:23 | 只看该作者
规则名多少?
举报 使用道具
板凳
dukewang666 初级会员 发表于 2017-11-13 10:48:49 | 只看该作者
本帖最后由 dukewang666 于 2017-11-13 11:05 编辑

规则名是  sofas_details
举报 使用道具
地板
umsung 高级会员 发表于 2017-11-13 11:16:04 | 只看该作者
本帖最后由 umsung 于 2017-11-13 11:33 编辑

1,缩略图和大图的@src节点的值是一样的,直接对缩略图做样例复制抓取缩略图的@src值就行了,不需要做连续动作
2,如果想要用连续动作抓大图,应该做两级规则,第一个规则定义连续动作,目标主题名对应第二级规则,第二级规则再抓取大图的@src值。

9.jpg (51.52 KB, 下载次数: 659)

9.jpg
举报 使用道具
5#
dukewang666 初级会员 发表于 2017-11-13 11:38:08 | 只看该作者
@umsung
1.二级规则我定了
2.缩略图我下载了 确实跟大图不一样
举报 使用道具
6#
umsung 高级会员 发表于 2017-11-13 12:04:56 | 只看该作者
本帖最后由 umsung 于 2017-11-13 12:08 编辑
dukewang666 发表于 2017-11-13 11:38
@umsung
1.二级规则我定了
2.缩略图我下载了 确实跟大图不一样

1,第二级规则在哪呢? 第二级主题名要与第一级的目标主题名对应一致
2,把缩略图的@src最后的 “-r“  改成”-c“ 就是大图的地址了。

4.jpg (41.47 KB, 下载次数: 657)

4.jpg

49.jpg (22.65 KB, 下载次数: 805)

49.jpg
举报 使用道具
7#
dukewang666 初级会员 发表于 2017-11-13 12:49:00 | 只看该作者
本帖最后由 dukewang666 于 2017-11-13 12:50 编辑

@umsung

抱歉 规则名写错了.....手残
应该是这个规则名sofas_detail它的二级规则名是sofas_details2 这个是抓大图的规则
举报 使用道具
8#
umsung 高级会员 发表于 2017-11-13 14:26:55 | 只看该作者
1,直接用样例复制采集缩略图的@src,然后把缩略图的@src最后的 “-r“  改成”-c“ 就是大图的地址了。不用连续动作那么麻烦。
2,你的网址加载比较慢,如果用连续动作采集的话可能是不好实现。
试试这个xptah   .//*[@id='_scroller0']/div[position()=2]/ul/li   
  最好使用第一种方法,别用连续动作。
举报 使用道具
9#
dukewang666 初级会员 发表于 2017-11-13 15:25:08 | 只看该作者
好的 我试试你那个xpath 关键是第一个图片路径格式基本相同 但是其他的都不一样了
还有个问题大神
我的那个xpath哪里有问题啊?
举报 使用道具
10#
dukewang666 初级会员 发表于 2017-11-13 15:31:28 | 只看该作者
@umsung 大神
刚刚试了下您那个xpath 貌似不行啊 一直抓取第一个
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-20 22:48