规则名:京东0718-产品详情,请帮忙分析一下谢谢!
举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2017-7-19 14:44

沙发
shengchengx 金牌会员 发表于 2017-7-18 16:37:54 | 只看该作者
你这边首先是规则的定位标志做的有问题
然后就是这边点击动作的目标主题名,这里也有问题,应该是指向规则,xpath写的也有问题,是能选中需要点击的那些标签。
《连续动作让爬虫持续采集数据 》
《定位标志映射》
举报 使用道具
板凳
不能输一辈子 初级会员 发表于 2017-7-18 16:59:33 | 只看该作者
shengchengx 发表于 2017-7-18 16:37
你这边首先是规则的定位标志做的有问题
然后就是这边点击动作的目标主题名,这里也有问题,应该是指向规则 ...

能具体点吗?因为我就是照京东那个例子做的。


举报 使用道具
地板
shengchengx 金牌会员 发表于 2017-7-18 17:10:58 | 只看该作者
不能输一辈子 发表于 2017-7-18 16:59
能具体点吗?因为我就是照京东那个例子做的。


这边加载你做的规则做测试有这个问题呢,应该是定位标志映射有问题

如果是采集分段的话点击不应该能点击到价格呢,写的xpath只能点击到这些分段的呢

然后最后一个目标主题名应该是指向采集数据的规则中,这个你已经修改了吧


举报 使用道具
5#
不能输一辈子 初级会员 发表于 2017-7-19 11:24:53 | 只看该作者
您帮我指出的几点错误1.定位标志用的是映射内容的先辈节点我重新映射一遍未出现错误;2.段位选择的定位表达式如果是以偏好class定位的话,相同dom节点有8个但是我在高级设置里面有设置内容表达式能成功定位到需要点击的节点上。但是还是无法实现,显示抓取超时。麻烦帮忙再分析一下谢谢!
举报 使用道具
6#
shengchengx 金牌会员 发表于 2017-7-19 14:44:25 | 只看该作者
不能输一辈子 发表于 2017-7-19 11:24
您帮我指出的几点错误1.定位标志用的是映射内容的先辈节点我重新映射一遍未出现错误;2.段位选择的定位表达 ...

定位标志有问题,做测试的时候数据都抓不出来
连续动作xpath有问题,用偏好id的试试

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-26 21:14