7 12001

任务名是医美乱象一

13370714285 于 2019-12-23 10:58 发表 [复制链接]
你好,为什么我在做层级采集的时候,所有操作准备就绪,打开打数机单搜一级的时候他没有翻页就说我采集任务结束了?
举报 使用道具
| 回复

共 7 个关于本帖的回复 最后回复于 2019-12-23 15:18

Fuller 管理员 发表于 2019-12-23 11:06:47 | 显示全部楼层
定位20191223110528.png

点击定位选项按钮,选择偏好id,可以查看规则,发现生成的xpath更短了,适应性更强
举报 使用道具
13370714285 初级会员 发表于 2019-12-23 11:28:48 | 显示全部楼层
线索规则里面无东西
举报 使用道具
13370714285 初级会员 发表于 2019-12-23 11:29:51 | 显示全部楼层
按照这个步骤来同样也是没翻页就结束了
举报 使用道具
Fuller 管理员 发表于 2019-12-23 12:06:50 | 显示全部楼层
13370714285 发表于 2019-12-23 11:29
按照这个步骤来同样也是没翻页就结束了

我这边都爬了一遍了。

你原来的规则,第二次加载的话就会失败,因为选择了“偏好class”,“下一页”定位不到,要重新做翻页区映射和翻页记号映射
举报 使用道具
Fuller 管理员 发表于 2019-12-23 12:09:51 | 显示全部楼层
翻页20191223120912.png

我是这样选择翻页区和翻页记号的
举报 使用道具
13370714285 初级会员 发表于 2019-12-23 12:24:53 | 显示全部楼层
现在是二级匹配不成功了
二级只弄下来一条
举报 使用道具
Fuller 管理员 发表于 2019-12-23 15:18:35 | 显示全部楼层
13370714285 发表于 2019-12-23 12:24
现在是二级匹配不成功了
二级只弄下来一条

绝对定位的适应性太差了,只有特殊情况下才能用。我觉得这几个定位标志很好,用他们做定位标志映射应该比较合适。如果每个抓取内容都用上定位标志映射,适应性是最高的

绝对定位20191223151627.png
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 05:21