求助各路大神
翻页抓取京东数据抓取到第14也的时候出错:
等待采集任务

根据线索编号搜索的网页信息为第一页的信息。
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2018-9-13 17:54

沙发
Fuller 管理员 发表于 2018-9-13 17:54:17 | 只看该作者
出错以后,在DS打数机的日志窗口中能看到日志信息,您是从那里拿到线索编号吗?

如果用那个线索编号加载分析失败线索,一定会加载第一页。为了测试第14页,应该按照个操作顺序:1,加载失败线索,并执行后续分析。那么规则应该加载到工作台上了。如果这个过程报错,那么需要先修改规则,说明规则的适应性不够。如果没有报错,执行下面的步骤
2,不要勾选顶部工具条中部的“内容定位”选项
3,在浏览器中翻页,翻到14页,再次勾上“内容定位”
4,选择菜单 规则-》刷新页面结构 ,规则-》分析页面,看看报什么错

我估计只要给规则做上定位标志映射,就不会有问题了。

另外,DS打数机运行的时候,电商这种网页最好打开自动滚屏,DS打数机菜单 配置-》滚屏参数,把滚屏次数设置成>0的数字,比如,2
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 12:40