提示: 作者被禁止或删除 内容自动屏蔽
举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2017-2-8 22:20

沙发
scraper 论坛元老 发表于 2017-2-8 16:34:54 | 只看该作者
你的规则名称是什么?
举报 使用道具
板凳
378806123 禁止发言 发表于 2017-2-8 16:42:48 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
举报 使用道具
地板
Fuller 管理员 发表于 2017-2-8 16:58:56 | 只看该作者
因为每次都是第三页失败,所以可以肯定第三页的网页结构变化了,那就是说你做的规则的适应性不够高。

如果你用的是GS浏览器版本,可以同时运行两个浏览器窗口,每个都加载这个规则,然后在第二个窗口中翻页到第三页,使用菜单 规则-》刷新网页结构,在用菜单“分析页面”,就会看到报错,你对比一下这两个窗口的内容有什么不同,能发现第一个窗口中多了一块内容“广西旅行社推荐”,就影响了规则的适应性。

对于这个网页,要跳过这块影响适应性的内容很容易。在“创建规则”工作台上有个“定位”按钮,选择偏好class,生成的数据规则就会有变化,刚好能跳过这块。

如果你会用xpath,可以仔细看生成的数据规则,其中的xpath就会有变化,就知道这样选择生效的原因。
举报 使用道具
5#
Fuller 管理员 发表于 2017-2-8 17:03:29 | 只看该作者


上图,我首先选择定位偏好为“偏好class”,生成的规则可以看到定位基点变成了最下面红框标出的那个DIV,而代表“广西旅行社推荐”的那个DIV没有包含在这个基点DIV之内,所以就不会受影响

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
6#
378806123 禁止发言 发表于 2017-2-8 22:20:54 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的

热门用户

GMT+8, 2024-11-23 04:23