我的翻页采集只能到第二页！！

luoyb110

我采集的网站https://www.hitrader.com/community，翻页采集只能到第二页！！

Fuller · 发表于 2018-12-9 15:57:26

我正在测试你的规则，在爬虫路线工作台上，点击定位偏好按钮，选择偏好class比较好，翻页规则适应性更强。但是这个不是翻页到第二页失败的根本原因，我正在对比第一页和第二页有什么区别。显然是“创建规则”工作台上的数据映射不合适

Fuller · 发表于 2018-12-9 16:15:26

尽量不要使用绝对定位，规则的适应性会很低。我改成了偏好class，发现还是到第二页失败。

我是这样检查规则的：
1，规则在工作台上定义好并存规则了

2，不要勾选工具条上的内容定位，这样鼠标点击网页就能实现翻页了，翻到下一页
3，再次勾上内容定位
4，选择菜单规则-》刷新页面结构
5，选择菜单规则-》分析页面
6，我发现图表那个字段定位不到

仔细看DOM树，发现到第二页开始，那个图表节点的class变了，那么我选择了他的父节点做定位标志映射，这样就能避开这个图表节点的class的影响（定位标志的用法参看《定位标志精确采集位置》）。如下图，我不知道你要采集图表的什么内容，我用img的@src节点做了内容映射

luoyb110 · 发表于 2018-12-22 14:08:11

太细心了，谢谢指点，虽然成功完成了采集，但是糊里糊涂的，哈哈

我的翻页采集只能到第二页！！

本帖子中包含更多资源

共 3 个关于本帖的回复最后回复于 2018-12-22 14:08

本帖子中包含更多资源

推荐板块

精彩推荐

热门话题

热门用户

	B Color Image Link Quote Code Smilies 高级模式您需要登录后才可以回帖登录 \| 立即注册回帖并转播回帖后跳转到最后一页

我的翻页采集只能到第二页！！

本帖子中包含更多资源

共 3 个关于本帖的回复 最后回复于 2018-12-22 14:08

本帖子中包含更多资源

推荐板块

精彩推荐

热门话题

热门用户

共 3 个关于本帖的回复最后回复于 2018-12-22 14:08