11#
Fuller 管理员 发表于 2021-2-4 18:55:19 | 只看该作者


加载分析第二级规则可以发现,翻页区定位到了一个隐藏的翻页区,所以,翻页无效。

对比网页上两个翻页区的区别,发现他们的id不一样,那么可以选择定位偏好:只用id。如下图,分别选择翻页区和翻页标志


测试可以看到翻页正常



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
12#
13007120668 新手上路 发表于 2021-2-4 19:08:18 | 只看该作者
Fuller 发表于 2021-2-4 18:44
看这个网址,里面有个参数 token,应该是过一段时间就失效了。所以,最好用连续输入和提交搜索动作来采集 ...

也就是说我现在需要做的是 连续输入 提交搜索动作 固定id这三个步骤应该就OK了是吗?
另外由于我刚接触贵公司软件 跟着视频教程学的是老版本
您说的上面三个步骤是否有相对应的教程 我可以学习?
谢谢

举报 使用道具
13#
Fuller 管理员 发表于 2021-2-4 19:28:55 | 只看该作者
13007120668 发表于 2021-2-4 19:08
也就是说我现在需要做的是 连续输入 提交搜索动作 固定id这三个步骤应该就OK了是吗?
另外由于我刚接触贵 ...

你先把翻页问题解决了再说吧。用现在的这两级规则,修改第二级的翻页区映射、翻页标志映射和定位偏好。就能开始采集了
举报 使用道具
14#
13007120668 新手上路 发表于 2021-2-4 22:29:55 | 只看该作者
Fuller 发表于 2021-2-4 19:28
你先把翻页问题解决了再说吧。用现在的这两级规则,修改第二级的翻页区映射、翻页标志映射和定位偏好。就 ...

*成功啦!!!立正 感谢,按照您说的步骤设置完后我已经可以翻页以及把八十多页的数据采集完了
*分析了一下可能原因:
1.确实这种含token的网址应该是会过时失效,也就导致了我昨天做的规则,今天你们几位工程师都进不去这个页面,今天我又更换网址后可以进去了,估计明天又会失效

2.二级规则下只采集到三个文件其实是没有翻页成功,然后把第一页的十几行数据反复采了三次后默认结束了

3.按照您说的设置完后,可以翻页,并把我的所有数据都采集完了,万分感谢!!

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为

热门用户

GMT+8, 2025-2-7 00:36